iFlytek: Голос Искусственного Интеллекта
Как будет выглядеть искусственный интеллект (AI) в будущем? Пока нет четкого ответа. ИИ в последние несколько лет находилась на ясной восходящей траектории. По словам Ху Юй, Исполнительного президента и Consumer президента BG iFlytek, ИИ начинает приближаться к человеческому интеллекту. Компания iFlytek, обслуживающая сотни миллионов пользователей с ее передовыми технологиями, стала пионером в индустрии распознавания голоса в Китае и теперь превратилась в глобального лидера в области ИИ. Но все началось с небольшого поворота судьбы ...
От интеллектуального голоса до супермозга
Основная цель iFlytek, основанная в 1999 году, заключалась в том, чтобы заставить машины говорить, что даже сегодня отражается в миссии компании: «Мы хотим, чтобы мир услышал наш голос». И это начинает происходить - компания сейчас находится на первых рядах ИИ.
Господин Ху вспоминает: «Мы сами не понимали тогда, что работали над ИИ. По крайней мере, мы не были уверены в том, что такое ИИ. Мы также не знали, что 1999 год был неудачным для ИИ, поскольку вторая волна инноваций ИИ только что достигла своего пика… Если бы мы знали, что ИИ будет таким сложным делом, мы, возможно, никогда не запустили компанию. Думаю, это было просто судьба».
Примерно в 2004 году ИИ не был той горячей технологией, который существует сегодня, говорит Ху, но его команда осознала, что имеет ключевые разработки ИИ. «Самое большое различие между человеческим интеллектом и интеллектом животных или машин - это познавательный интеллект. Это происходит от нашего владения языком и того, как мы выражаем знания, что позволяет нам осуществлять логические рассуждения и сложные процессы принятия решений», - говорит он. По мнению Ху, когнитивная революция вокруг голоса и языка является пиком человеческого интеллекта и самой большой проблемой для ИИ на сегодня.
Ху является лидером проекта iFlytek Super Brain Project, который был запущен в 2014 году: «Это гораздо больше, чем просто причудливое имя. Мы объявили о нашем определении ИИ как вычислительном интеллекте». Он утверждает, что машины были гораздо более мощными, чем люди, с тех пор, как они были изобретены. В качестве примера вычислительного интеллекта ссылаясь на ИИ, которые играют в настольные игры. «Сегодня есть некоторые впечатляющие человекоподобные и похожие на животных машины, - говорит он, - однако причина, по которой мы находимся на вершине пищевой цепи планеты, - это язык или «познавательный разум». Согласно Ху, одна из целей проект Super Brain Project должен развивать машины с уровня восприятия до умения слышать, говорить, видеть,
В настоящее время Super Brain использует большие данные для обучения и оптимизации своих алгоритмов. Они не обучаются только перебиранием всех видов данных в системе. На данный момент система активно обрабатывает данные из взаимодействий в реальных сценариях и использует эти данные для обновления себя самой. Ху считает, что этот стиль самосовершенствования подобен эффекту пульсации, когда объем данных растет экспоненциально, поскольку продукт охватывает всё большего количества людей, что позволяет его команде быстрее создавать интерации и оптимизировать продукт.
Награды iFlytek
iFlytek может похвастаться ведущими технологиями в таких областях, как синтез речи, распознавание голоса, оценка голоса и перевод. С 2005 года по настоящее время компания добилась 13 последовательных побед на Blizzard Challenge, ведущем в мире конкурсе синтеза речи. Он также выиграл различные чемпионаты по машинным переводам, включая IWSLT 2014 и NIST 2015. За последние шесть лет точность распознавания голоса iFlytek улучшилась с 60,2% до более 98%. Сильные стороны компании в голосовых технологиях стали естественным мостом в мир ИИ и его промышленных приложений.
iFlytek также исследует динамику ИИ и неврологии. Благодаря компьютерам, основанным на человеческом мозге, iFlytek пытается разгадать тайну нашего интеллекта. Если они преуспеют, это может помочь проложить путь к искусственному общему интеллекту, что означает уровень интеллекта человека, один из святых граалей ИИ.
Перевод на лету
iFlytek начал применять AI в реальном мире в форме обработки естественного языка (NLP) еще в 2010 году, когда он разработал первый продукт для голосового ввода в Китае и второй в своем роде в мире после Google. Система iFlytek имеет точность более 98% и поддерживает 22 разных китайских диалекта.
В 2016 году iFlytek выпустил свое первое смарт-устройство - iFlytek Translator, которое в апреле 2018 года было реализовано с обновлением 2.0. Предлагая интерпретацию в режиме реального времени между мандариновым и 33 другими языками и китайскими диалектами, он также переводит текст на фотографиях и может использоваться в сетях 4G или Wi-Fi или в автономном режиме. Большинство его пользователей – 86% используют его в отпуске. Переводчик 2.0 также освоил акценты четырех основных диалектов в сложной и объемной лингвистической сети Китая: кантонском, сычуаньском, северо-восточном Мандарине и Хэнань. Продукт может распознавать разные ситуации и адаптироваться к языковым тикам своих пользователей.
«Есть люди, которые говорят, что нет необходимости создавать устройство для перевода, потому что функция перевода может быть интегрирована в смартфон, но мы приняли намеренное решение продать нашего переводчика в качестве аппаратного устройства», - говорит Ху. Во-первых, объясняет он, мы склонны удерживать наши телефоны близко к нашим лицам, что не всегда возможно в зависимости от сценария. Во-вторых, на телефоны влияет окружающий шум. В-третьих, Ху считает, что интеллектуальное оборудование должно быть простым в использовании. Лучший опыт - это то, что работает с одним кликом, но использование приложения на смартфоне не всегда легко или интуитивно. В-четвертых, процесс перевода должен обеспечивать естественное и интуитивно понятное взаимодействие – близкое приближение вашего смартфона к чьему-то лицу не всегда является социально приемлемым.
В 2012 году iFlytek запустила платформу голосовых облаков в рамках своих усилий по созданию экосистемы для индустрии ИИ. С тех пор более 860 000 разработчиков работали на платформе, которая соединяет 1,9 миллиарда устройств и обеспечивает почти 4,6 миллиарда интерактивных сервисов каждый день.
В 2015 году iFlytek запустила интерфейс AIUI для взаимодействия между человеком и машиной, достигнув рубежа в отрасли ИИ. AIUI пересмотрел стандарты взаимодействия человека и машины. Ху добавляет: «В 2017 году iFlytek была объявлена одной из первых открытых инновационных платформ в Китае, и наша платформа будет сосредоточена на интеллектуальных голосовых технологиях. Правительство четко осознает важность экосистемы, построенной на ИИ нашей компании».
Промышленный помощник
iFlytek также применяет интеллектуальные технологии голоса и ИИ для различных секторов, включая судебную систему и образование.
В системе правосудия iFlytek работает с Верховным народным судом Китая и Верховной народной прокуратурой (прокурорами). В 2016 году тест в провинции Аньхой показал, что система ИИ может идентифицировать телефонное мошенничество с очень высоким уровнем точности. Более того, экспериментальное исследование показало, что испытания были на 30 процентов короче, когда интеллектуальное распознавание голоса использовалось вместо человека.
В образовании ИИ превзошел все ожидания в зачете по тестированию. В тесте в провинции Цзянсу два разных ИИ прошли серию вступительных испытаний в колледж. В вопросах эссе на китайском, два ИИ отличились в среднем менее чем в 7 баллов за тест. Они соответствовали 92,82%-ам, это более чем на 5% выше, чем средняя средний показатель двух учителей. Испытание в провинции Хунань показало аналогичные результаты.
iFlytek в настоящее время работает с Национальным агентством по изучению образования в Китае, чтобы создать лабораторию искусственного интеллекта для совместной разработки более совершенных технологий для образования.
Партнерство, охватывающее несколько рынков
iFlytek и Huawei создали стратегическое партнерство для разработки практических приложений для голосовой и AI-технологии в области телекоммуникаций и интеллектуальных устройств, основанных на почти десятилетнем сотрудничестве: в 2010 году две компании развернули первую в мире открытую облачную платформу для распознования китайской речи.
В мае 2018 года Huawei и iFlytek подписали стратегическое соглашение, охватывающее четыре области: государственные облачные сервисы, инфраструктуру ИКТ, интеллектуальные устройства и офисные IT-системы. Huawei также интегрировала технологию AI iFlytek в свои смартфоны, чтобы получить преимущество над конкурентами. Huawei и iFlytek работают над интеллектуальными устройствами и облачными сервисами на основе технологий, включая распознавание голоса, синтез речи iFlyrec и iFlytek.
На корпоративном пространстве Huawei использует технологии и продукты iFlytek в своей инфраструктуре и своих офисных приложениях. Речевой механизм iFlytek станет ключевым компонентом облачной платформы Huawei Enterprise Intelligence. Ху считает, что в эпоху + Intelligence все приложения AI будут работать в облаке. Поскольку облачные вычисления потребляют много ресурсов, компьютерные вычисления и периферийные вычисления будут лучше поддерживать ИИ.
Каждый, у кого есть свои сильные стороны и экосистемы, мы уверены, что Huawei и iFlytek помогут построить сильную экосистему ИИ и сделать ИИ ценным достоянием жизни, бизнесу и обществу.