このサイトはCookieを使用しています。 サイトを閲覧し続けることで、Cookieの使用に同意したものとみなされます。 プライバシーポリシーを読む>

iFlytekが目指す 言語を理解し、考えるAI

2018.10.12

未来のAIはどんなものになるだろうか? その答えはまだわからないが、AIがここ数年で大きく進化してきたことは確かだ。iFlytek(アイフライテック、科大訊飛)エグゼクティブプレジデント兼コンシューマー事業部プレジデントの胡郁(フー・ユー)氏は、AIが人間の知能に近づき始めていると感じている。中国における音声認識分野のパイオニアとして成長してきた同社は、いまやAIの世界的なリーダーとなり、その技術は数億人ものユーザーに利用されている。同社の考える「知能」と最新のAIアプリケーション、ファーウェイとの協業について話を聞いた。

『WinWin』(ファーウェイ刊)編集部 リンダ・シュー、薛樺(シュエ・ファ)

iFlytek(科大訊飛)

1999年、現在会長を務める劉慶峰(リュウ・チンフォン)を中心とした中国科学技術大学の学生チームが在学中に中国安徽省で設立。2008年、学生起業による企業として中国で初めて上場を果たす。音声認識、音声合成、自然言語処理などの分野における革新的な技術で急成長し、『MITテクノロジーレビュー』の「スマート・カンパニー50」2017年度版ではアマゾンやアルファベット(グーグル)などに続いて6位にランクインするなど、グローバルに注目を集めている。


しゃべる機械を作る

1999年に設立した当初のiFlytekの目標は、しゃべる機械を作ることだった。これは現在も「世界に我々の声を聞いてもらいたい」という同社のミッションに表れている。AIの最先端をリードするようになったいま、そのミッションは達成されようとしている。

胡氏は創業当時のことを笑顔でこう振り返る。「その頃は、AIを手がけるなんて思ってもみませんでした。AIがどんなものなのかさえよくわかっていなかった。当時は気づいていませんでしたが、1999年は2度目の『AIの冬』と呼ばれる停滞期を経て、AIの開発が難しい時期でした。AIがこんなに大変なビジネスだと知っていたら、起業していなかったでしょうね(笑)」

AIがいまほど注目を集めていなかった2004年頃、胡氏のチームは自分たちがAIにとって欠かせない重要な要素技術を手にしていることに気づいた。「人間の知能と動物や機械の知能との最大の違いは認知能力です。人間は言語を使いこなし、知識を表現することができるからこそ、論理的な思考や複雑な意思決定ができます。人間の知能の向上に最も貢献したのは言語と音声の認知の進化であり、現在のAIにとってこれが最大の課題なのです」

計算する知能から
理解し、考える知能へ

胡氏は、2014年に開始した同社の「Super Brainプロジェクト」のリーダーを務めている。このプロジェクトでは、AIを「計算的知能」として定義づける。

「機械というのは最初に発明された時から人間よりもパワフルにできています。囲碁をプレーするAIは、強力な計算的知能の一例です。また、ヒューマノイドは感覚的知能と運動的知能を備えており、外界を見たり、聞いたり、感じたりすることができます。実際のところ、最近のヒューマノイドや動物型ロボットの中にはかなり高度なものも出てきています。しかし、人間が地球に君臨できているのは、言語能力、すなわち『認知的知能』のおかげです。Super Brainプロジェクトの目標は、機械の知能を計算的知能や感覚的・運動的知能から、理解したり考えたりできる認知的知能へと進化させることです」

同プロジェクトは現在、ビッグデータによる学習とアルゴリズムの最適化を進めている。学習においては単にあらゆるタイプのデータをシステムに詰め込むのではなく、現実世界のシナリオにおけるやりとりからシステムが能動的にデータを抽出して処理し、自らを更新する。このような自己拡張型システムでは、より多くの人々に製品が使われることで大量のデータが得られるようになり、製品の複製や最適化をさらに加速できるという正の循環が期待できると胡氏は考えている。

98%の精度で音声を認識
33か国語にリアルタイム翻訳

iFlytekは音声の合成、認識、推定、翻訳といった分野で業界をリードしている。音声合成における世界有数のコンテスト『Blizzard Challenge』で2005年から13年連続優勝しているほか、IWSLT(International Workshop on Spoken Language Translation)や米国立標準技術研究所などが開催する機械翻訳のコンテストでも複数回チャンピオンとなっている。同社の音声認識の精度はここ6年間で60.2%から98%まで向上した。こうした音声技術での強みを武器に、AIとそのアプリケーションへと乗り出すのは自然な流れだ。

同社は2010年、中国で初めて、世界でもグーグルに次いで2番目に音声入力装置を開発し、自然言語処理という形でのAIアプリケーションを手がけ始めた。同製品は中国語の音声認識では98%の精度を誇り、22の方言に対応している。

2016年には最初のスマートデバイスとして自動翻訳デバイス『Easy Trans』を発表、2018年4月にはその第2世代を発売した。中国語の標準語と33の外国語をリアルタイムで翻訳できるうえ、写真に撮った文字の翻訳も可能で、4GやWi-Fiネットワークに接続した状態でもオフラインでも利用できる。第2世代では広東語や四川、東北、河南の方言にも対応し、今後さらに拡張していくという。翻訳にあたっては、シチュエーションやユーザーの口癖まで認識し、文脈に合った翻訳結果を出してくれる。

「スマートフォンに翻訳機能が組み込まれているのだから、専用の翻訳デバイスは不要だと言う人もいます。しかし、当社はあえて専用デバイスとして販売することを選びました」

その理由を胡氏はこう説明する。スマートフォンを使う場合は本体に顔を近づけて発声する必要があるが、状況によっては相手に近づけなかったり、本体を相手の顔に突きつけるのが失礼にあたったりと、難しい場合がある。かといって、顔を離して使えば、周囲の雑音まで拾ってしまう。また、インテリジェントなハードウェアは使いやすいものでなければならず、ボタンを1回押すだけの簡単な操作が理想だが、スマートフォンにはアプリの起動、画面上での操作などのアクションがある。翻訳のやりとりに要する動作をより自然で直感的なものにする配慮も重要だ。

2015年にiFlytekが発表した人と機械のインタラクションインターフェース『AIUI』は、AI業界のマイルストーンとなる画期的な製品だ。同社はまた、AIと神経科学の学際研究にも取り組んでいる。人間の脳の働きをベースとした計算を通じて、知能の謎を解こうとしているのだ。この取り組みが成功すれば、人間の知能と同等の汎用AIへの道が開かれることになる。

「2017年、当社は中国政府から次世代AIのためのオープンイノベーションプラットフォームを提供する4社の1つに選ばれました。これにより、インテリジェントな音声技術にフォーカスしたプラットフォームを構築していきます。当社のAIエコシステムが高く評価された成果です」

詐欺電話の特定や入試の採点もAIで

さらに同社は、音声やAIの技術を防犯や司法、教育といった分野にも応用しようとしている。司法分野では中国の最高人民検察院・最高人民法院と協業。2016年に安徽省で実施したテストでは、AIシステムによって詐欺電話を高い精度で特定できることを示した。また、裁判所における審問(ヒアリング)では、インテリジェント音声認識を用いると人間の書記による聞き取りよりも審問の時間を30%短縮できることがわかった。

教育分野では、AIはテストの採点で期待を上回る成果を上げている。江蘇省では2つの異なるAIに大学入試の答案を採点させるテストを実施したところ、中国語の作文の課題における2つのAI間の採点値の差異は平均7点以下で、一致度は92.82%と、人間の教員2名が採点する際の一致度よりも5%高い結果となった。同社は現在、中国教育部考試中心(テストセンター)と共同で教育向けのAI技術開発に取り組むAIラボを構築している。

ファーウェイとの協業でAIエコシステムのさらなる発展を

ファーウェイもまた、通信インフラとスマートデバイスの領域における音声認識とAIの活用に向けてiFlytekと戦略的パートナーシップを締結している。これは、2010年に2社が世界初の中国語音声認識向けオープンクラウドプラットフォームを構築して以来、10年近くにわたり協業してきた実績を踏まえたものだ。

2018年5月には、両社は新たにパブリッククラウドサービス、ICTインフラ、スマートデバイス、オフィス向けITシステムの4分野に特化した戦略提携を結んだ。iFlytekのAI技術はファーウェイのスマートフォンにも採用されているほか、音声認識、音声合成、リアルタイムの文字起こし、翻訳などさまざまな技術を活用したスマートデバイスとデバイスクラウドサービスも共同で開発している。また、ファーウェイ社内のITインフラとオフィス向けアプリケーションにiFlytekの技術が導入されている。さらに、昨年発表したEI(Enterprise Intelligence:企業向けインテリジェンス)クラウドプラットフォームでも同社のスピーチエンジンが重要な役割を果たしている。

「+(プラス)インテリジェンスの時代には、あらゆるAIアプリケーションはクラウド上で稼働することになるでしょう。クラウドコンピューティングは膨大な計算リソースを必要とするため、デバイスやエッジでのコンピューティングでAIをサポートしていくことも求められるようになります」と胡氏は述べる。

両社は双方の強みを活かし、強固なAIエコシステムを築いて産業を発展させるとともに、AIを人々の生活やビジネス、社会になくてはならない貴重な要素にしていくために、今後も協業を深めていく計画だ。