記事

AIがiPhoneのエコシステムを揺るがす - 川手恭輔 (コンセプトデザイン・サイエンティスト)

 10月4日に開催されたグーグルのイベントの冒頭で、サンダー・ピチャイCEOは、グーグルはモバイルファーストからAIファーストにシフトすると宣言した。いうまでもなく、これまでのモバイルファーストの時代のプラットフォームは、グーグルのAndroidとアップルのiOSだ。その上にサードパーティが様々なアプリやサービスを開発し、それを利用するためのスマートフォンが進化するというエコシステムが生まれた。

 AIファーストとは「AIを起点に全てのサービスや製品を考える」ということだが、モバイルを無視するということではない。スマートフォンの市場が成熟してハードウェア自体はコモディティ化してしまったが、スマートフォンが行き渡った世界で、グーグルはAIによって次の大きな変化を起こそうとしている。

 そのひとつがソフトウェアエージェント(代理人)だ。 ソフトウェアエージェントは、パーソナルアシスタントあるいはチャットボット(おしゃべりするロボット)などと呼ばれることもあり、人と人の対話のように、音声やテキストで人と自然に対話することを目指している。

ソフトウェアエージェントとは?

 ソフトウェアエージェントというコンセプトは新しいものではない。スティーブ・ジョブズがアップルのCEOとして招聘したジョン・スカリーが、1987年に自著『Odyssey』の中でコンピュータの未来像として、人と音声で対話するナレッジナビゲータというものを描いている。ジョブズが去った後、アップルはPDAの開発を本格的に開始したが、その延長線上にナレッジナビゲータのコンセプトがあったようだ。PDA(パーソナル・デジタル・アシスタント)という言葉もスカリーが造った。

 秘書に「今度の金曜にレストランを予約しておいて」と指示したり、友人に「どこか紅葉の綺麗なところ知ってる?」と質問したりするようにソフトウェアエージェントに話しかける。ソフトウェアエージェントは、不足している情報を聞き返したり、過去の情報からの推測によって補ったりして指示を実行し質問の答えを返す。

例えばレストランを予約するときには、レストランを検索し、選んだレストランに電話やホームページから予約をするだろう。そして同行する友人にメッセージを送ったり、自分の予定表に記入したりする。このような一連の流れをアクティビティ(活動)、それぞれの作業をタスクと呼ぶ。音声で対話するソフトウェアエージェントが、タスクを処理するプロセスは次のようなものだ。

  1.  音声認識:音声による質問や指示を言語(テキスト)にする
  2.  自然言語処理:言語の意味(何をすべきか)を理解する
  3.  必要な処理を行う
  4.  自然言語処理:応答すべきことをテキストにする
  5.  テキスト読み上げ:テキストを音声にして応答を返す

 すでにアップルにはSiriがあり、アマゾンにはEchoという家の居間などに置くデバイスで人と対話するソフトウェアエージェントAlexaがある。グーグルは新しいソフトウェアエージェントGoogle Assistantを発表した。グーグルが開発したスマートフォンPixelや、Echoに似たGoogle Homeというデバイスを使って、Google Assistantと対話することができる。

 これまでに収集した膨大な情報を機械学習することによって、グーグルはGoogle Assistantの「音声認識」と「自然言語処理」の精度を飛躍的に向上させたという。そして傘下のディープマインドが開発したWaveNetという「テキスト読み上げ」のソフトウェアが、(米国英語に関して)これまでのものよりも格段に自然になり人間の話し方に大きく近づいたと説明した。ディープマインドが開発した囲碁ソフトが世界最高の棋士に勝利したことで話題になったが、WaveNetはディープラーニングという同様のAI技術で開発された。

 ソフトウェアエージェントは、検索の結果や知識ベースから質問の答えを探したり、自社あるいはサードパーティのアプリやサービスと連携して指示を実行することによって「必要な処理」を行う。「音声認識」「自然言語処理」「テキスト読み上げ」も重要だが、サードパーティのアプリやサービスとの連携によって、魅力的なサービスをどれだけ提供できるかが、ソフトウェアエージェントの成否を左右する。すでにアップルとアマゾンは、自社のソフトウェアエージェントと連携するための開発者向けの環境をサードパーティに公開しており、グーグルも12月から提供を始めるとアナウンスしている。

AI (人工知能)x IA(知能増幅)

 現在のパソコンやスマートフォンの操作は、画面に表示されるメニューやボタンなどで構成されるGUI(グラフィカル・ユーザー・インターフェース)を、ユーザーがマウスやタッチパネルを使って操作する「直接操作」が主流になっている。

 ソフトウェアエージェントと「直接操作」の関係は、コンピュータの黎明期からシリコンバレーで対立してきたAI(人工知能)とHCI(ヒューマン・コンピュータ・インタラクション)の2つのグループの関係を象徴している。 AIのグループはコンピュータを人間の知能を置き換えるものに進化させようとするのに対し、HCIのグループは人間の能力を補完し知的活動を支援するもの(IA: Intelligence Amplification=知能増幅、またはIntelligence Augmentation=知能強化)であるべきと主張している。

 1990年代にアップルのMacintoshやマイクロソフトのWindowsが登場して以降、HCIのグループが提唱する「人間中心デザイン」と呼ばれる考え方の成果物としての「直接操作」が、コンピュータの操作の支配的なスタイルとなってきた。しかし、パソコンやスマートフォンで利用できるアプリやサービスは年々増加し、それらのGUIのデザインや操作方法は、流行や、デザイナーのスキルや考え方によって多様化し、タッチパネルでできる操作も増えて複雑化している。

 アクティビティを実行するためには、タスクごとにアプリを起動したり、ブラウザでWebサイトにアクセスしたりすることが必要で、ユーザーはアプリやWebサイトごとの操作を理解して使いこなさなければならない。「直接操作」は個々のタスクのユーザー体験(サービスを利用する過程でユーザーが感じる体験)を局所的に快適にすることはできるが、複数のアプリやWebサイトを跨ったアクティビティのユーザー体験をより良いものにするには別の取り組みが必要になる。

 ソフトウェアエージェントは自己完結的であり、サードパーティのアプリやWebサイトごとのユーザーインターフェースをユーザーから完全に隠蔽することによって、アクティビティのユーザー体験をシームレスで快適なものにすることができる。そして、利用を続けるうちにソフトウェアエージェントはユーザーを理解し、自然と賢くなる。これは、これまでの事前設計によるソフトウェアでは不可能だったことだ。

 レストランを予約するなどのアクティビティを、音声で対話するだけで完了させることができるソフトウェアエージェントの新しいユーザー体験が、「直接操作」に取って代わる可能性は大きい。人前でコンピュータに話しかけるのが憚られる時には、Facebook MessengerやグーグルのAlloのようなメッセンジャーアプリで、テキストでソフトウェアエージェントと対話すればよい。

 米国のデザインコンサルティング会社IDEOの共同創業者デビッド・ケリーは、かつて「十分な試行錯誤は、完璧な知性を上回る」と言った。「人間中心デザイン」を実践するIDEOは、製品のアイデアをすぐにプロトタイプにして、それをユーザーに実際に使ってもらい、そこから学習することによって改良を繰り返すことを信条にしている。しかし、知性(AI)も学習して進化するようになった。その学習は量と質とスピードで、人間(デザイナー)の学習を遥かに上回るだろう。

 クリエイター人材を育成するデジタルハリウッド大学の杉山知之学長は「これまで対立関係にあったAIとIAの境界が、技術革新によって曖昧になった。今後は、AIとIAとを掛け算するような企業活動が必要になる」という。

AIファーストが及ぼす影響

 「今度の金曜にレストランを予約しておいて」と頼んだ場合、誰がレストランを選択するのだろうか。ソフトウェアエージェントが選んだ候補の中からユーザーが指定するかもしれない。いくつかの条件を伝えたあと、ソフトウェアエージェントに任せてしまうかもしれない。ソフトウェアエージェントの「私の選んだレストランはいかがでしたか」という問いに答えれば、それを学習してユーザーへの理解を深めていく。おかしなレストランを選択したりして、広告主など、他の誰かの手先だと疑われたりしたら、ユーザーの信用を失って使われなくなってしまうだろう。

 レストランだけでなく予約サイトなども、どうやってソフトウェアエージェントに選んでもらうかの勝負になる。アプリやサービスを提供するサードパーティは、検索エンジンへの最適化(SEO)ではなく、ソフトウェアエージェントへの最適化(SAO)の戦略を考えなければならない。アプリやWebサイトのデザインやGUIは、あまり重要なものではなくなってしまうかもしれない。

 スマートフォンやEchoやGoogle Homeなどのハードウェアだけでなく、ソフトウェアエージェントと対話するための新しいデバイスや仕組みが登場するだろう。ユーザーは自分の車や家電などに組み込まれた、それぞれのチャットボットと対話することになるのだろうか。あるいは、ひとつ(ひとり?)のソフトウェアエージェントに任せて、そのソフトウェアエージェントが車や家電を操作するのだろうか。グーグルが後者を目論んでいることは間違いないだろう。

 グーグルのPixelとGoogle Homeの日本発売は未定だが、AlloでGoogle Assistantと英語のテキストで対話することができる。実際に試してみると(出来の悪い)Siriとの差は、まだあまり感じられない。しかし、スタンフォード大学やシンギュラリティ大学で教鞭をとる未来学者ポール・サフォー教授は「世の中を大きく変えるようなことも、臨界点に達するまではゆっくりと変化し、多くの人はその変化に気がつかない」という。ソフトウェアエージェントが臨界点に到達するのに、さほどの時間はかからないだろう。

 次回は、来日したポール・サフォー教授へのインタビューを紹介しようと思う。

あわせて読みたい

「人工知能」の記事一覧へ

トピックス

ランキング

  1. 1

    足立議員の生コン疑惑発言はデマ

    辻元清美

  2. 2

    「立派な国」ランキング 日本は

    長田雅子

  3. 3

    よしのり氏が文春デスク写真公開

    小林よしのり

  4. 4

    1億円稼ぐチャットレディに密着

    AbemaTIMES

  5. 5

    よしのり氏「文春に完全勝利」

    小林よしのり

  6. 6

    金正恩氏 ちびデブ発言に怒りか

    高英起

  7. 7

    山尾氏×望月記者 女の政治を語る

    NEWSポストセブン

  8. 8

    よしのり氏「文春から抗議文書」

    小林よしのり

  9. 9

    石破氏「民進解消で政治が前進」

    石破茂

  10. 10

    民進から資金? 無所属の会に疑問

    早川忠孝

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。