記事

アップルはグーグルのAI攻勢にどう対抗するのか? - 川手恭輔

 イヤホンジャックが消滅したことが、新しいiPhoneの一番の話題になってしまったが、どうも否定的な意見が多いようだ。アップルの共同創業者のスティーブ・ウォズニアックも、発表の前にオーストラリアの経済誌Australian Financial Reviewのインタビューに「もし3.5mmのイヤホンジャックがなくなったら、多くの人を怒らせることになるだろう」と答えていた。「僕はBluetoothを使うつもりはない、無線が好きじゃないんだ」とも言っている。

 そんなiPhoneのためのAirPodsというワイヤレスイヤホンを、9月13日のWIREDは「159ドル払っても、iPhoneに同梱されている(有線の)EarPodsよりも良い音を手に入れることはできない」と、バッサリ切り捨てている。しかし、その記事のタイトル「SIRI MACHINES」に表れているように、AirPodsは音楽を聴くためだけでなくSiriと対話するためのデバイスだ。耳に装着した状態で、サイドを指で2回タップするとSiriと対話できるようになる。記事は、AirPodsもSiriも未完成だが、アップルの未来の重要な一部になる可能性を持っていると結ばれている。

「常時オン」という新しい体験

 AirPodsを着けてのSiriとの対話は、映画「アイアンマン」の主人公トニー・スタークをアシストする人工知能のJ.A.R.V.I.S.(ジャービス)を思い出させる。ジャービスは、スタークが鋼鉄製のパワードスーツを装着して戦う時は的確な情報を伝え、普段はパワードスーツを開発するためのロボットを指示に従ってコントロールしたり、ちょっとユーモアのあるフレンドリーな執事の役割を果たしたりする。パワードスーツを脱いだスタークはヘッドセットを着けてジャービスと対話するが、そのヘッドセットよりAirPodsの方がはるかに小さく、そして断然クールだと思う。

 J.A.R.V.I.S.とは”Just a Rather Very Intelligent System”(単なる、かなりすごいインテリジェントなシステム)の頭文字を並べた冗談半分の名前だが、現時点のSiriは、まるで試作品のように未完成でぎこちなく、ジャービスの足元にも及ばない。しかし、いずれ追いつくだろう。重要なことは、Siriはすでに生まれていて、あとは成長するだけだということだ。

 Siriは、これまで人々がキーボードやマウスやタッチパネルを用いて行ってきたコンピューターの操作を、音声で行うためのユーザーインタフェースを提供している。1972年にクエリーキーボードが誕生してから初めて、音声による操作が人々の手と視線をコンピューターから解放する。ハンズフリーでビュー(視線)フリーのコンピューティングだ。

 前回のコラムで紹介したアマゾンのEchoやグーグルのHomeのようなデバイス(『グーグルが狙うスマホの次のプラットフォーム』)も、ハンズフリーでビューフリーのコンピューティングを可能にする。しかし、それらは主に家の中で、それぞれAlexaとAssistantという、ジャービスのようなパーソナルアシスタントと対話するためのものだ。AirPodsは、どこにいても(ロケーションフリーで)ふと思いついたことをSiriに訊ねることができる。この「常時オン」という新しい体験が、次の大きな変化を予感させる。

Siriの現在と課題

 Siriの実体はクラウドのコンピュータで稼働する音声認識と自然言語処理を行うソフトウェアだ。ユーザーの音声による指示を認識して、その内容を理解し、それをiPhoneにインストールされているアプリの中から、該当するものを探して指示の内容を伝える。「Hey, Siri. 何ができるの?」と聞くと、対応するアプリのアイコンと、どのように話しかければ良いかの例が表示される。

 Siriで指示を与えることができるアプリは、アップル製のもの以外ではFacebookとTwitterだけだったが、最新のiOS10で、SiriKitという開発者がSiriを利用するための環境が提供された。「VoIP電話」「メッセージ」「写真」「Apple Pay」「ワークアウト」「乗車券の予約」「CarPlay」「レストランの予約」という8つのカテゴリの、対応する3rdパーティーのアプリにSiriで指示すことができるようになる。

 カテゴリーごとにSiriで指示できる機能が決められていて、例えば「メッセージ」では「メッセージを送る」「メッセージを探す」「メッセージの属性を設定する」の3つの機能があり、それぞれに必要なパラメータが規定されている。それを満たすためにSiriは、例に示したような形式に従って指示することをユーザーに求める。現時点では、Siriがユーザーを理解してくれるのではなく、ユーザーがSiriを理解して使いこなす必要がある。

 Siriは(まだ)複数のアプリケーションにまたがる指示を実行することはできない。また、ひとつの質問に答えると、その質問と答えを忘れてしまうので、対話をするように次の質問を続けることもできない。「東京駅近くのレストランを探して」「15件見つかりました」「そのうちの和食は?」そう尋ねると、東京駅近くという条件を忘れてしまう。Siriが覚えておいてくれるのは、妻と娘の名前ぐらいだ。

AIファーストへシフトしたグーグル

 10月4日に開催された「Made by Google」というイベントで、グーグルは独自に開発したスマートフォンなどの6種類のハードウェアを発表した。イベントの冒頭でCEOのサンダー・ピチャイは、コンピューティングの世界では10年ごとに大きな変化が起こっていると語った。1980年代にパソコンが一般の人々に広がり始め、1990年代半ばにはWebによって世界中の人々が繋がり、そして2000年代半ばに起きたモバイル革命が人々の暮らしを大きく変化させた。その変化は今も続いていて、モバイルファーストからAIファースト(AIを起点にサービスや製品を考えること)に向かっている。発表したハードウェア群は、グーグルがAIファーストへシフトしたことを具体的に示したものだと言う。Assistantは、その戦略の中心にある。

 18年の間に獲得した膨大な情報から機械学習をすることによって、グーグルのAIは700億ものコトとそれらの関係性を理解し、自然言語処理、機械翻訳、画像認識そして音声認識の精度を飛躍的に向上させた。新しいスマートフォンPixelに組み込まれるAssistantは、これまでiPhoneにもアプリとして提供されてきたGoogle Nowの新しいバージョンのようにも見える。しかしGoogle Nowは、ユーザーを認識してユーザーのスケジュールやメールなどの情報にアクセスして質問に答えたり指示を実行したりできるが、ユーザーを理解することはできなかった。

 「グーグルのゴールは、世界の人々にインディビジュアル(一人一人の)グーグル、パーソナル(専用の)グーグルを提供することだ」と、ピチャイが言ったように、Assistantは利用を続けるうちに学習し、ユーザーを理解して自然と賢くなることを目指している。自然言語処理の精度が向上したことによって、(英語でのデモだったが)ユーザーとの対話も非常に滑らかで自然になり、Google Nowのような、いかにも機械が話しているような感じはなかった。アップルのSiriができない、シームレスに質問を積み重ねる双方向性のある対話もできる。

スマートフォンが不要になる?

 グーグルのAssistantは、家の中に置かれるHomeにも組み込まれている。スマートフォンのようにディスプレイを備えていないこともあって、PixelのAssistantとは機能が少し異なっている。質問にも音声だけで答えようと努力しているようだ。テレビに接続したChromecastや、スマートデバイスと呼ばれるAssistantに対応した家電を、音声でコントロールするハブとしての役割がHomeの特徴だろう。

 Homeの説明では、しきりにハンズフリーであることをアピールしていたが、Pixelのデモでは手に持って、ピザを食べるときのようにマイク部分に口を近づけてAssistantに話しかけていた。AirPodsのようなイヤホンにeSIM(モバイル通信)を組み込み、スマートフォンなしに(ハンズフリーで)パーソナルアシスタントと対話できるようにすることも難しくないだろう。

 人前で「Hey, Siri」や「OK, Google」などと、スマートフォンに話しかけることを恥ずかしいと思う人は多い。まだ、パーソナルアシスタントができることは少なく、音声認識の正確性や言葉の理解力も不足している。ヘッドホンをつけて歩く若者の姿が奇異の目で見られた1980年頃のウォークマンもそうであったように、パーソナルアシスタントとの対話は、今のところイノベーターやアーリーアダプターと呼ばれる人達の大好物でしかない。彼らはAssistantと対話すために、iPhoneを捨ててPixelに乗り換えるかもしれない。いろいろなサービスやモノがパーソナルアシスタントで利用できるようになり、正確性や理解度がある閾値を超えたときには、きっと多くの人々はその恥ずかしさを忘れてコンピュータと音声で対話する価値を選択することになる。

 科学技術によって人間の能力が根底から覆り変容するという、レイ・カーツワイルが描いたシンギュラリティが訪れた後の世界では、人間の脳はコンピュータと直結し、もはやインターフェースは不要になる。しかし、それまでのしばらくの間は、音声による対話が、人とコンピュータとの最良のインターフェースになる可能性は十分にある。

あわせて読みたい

「AI」の記事一覧へ

トピックス

ランキング

  1. 1

    バス旅番組巡る田舎叩きは的外れ

    川北英隆

  2. 2

    武蔵小杉にみるタワマンの問題点

    ヒロ

  3. 3

    韓国の若者「日本の給料は安い」

    WEDGE Infinity

  4. 4

    眞子さま 小室さんと出会い変化

    文春オンライン

  5. 5

    おじさんが若者と会う時のルール

    内藤忍

  6. 6

    暴行慶應生 親族企業で役員の顔

    SmartFLASH

  7. 7

    サウジ記者殺害 米IT企業が窮地?

    幻冬舎plus

  8. 8

    橋下氏 原発めぐるバトルの裏側

    AbemaTIMES

  9. 9

    世界大学ランク 数では日本が2位

    ベネッセ 教育情報サイト

  10. 10

    下ネタOK ガッキー30歳の新境地

    NEWSポストセブン

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。