記事

歴史を変える可能性を秘めたアマゾンエコー - 多賀一晃 (生活家電.com主宰)

1/2

 話題のAmazon Alexa / Echo(以下 Amazonはアマゾン、Alexaはアレクサ、Echoはエコーとカタカナ表記)が日本に正式に上陸。発表された。カテゴリーはAIスピーカー。日本でも何社かは既に発売しているが、本家はアマゾンだ。世界を席巻しつつある。何がスゴいのかレポートしたい。

最近のAI

 AIとは、artificial intelligence。日本語で人工知能、耳に馴染むようなったが、おさらいしておくと、コンピューター(計算機)に人間の脳と同じ働きをさせようと言うことだ。概念ができたのは1956年。アメリカはジョン・マッカーシー博士の「コンピューターで推論・探索することで、問題を紐解く」という提案だ。概念としてはありなのだが、これは何もないところから、問題を解決させろと言うことと同じで、人間も「大天才」にしかできない。当然、コンピューターもできないことをさせようとしたのと同じ。AI黎明期の話だ。

 普通の人間は、行動し、学び、教育により知識を得て、初めていろいろなことができるのが一般的。「コンピューターに知識を与えてしまえ!」というのが次の段階。しかし、必要十分な知識(データー)をコンピューターに与えるのは大変、というより自分の人生が、コンピューターに知識を与えるだけで終わったり、与える途中で終わったりする可能性もあると言うことで、AIには宙ぶらりんの状態が続くことになる。

 これが変わったのが2012年。カナダのトロント大学のチームが出した「マシン・ラーニング(ディープ・ラーニング)」だ。インターネット上のビッグデーターを元に、コンピューター自身が学ぶ仕組み。例えば、人には分かってもコンピューターには分からなかった、「あれやって、これやって」という曖昧な指示を、コンピューターが理解できるようになったわけだ。

 2009年の細田守監督の名作映画「サマーウォーズ」の中に、謎の人工知能「ラブマシーン」が出てくる。インターネット上のアカウントを次々自己に取り込み、ネット上では、無限の能力を持つ存在として描かれている。しかし「ラブマシーン」を開発した侘助は「ラブマシーン」を「ハッキングAIに「好奇心」をプログラムしただけ」と解説している。好奇心=自己学習。これもトロントのチームと同じだ。

 ビッグデーターを持つアマゾンがAIに手を伸ばすのは当たりまえのことだ。

何をAIに勉強させたのか?

 アマゾンは、何をAIに勉強させたのかと言うと「言語」。アマゾンはビッグデーターを使い自社のAWS(アマゾン・ウェブ・サービス)クラウドコンピューターに「言語」のマシン・ラーニングをさせたわけだ。単語、一つ一つはもちろん、組み合わせから、次のフレーズを予想し、文の意味を掴むことまで。日本語は、同音異義語が多いので難しい。省略語などは、関東が「マック」関西が「マクド」と言うように、地方でも違う。これに方言が加わると、場合によっては日本人同士でも通じないことがでてくる。それを勉強させたわけだ。

 また、文の意味を間違いなくつかむと言うことは、日本文化などの知識も持っていなければならない。例えば「お正月」が分からなければ、日本では年明けの会話が通じない。言語だけでなく文化風俗も各地域ごとに学ばせるわけだ。また会話ができないと、一方通行のコミュニケーションとなるため、話もできるようにする。しかし、電車のアナウンスのようでは、聞き取りにくいため、日本人ぽく喋ることも重要。

 アレクサの声は落ち着いた女性の声。日本でありがちなアニメ声ではなかった。落ち着いているので、どことなく有能な秘書を感じさせる。

なくてはならない声によるヒューマン・インターフェイス

 コンピューターと人間が付き合うには、ヒューマン・インターフェイス(Human Interface)が必要。ヒューマン・インターフェイスとは、人とコンピューターはどうやって情報をやり取りするのかということ。いろいろな種類がある。リモコンもそうだし、その延長線上で「スマホ」もそう。どちらかと言うと操る感じだ。

 日本では、このイメージを脱していなくて、モノ(システム)を操る場合、ディスプレイが付いたものが基本だ。

 しかし、未来はどうだろうか? 高齢化社会になった場合、若い頃のように、スマホを使えるだろうか? 答えは当然「ノー」だ。人は言葉でやり取りする。その昔、文字を知らなくて一生を終える人もいっぱいいた。その人たちは、不幸だったかというとそうではない。結婚もしたし、仕事もして、精一杯人生を生きた。

 が、しゃべれなくなったらどうだろうか?  一気に厳しくなる。その位、言葉でのコミュニケーションは人として基本中の基本のコミュニケーションでもある。人は死ぬ間際に、声は出せても、余り文字は書かない。そう書くと声、会話で、コンピューターをやり取りするのは、リモコン、スマホで動かすより、自然であることがお分かり頂けるだろうか?

 寺子屋の学習は「読み、書き、そろばん」だった。元々計算機(そろばん)のコンピューターが、「タッチパネル(スイッチ、キーボード)」「音声認識(アレクサ)」で人に近づいたと考えることもできる。

 この音声(認識)サービスが「アレクサ」だ。会話を通じて、ユーザーは情報を仕入れたり、音楽を聴いたり、家電にいろいろなことをさせることができる。

 一方、「アレクサ」は、動画プレイヤーで「Blu-ray」対応と表示されるような、「規格」のようなものでもある。この規格がデファクトとなれば、大きなビジネスになることはお分かり頂けると思う。

簡単な構造、求めやすい価格

 そのアレクサに対応したスピーカーが、アマゾン エコー シリーズだ。Echo(エコー、11,980円(税込))、Echo.Dot(エコードット、5,980円(税込))、Echo Plus(エコープラス、17,980円)の3種類がある。

 エコーを例に簡単に構造を説明したい。再生を受け持つのは、2.5インチのダウンファイアーウーファーと、専用ツイーター。それにDolby プロセッシングが加わる。360° 全方位対応型。
この手のスピーカーに音質を期待してはいけないのは、オーディオマニアの常識だが、試聴してみると、BGM以上のレベルと言える。

 そして聞き取りは、7つのマイクアレイとビームフォーミング技術とノイズキャンセレーション技術を用いている。ビームフォーミング技術とノイズキャンセレーション技術は、人が話しかけられたとき、人の声に集中することと同じだ。声の方向に集中し、他の音を無意識の内にカットする。このため、エコーは、部屋のどこから声を掛けても的確に答えてくれる。

 アマゾンエコードットは、「中継」を意識した作りで、Bluetooth、3.5mmステレオケーブルで、外部スピーカーと接続できる。その他機能はエコーと同じだが、エコーの半分しか高さがない。音の試聴はまだだが、エコーより再生音は落ちる可能性はある。

アマゾンエコードット

 アマゾンエコープラスは、エコーにホームシステムへの接続機能が内蔵されている。IFA2017では、独ミーレが、エコープラスを起点に、システムコントロールする術をデモしていたし、韓LGでも、エコープラスへは対応するとしていた。自社で音声認識システムを作るのは、巨額な投資が必要なため、音声システムを自社開発できないメーカーは、デファクトになりそうな機種をケアする必要がある。

 なお、会場のデモは、フィリップス社のスマートライト「Hue」のZigBee(家電向けの短距離通信技術のひとつ)対応製品で行われた。このエコーシリーズ、価格もリーズナブルであり、ヒットしない理由がない。

あわせて読みたい

「Amazon」の記事一覧へ

トピックス

ランキング

  1. 1

    「安倍晋三記念小学校」嘘と判明

    和田政宗

  2. 2

    希望維新の合流進めたい安倍首相

    NEWSポストセブン

  3. 3

    籠池氏の嘘 拡散した朝日は無視?

    和田政宗

  4. 4

    内田樹氏の安倍政権分析に納得

    マガジン9

  5. 5

    よしのり氏「罠にはまった文春」

    小林よしのり

  6. 6

    よしのり氏 山尾氏の改憲案見よ

    小林よしのり

  7. 7

    日本が核禁止条約に署名しない訳

    河野太郎

  8. 8

    強姦が日常 元北朝鮮女性兵語る

    BBCニュース

  9. 9

    名古屋は地元離れぬ下層民の楽園

    SeaSkyWind

  10. 10

    詩織さん事件 超党派議連が追及

    田中龍作

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。