世の中には、半分だけ発明されたものがある。これを「半発明」と呼ぼう。半発明を発明に変えるには、たいてい大きな飛躍が必要だ。発見をどう活かすかを見極めるには、ビジョナリーだけが持っているビジョンが必要なこともある。(ナシーム・ニコラス・タレブ)発見された革新的な技術で出来ることをそのまま形にしたもの、例えばAIスピーカーが「半発明」の代表だろう。それには、想像力が決定的に欠けている。ビジョナリーがいなくなったアップルは、ライバルに何周回か遅れてHomePodを発売した。
AIスピーカーが「半発明」なのは、「解決すべき問題」が明確になっていないからだ。AIスピーカーという答えが先にあって、それから「音楽を聴く」とか「タイマーをセットする」とか「電灯を点ける」とかの問題が後付けされている。
「発見」を活かすには、「解決すべき問題」を見つけなければならない。誰も気づいていない、しかし実は誰もが解決して欲しいと無意識のうちに思っている大きな問題を解決する手段が現れたとき、それは「発明」と呼ばれる。
「発見」と「発明」の間には大きなギャップがある。そのギャップは、タレブの言うビジョンであり、AIスピーカーという「半発明」に欠けている「解決すべき問題」だ。ビジョナリーは答えではなく、誰もが気づいていない「解決すべき問題」を見つける。そして、その問題が解決されたときに人々が感じるであろう、まったく新しい体験を想像することができる。それがビジョンだ。
AIスピーカーは、人間の言葉(音声)を、そのままクラウド上の音声アシスタントに送る。音声アシスタントは、アマゾンではAlexa、グーグルではGoogle Assintant、そしてアップルではSiriと呼ばれている。機械学習、特にディープラーニングの技術革新が進み、音声認識と自然言語処理によって人間が話す言葉を解析する精度が飛躍的に向上している。
音声アシスタントは、音声認識によって人間の音声をテキストに変換する。そして自然言語処理で、そのテキストの意図を解析して最適な応答を選択する。意図と応答との対応は力づくでプログラミングされており、いろいろな表現のテキストがどの意図にもっとも近いかを推論する。当然ながら、応答が用意されていない指示や質問に応えることはできない。適当なジョークで誤魔化すか、「解りません」という(デフォルトの)応答をするようにプログラムされている。ユーモアは、プログラムする人間のセンスに依存していると思うと少し興醒めする。
AIスピーカーと音声アシスタントのコンビは、「解決すべき問題」が明確になっていないので、あらゆる指示や質問に応えようとしている。だから、取るに足らない問題しか解決することができない。すべての応答を用意することは不可能だ。
すでに「機械学習による音声認識と自然言語処理」は「発見」されている。「解決すべき問題」を見つけて、それを解決する「発明」に活かすチャンスは、まだ誰にでも残されている。