記事

口述筆記にかけたい「もう一声」

というのであれば紹介すべきは、今ならむしろDragon Dictationの方だよねJK

もうiPhoneのソフトウェアキーボード使わなくていいんだ(涙) 85円の音声入力appが凄いの件 | More Access,More Fun!
このアプリ。使い方はとても簡単で、音声を認識しテキストにしてくれる。ここで「クラウド」というのがミソで、いままでのデバイスは本体のCPUで変換するものだったから使えなかったが、こちらはクラウド。つまりサーバに送ってそこで変換しているのだ。Siriと同じ理屈です

なんといっても無料だし、Siriと母体が同じだそうだし。

ASCII.jp:iPhone 4Sで話題の「Siri」、その機能を読み解く|Apple Geeks
具体的な言及はなかったが、Siriの音声認識エンジンはNuance Communications(ニュアンス コミュニケーションズ)のものであると推定される。その理由は、これまで「Siri Assistant」として米国のApp Storeで公開されていたiOSアプリ(10月7日時点ではダウンロードできない)には、Nuanceの技術がバックエンドに採用されていたからだ。
画像を見る

認識率は、文句なしのレベル。

それも、単に認識率が高いというのだけではなく、口述筆記のことまで考慮に入れている点がすごい。たとえば左の文章は、「こがいだんもてんきしだんもてんきちんとにんしきしますまる」と口述したときの結果。

とはいえ苦手なものもあって、それがアルファベットが混じった固有名詞。


画像を見る
右の例では"iOS five"、"iPhone four-es"と英語読みしたときの例。ただしエンジン側で知っているものはきちんと認識するみたいで、"dragon dictation"と英語読みしても「ドラゴンディクテーション」とカタカナ読みしても"Dragon Dictation"と入力された。なお、見てのとおり iPhone 4S を使っている場合はOSネイティブの英語ディクテーションもキーボード経由でアクセスできる。

すでに認識率に関して言えば、クラウド処理のおかげで口述筆記は充分使えるレベルにある。本blogで「しゃべったー」を紹介したのはもう2009年のことだ。

それでも私が口述筆記を日常的に使っていないのは、ひとえにUI。

口述だけで完結できることがらであれば、Dragon Dictation でも充分いけるのだが、実際にはURLや写真貼付など、口述筆記しがたいものがどうしてもあり、そのためだけにアプリを切り替えるのは結構おっくうなのだ。やはり iPhone 4Sの英語キーボードの口述筆記ボタンのように、Input Method の一環として提供されるのが望ましい。Siriの日本語化を待たずに口述筆記ボタンだけでも日本語キーボードにつけて欲しいのだが。

あとAndroidは3rd PartyのIMが使えるのだから、そこに口述筆記機能をつければiOSとの差別化の一助となるはずなのだが。

Dan the (Barely) Dictatable

トピックス

  1. 一覧を見る

ランキング

  1. 1

    BLOGOSサービス終了のお知らせ

    BLOGOS編集部

    03月31日 16:00

  2. 2

    なぜ日本からは韓国の姿が理解しにくいのか 識者が語る日韓関係の行方

    島村優

    03月31日 15:41

  3. 3

    「いまの正義」だけが語られるネット社会とウェブ言論の未来

    御田寺圭

    03月31日 10:09

  4. 4

    カーオーディオの文化史 〜ドライブミュージックを支えた、技術の結晶たち〜

    速水健朗

    03月30日 16:30

  5. 5

    BLOGOS執筆を通じて垣間見たリーマンショック後10年の企業経営

    大関暁夫

    03月31日 08:27

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。