- 2019年09月24日 08:55
オンエア素材の人物チェックに顔認識。日テレ参院選報道の現場はAIでこう変わった
2/2顔認識を活用し、オンエア率は2倍近くアップ
では、AIによる顔認識を活用することでどのような効果が得られたのか。
「結論から言えば、オンエア素材チェックでの運用において、AIの認識には一度の間違いもなく、オンエア中の誤報は0件でした」
その結果、各工程での紙資料によるダブルチェック作業も必要なくなり、確認速度が向上。素材チェックの時間が激減したため、より多くのVTRをオンエアできるようになった。
たとえば「バンザイ映像(候補者が当選した際に事務所でバンザイをする映像)」を前回の選挙で83本のVTRを作成し、チェックが間に合いオンエアに至ったのは約30本(オンエア率36%)だったのに対し、今回は54本作成のうちオンエアに至ったのは34本(オンエア率62%)と、2倍近い高確率でオンエアすることができたという。

認識精度については、当日は50名近くのスタッフがこのシステムを利用したが、AIによる顔認識の間違いは見つけられなかったという。
後に行われた定量的な検証の結果、AIによる顔認識作業の精度は99.74%であることがわかった。一般的に、人間による顔認識作業の精度は97%程度のため、人間を上回ったことになる。
これにより、これまで画面を見て人物の顔と名前を照合する作業専任だったスタッフを、1名削減できたという。
「人間では紙資料やwebを使っての人物確認作業に20~30秒かかります。AIは1秒以内で行うことができ、迅速に編集作業にとりかかれたので、スタッフもその分人間しかできないことをしてもらうことにしました」
削減した人員は、ネットワーク局との電話でのコーディネーション業務に移ってもらったという。
当該業務では、素材をネットワーク局に依頼したり、送られてくる素材の情報のやりとりを行うポジションで、コミュニケーションが発生する。文字通り「人間でしかできない」仕事だ。
ベンダーとの認識すり合わせに苦労。現場へ招くことも
参院選報道の現場で使われたAIは、こうして誤報防止のための確認工数削減に多大な貢献をした。
仕組みとしては、すでに学習済みの顔認識AIに対して、認識させたい人物の画像を一枚、辞書として登録することで認識することが可能だという。
取材時にデモを見せてもらったが、人物の重なりがあってもある程度認識し、目や鼻、口など顔のパーツが写っていればほぼ認識に成功していた。
この顔認識システムは、あるひとつのベンダーに依頼し、作り上げたという。ベンダーとのコミュニケーションの話を聞くなかで、AI担当者の苦労が垣間見えた。
「今回のシステムを作り上げるなかで10社以上にお声がけし、こちらが求める基準に達するか、性能評価を行いました」
性能評価には数ヶ月をかけ、社名は出せないが日本における規模の大きいベンダーはひととおり声をかけたという。そのなかで、今回選定されたベンダーの決め手はなんだったのか。

「やはり認識精度の高さですね。ただ、今回はうまくいきましたが、課題感のすり合わせには苦労しましたね」
テレビ放送では、放送中のキャプションに誰が映っているのか、わかりやすく表示することが重要だ。そのため、顔認識システムにおいても、一回人物を認識したら画面の外に出るまで認識し続けてもらう必要がある。
しかし、ベンダーが提示するソリューションは、最初の段階ではその「認識しつづける機能」に対応していなかった。そこで加藤さんは、なぜその機能が必要なのかを理解してもらうため、実際にニュース番組制作の現場にベンダーを招き、丁寧に認識をすり合わせていったという。
「プロジェクトではフェーズをふたつに分けました。ひとつはいわゆるPoCで、性能がわかるようなデモを作ってもらい現場のスタッフに見せ、フィードバックをもらう作業を繰り返しました。
私も、こういう作業をするからこの機能が必要で、だからこんなインターフェースが必要なんだと逐一説明していきました」
そしてPoCの次のフェーズとして、今回の参院選の実験があるという位置づけだ。
今回の実験では、本当に現場で使えるものを作ることを目指し、うまくいけば本格導入するという狙いがあった。そのため、ベンダーとのやりとりでは「本当に必要なものとのブレをなくすのに苦労した」と加藤さんは語る。
決裁者を説得するには「とりあえず動くデモ」
AI担当者の「苦労あるある」が、社内の説得、とりわけ決裁者と現場の説得だ。
決裁者からはROIを厳密に求められ、現場からは本当に業務での使用に耐えるのか懐疑的な目で見られる。実際、加藤さんも同じ立場だったという。

「PoCに入る前は『本当にAIなんて使えるのか』という声が一定数ありました。間違ったら大変なことになるから機械に任せるのは不安だと。
しかし、PoCで精度が出ると社内にいい意味で驚きの声が広がり、流れが変わりました。人間より精度高いじゃん、AIってすごいねと言ってもらえたのはうれしかったですね」
加藤さんが以前は編集スタッフを務めており、現場の業務を知っていたのも大きいだろう。現場の課題を理解しており、加藤さんが言うのなら課題は間違いなくあるのだろう、と決裁者の信頼を獲得した。
加藤さんは、決裁者を説得するには、「とりあえず動くデモ」もしくは「動画」が有効だと語る。口で説得しても理解してもらうのに時間がかかる。実際に動くものを見せるのが一番有効だという。
今後は選挙戦以外の番組へもシステムを展開
今後の展開として、加藤さんは社内へのシステムの横展開が必要だと語る。
「選挙以外にも、人物の顔と名前を一致させる必要がある番組は無数にあります。スポーツ番組や芸能番組などにも顔認識を使えるようにしていきたいですね」
顔認識データベースの更新も課題だ。データベースに登録していない人物は認識できないため、新しい人物を登録しつづける必要がある。登録時に間違えてしまえばその後永久に間違えることになるため、正確性を担保する仕組みを作る必要もある。
最後に、現場のスタッフが挙げたという、顔認識を活用したデメリットが興味深いので紹介したい。
「AIが名前と顔を照合してくれるので『人の顔を覚えなくなりそうで怖い』という声がありました。
現状、記者などその人物と直接会って話す可能性のある職種はもちろん覚える必要があると感じますが、もしAI技術が普及すれば、映像を見てチェックするだけの職種の人が覚える必要はないと思います。そもそも一部のベテラン以外には、人物をAIほどの精度で判別するのは不可能なので」
その仕事は本当に人間がやる必要があるのか?普段の業務を見直してみることから始めてもいいかもしれない。



