- 2021年10月08日 12:29
源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」
1/3
「好き」という気持ちに勝るものはない。
何かを成し遂げた人物はその才能が注目されがちだが、人一倍「好き」という気持ちを持っていることが多い。カラーヌワット・タリンさんもそうだ。
ビデオ会議の背景は『源氏物語絵巻』。気さくで明るい人柄だが、古典のくずし字が読まれない日本の現状には不満をあらわにする。彼女からは古典文学が「好き」という気持ちがあふれ出していた。
タリンさんはタイの首都・バンコク出身。日本の古典文学に魅了され、大学院進学とともに1人で来日した。大学院での専攻は『源氏物語』の古注釈ながら、古典文学の魅力を少しでも多くの人に伝えるために、AI(人工知能)によるくずし字認識に取り組み始めた。
彼女が開発したくずし字認識スマホアプリ「みを(miwo)」はSNS上などで大きな話題になった。スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、AIが1枚あたり数秒でくずし字を現代の文字に変換するアプリだ。精度は江戸時代の版本では約95%におよぶ。
彼女は2021年8月31日にROIS-DS人文学オープンデータ共同利用センター(CODH)、国立情報学研究所(NII)を退職し、9月6日にグーグル合同会社 AI開発部門 Brainチームのリサーチ・サイエンティストとして入社した。

「異色の経歴」という言葉があるが、タリンさんほどこの言葉がふさわしい人物は存在しないだろう。何が彼女を突き動かしているのか。
「子どもの頃、友だちによく『日本マニア』と言われていました」
タリンさんは子ども時代を振り返ってそう言う。
くずし字が読めず成績が「F」になって泣いた
「どちらかと言うと、オタクタイプの子どもでした。あんまり外で遊ばず、自分の興味があるものはすごく興味があるものの、興味がないものにはまったく興味を持てなくて……」
当時、彼女を魅了したのはなにより日本文化だった。マンガやアニメより、食べ物や着物など日本文化全般に興味があった。10歳頃から父に言われてプログラミング教室に通う傍ら、日本語に関する本を買い、独学で日本語の勉強も始めた。
日本に来る前に何十回も読んだタイ語版『あさきゆめみし』。大学院で『源氏物語』を研究しようと決断したのもこの漫画のおかげ。その後、写本が好きなので、写本を多く触れる研究がしたいので、専門は『源氏物語』の古注釈になった。 pic.twitter.com/EWR07zusBm
— tkasasagi (@tkasasagi) June 21, 2021
日本の古典文学に興味を持ったのは、タイの大学で日本語学科に通う学生時代に『あさきゆめみし』に出会ったことがきっかけだ。漫画家の大和和紀さんが紫式部の『源氏物語』全54帖を忠実に漫画化した作品である。
「当時の日本文化が好きなので、心を動かされたのは背景設定です。物語や登場人物より、着物や年中行事など、いろんな背景に興味を持ちました」
「日本マニア」だった子ども時代から日本文化全般への興味は変わらなかった。『あさきゆめみし』を何度も何度も読み直し、大学院で『源氏物語』を研究することを決意した。
2008年4月に1人で来日し、文部科学省の国費外国人留学生の奨学金で、早稲田大学の大学院に通い始めた。科目履修生2年、修士2年、博士6年。あわせて10年間、完全に「文系大学院生」としての生活を送った。
「くじけそうなことは数え切れないほどありました。くずし字を読もうとするだけで精一杯でした。ほかのことをする余裕はなかったです」
まわりには韓国人や中国人の留学生もいたが、ほとんどが日本人の学生だった。自分だけが古文や漢文を理解できなかった。ほかの人の研究を追いかけるだけで大変だった。
くずし字が読めなくて、期末試験の結果がFになって、悔しくて院生ラウンジで泣いた記憶はまだある。2012年だった。それでかな書道を始めた。四段を取って明治神宮で開催した書藝選抜展という書道の展覧会で一般部門最優秀賞取った。 pic.twitter.com/l42oNkbg4b
— tkasasagi ὃb (@tkasasagi) June 21, 2021
最悪の挫折は修士1年生の頃、文献研究の授業の期末試験で出題された和歌の資料にあるくずし字が読めず、成績が「F」だったことだ。
「ショックで落ち込んで、学校で友だちとすごく泣きました。今でも記憶に残っています。でも、この分野で研究している限り、くずし字は読めなければいけません」
彼女は持ち前の負けん気を武器に、書道教室でかな書道を習いはじめた。自分自身でくずし字が書けたら、絶対に読めるようになると考えたからだ。次第に書道をしながらくずし字の読み方を身につけ、書道の四段を取るまでに上達した。



