Company

株式会社デンソーアイティーラボラトリ
研究開発グループリサーチャ

内海 慶

日常会話の意味を理解して成長する
「対話できるAI」を実現したい!

確率理論を元にテキストを単語に分割し、
品詞を推定して、意味を獲得していく

車に「あの山は?」と聞いたら「富士山ですよ」と答える未来

 自動運転技術の開発に注目が集まっている。人が運転せず、自動で目的地にたどり着ける車が登場する未来はそう遠くはないだろう。では、自動運転社会が到来したとき、車にはどのような機能が付帯しているのだろうか......。
「自動運転中に、カーナビに『あの山は?』って聞いたら、『富士山ですよ』なんて答えてくれたり、『ちょっと暑いね』と会話していたら、自動でエアコンの温度を下げてくれたりするような対話インターフェースを実現したいんです」
 そう語るのは、株式会社デンソーアイティーラボラトリの内海慶さん。デンソーといえば、自動車に搭載するさまざまな電気機器の総合メーカー。日本だけでなく、海外の主要自動車メーカーにも製品を供給するグローバル企業である。

「自然言語処理」の技術を用いて「対話インターフェース」を実現

 「デンソーというとハード機器のイメージが強いのですが、私たちが主に行っているのは、ソフトウェアの開発です。研究領域は、画像処理、信号処理、自然言語処理、認知科学など多岐に渡ります。最大の目的は、デンソーが持つ自動車業界の世界的ネットワークを使って、研 究成果を製品化すること。ただ、従来の自動車の枠を超えた未来の生活全般を支える製品やサービスも積極的に提案していきたいと思っています。私は、ここで、『自然言語処理』と呼ばれる分野の基礎研究を行っています」
 「自然言語処理」とは、人間が普段使う言葉を指す「自然言語」をコンピュータで「処理」する研究。めざすのは、人工知能(AI)を用いて、人と自然な会話を可能にする「対話インターフェース」の実現だ。インターフェースとは、言わばコンピュータと人間の接点のこと。つまり、人間が発した音声や文字を認識して、言葉の意味を理解し、対話を実現するコンピュータ側の機能と考えればいいだろう。

現在の対話型AIは言葉を本当には理解できていない

 「ベースになるのは、AIが自ら学んで成長する『機械学習』の技術です。機械学習には、大きく分けて『教師あり学習』と『教師なし学習』という方式があって、私が使っているのは後者。その名の通り、人間が単語や文法について、細かく『正解』を教えなくても例文を読み込んでいくうちに、その言語を理解していきます。詳しくいうと、『形態素解析』という処理を用いて、与えられたテキストの単語分割と品詞の推定を自動的に行って、意味を獲得していくのです」
 内海さんのような専門家から見ると現在実 現されているスマホやAIロボットの対話機能 は、Chatbotと呼ばれるプログラムを用いたものが主流で、入力文に対して、人間が予め用意した応答文のうち最適なものを自動で選んで出力しているだけ。言葉の意味を知らないまま、話し相手も目的も理解しないまま単語を返信しているのだという。これに対し、内海さんが開発中の技術では、入力文の意味を理解したうえで、オリジナルの返答を出力することをめざす。

「教師なし学習」で文章を単語に分割し、品詞を推定する

 「私が取り組む『教師なし』の形態素解析では、『ベイズ学習』という手法を用いて、テキストを意味のある単語に分割し、品詞を推定していきます。根拠になるのは、ベイズ統計と呼ばれる確率統計の理論です。例えば、『東京都は』という文字列があります。人間ならこれを見て、自然に単語で区切って、意味を理解できますが、AIには難しい......。そこで確率論の出番です。この場合、『東』の次に『京』が来る確率は高く、『東京』の次に『都』が来る確率も同様に高い。しかし、『東京都』の次に『は』が来る確率は極端に下がります。『が』や『を』が続く可能性も多いからです。そこで、まず『東京都』『は』という単語に区切るのが第一ステップ。そこから、これは名詞+接続詞だなという具合に品詞を推定します。人間が行うのは、単語の頻度分布の形を定義すること。それを元にコンピュータが文字列を解析し、この単語の次には何が来るかということを確率論で考えるのです」
 「対話できるAI」と言葉でいうのは簡単だが、裏ではこんな複雑な処理が行われているのだ。この「ベイズ学習」を用いた手法は、日本語だけでなく、英語、中国語、タイ語など、あらゆる言語に加え、ネット用語やギャル用語など、特殊な言葉にも応用できるという。SNS上のメッセージや日常会話の音声などを自然に取り込んで、まだ辞書に載っていないような言葉まで理解してしまう。このまま開発が進めば、自動運転車のカーナビが、デート中のカップルの会話を聞いて、「次はここに行けば?」なんて提案してくれる未来が来るかも?

自然言語処理の「形態素解析」を用いて、テキストを単語に分割し、品詞を推定する工程をモデル化したもの。図中の中国語の例文において、文字列を単語に分割した結果、「朋友」という名詞が抽出されているのがわかる

Profile

内海 慶

株式会社デンソーアイティーラボラトリ
研究開発グループリサーチャ

筑波大学大学院 図書館情報メディア研究科 図書館情報メディア専攻修了
図書館情報大学 図書館情報学部卒業
筑波大学大学院 図書館情報メディア研究科 図書館情報メディア専攻 博士前期課程修了

学生時代の研究テーマは、音声認識や音声検索技術の開発。当時から機械学習の技術を応用していた。その後、ヤフー株式会社に就職し、検索のランキング評価の研究に従事。ネット上から評判のキーワードを抽出する技術は、現在の「対話インターフェース」の研究でも役立っているという。