language
注意事項
当サイトの中国語、韓国語ページは、機械的な自動翻訳サービスを使用しています。
翻訳結果は自動翻訳を行う翻訳システムに依存します。場合によっては、不正確または意図しない翻訳となる可能性があります。
翻訳サービスを利用した結果について、一切を保証することはできません。
翻訳サービスを利用される場合は、自動翻訳が100%正確ではないことを理解の上で利用してください。

コモンセンスや文脈を理解し、柔軟に対応するAI
自然言語処理のパラダイムシフトを目指して

写真:助教・博士(工学) Rafal RZEPKA(ジェプカ・ラファウ)

情報科学研究院 メディアネットワーク部門 情報メディア学分野 言語メディア学研究室

助教・博士(工学)Rafal RZEPKA(ジェプカ・ラファウ)

プロフィール

1999年6月、ポズナニ大学 現代言語学研究科卒業。2004年3月、北海道大学 工学研究科 電子情報工学専攻。2004年4月〜2007年3月 北海道大学 情報科学研究科 助手。2007年4月より北海道大学 情報科学研究院 助教。2011年2月〜3月 スタンフォード大学 客員研究員。2013年2月〜03月 モナッシュ大学 客員研究員。2017年1月〜9月 オーストラリア国立大学 客員研究員。2017年6月〜2020年3月 理化学研究所 革新知能統合研究センター 客員研究員。2019年2月〜2019年3月 クイーンズランド工科大学 デジタルメディア研究センター 客員研究員。2022人工知能学会 理事。

暗黙知を含むコモンセンスを
自ら獲得する倫理的なAIの開発

ジェプカ先生の研究テーマはどのようなものですか。

博士(工学) ジェプカ ラファウ

ジェプカ 言語メディア学研究室では、自然言語処理を中心に、機械が自然に(人間のように)言語を扱い、獲得した言葉のルールや知識を使えるようになるプログラムの研究開発を行っています。

私は「コモンセンス」をコア概念として、既存のアルゴリズムにこだわらない新しい手法でのAI研究に取り組んでいます。コモンセンスは、直訳すると「共通感覚」で、日本語では「常識」と訳されることもあります。私たち人間は、成長する過程でさまざまなコモンセンスを獲得し、それを物事の判断基準としています。しかし、人間にとっては当たり前のことでも、ロボットやAIなどの機械は間違って認識することがあります。

コモンセンスにはさまざまな側面があり、人間にとっては低レベルの常識であっても、機械は学習しなければなりません。物理的な因果関係(紐は押すことができない、壁を押しても動かない)、時間的な因果関係(1時間の遅刻は遅い、1時間の飲み会は短い)、社会的な因果関係(買うときはお金を払う、手伝ってもらったら礼をいう)などもコモンセンスの一種です。

また、人間のコミュニケーションには多くの「省略」があります。例えば、「このスープには塩が足りない」という発言には「塩入れを持ってきてほしい」という情報が隠されています。このような推測を「Tacit Knowledge(暗黙知)」と呼びます。現在のAI研究は翻訳やゲーム、運転など限られた用途に使われるものが多く、機械学習によりある程度の能力を獲得していますが、コモンセンスや暗黙知を十分に獲得できているとは言えません。

最近のAIは、主にインターネットの資源を用いて知識を獲得しています。しかし、Web上にアップロードされるテキストや画像、動画には、前述の物理的・時間的・社会的な因果関係についてわざわざ説明しているものはほとんどありません。また、Web情報には嘘・デマ・隠喩・皮肉などさまざまなバイアスが含まれているため、倫理的な判断を誤ったり偏見を持ったりする可能性があります。

私の研究テーマは、機械がどのように言語や知識を獲得すれば、コモンセンスや暗黙知を考慮した柔軟な理解能力と説明力を持てるようになるかというものです。

知識を共有するエイジェントや
文脈を読み取る知識獲得手法の研究

AIが柔軟な理解能力を獲得する方法にはどのようなものがありますか。

博士(工学) ジェプカ ラファウ

ジェプカ まずひとつは、「Bacteria Lingualis(言語菌)」です(解説1)。私が2003年に提案したもので、複数のエイジェントが情報を共有し、知識の自動修正を行う仕組みです。

言語菌の最大の特徴は、テキストの世界で「生きているバクテリア」のようなプログラムを動かし、ある程度限られたシチュエーションの中でのコモンセンスを獲得することです。複数のプログラムがそれぞれ違う言語やシチュエーションについて学習し、各言語の背景にある歴史や文化に依存した知識を獲得します。さらに、エイジェント同士がお互いの知識を共有し、共通点を見出すことで、全体として正しい倫理判断やコモンセンスに基づいた推論を行うことができるのではないかと考えています。現在はマルチリンガルの言語モデルを用いたバージョンを開発していますが、将来的にはテキスト情報だけでなくカメラやマイク、各種センサーなど人間にはない感覚器官の情報も取り入れていきたいと思っています。

もうひとつは、科学研究費助成事業(科研費)を得て行っている「暗黙知」の研究です。ここでは文章を最小限の要素に分解し、統計的なアプローチで論理的なルールを発見する知識獲得手法を目指しています(解説2)。例を挙げると「私たちは、今、オンライン会議をしている」という文章の意味を細かく分解し、「私たち=人間」「今=いつ、近い時間」「オンライン=近くない、物を扱う」「会議=人と人が話している」など関連する一番簡単な概念(時間、物,人,扱う,話すなどのSemantic primesと呼ばれる意味の最小限の要素)を紐付けていく手法です。「人間は身体があり生きている」「コンピュータは生きていない」といった人間なら当たり前に知っていることでも、機械はまだよく間違う状態なので、言語モデルなどから概念の認知を引き出し、さまざまな文脈から共通のカテゴリーなどを学習していくアイディアです。本研究の成果は、より深い機械学習パラダイムとなり、次世代の言語モデルを構築する材料になるのではないかと期待しています。Bacteria Lingualisは日本語の助詞を用いて人間の感情などを発見していましたが、現在は意味の最小限の要素が追加され、論理的なルールやアナロジ発見のための抽象化の実験を行っています。

文系と理系の融合により
社会に信頼されるAIの実現を目指す

─これからのAI研究はどのように発展すると思いますか。

博士(工学) ジェプカ ラファウ

ジェプカ 現在、科学技術振興機構のCRESTで「信頼されるAIシステムを支える基盤技術」の研究に関わっています。

現在のAIは、膨大な情報の中から最適な解答を見出すことを期待されていますが、理由や推論のプロセスを説明することができない、いわゆる「ブラックボックス問題」が課題とされています。本研究では、ニューラルネットワークと論理的ルールを融合させ、なぜこのような結果に至ったかを説明できるAIの実現を目指しています。例えば、ある事柄について、子どもにわかりやすく説明するのか、科学的根拠を列挙して詳細に説明するのかでは盛り込む情報の量や精度が異なります。また、犯罪などに利用される可能性がある情報などにも注意が必要です。目的や状況に応じた情報の取捨選択と、受け取る側の属性に応じた内容を考慮し、シチュエーションや文脈によって説明の度合いを調整する役割として哲学や心理学など文系の専門家が必要とされているのです。私は言語学と認知科学の出身なので、文系と理系の背景を持った研究者として両チームの接着剤の役割を担っています。コモンセンスや暗黙知を理解し、社会から信頼されるAIを実現するには、言語学や認知科学以外にもさまざまな文系の専門家の存在がますます重要になってくると思います。

近年のAI研究には斬新な発想によるパラダイムシフトが起こりにくい状況があると思います。私たちの研究室では、企業がまだ視野に入れていない困難なテーマにも積極的に挑戦していくことを目指しています。情報科学の急速な進歩により、過去には実現できなかった文系研究に基づくシステムも開発できるようになりました。新規性のあるアイディアは簡単には浮かばないので、過去の研究論文に再度チャレンジすることで新しい領域が広がる可能性もあります。若い世代の研究者のフレッシュなアイディアを生かし、画期的な認知アーキテクチャの開発につなげたいと考えています。

国際色豊かな研究室の様子
コモンセンス知識ベース拡張、ネットいじめの発見、ダジャレと生成、隠喩処理、辞書例文の自動生成、AIチューターの研究に従事してきた教え子に囲まれたジェプカ先生(業績リスト)

解説

解説1:言語モデル上でのBacteria Lingualis(言語菌)を用いた認知的アーキテクチャのための概念拡張

Bacteria Lingualisのアプローチのコアのアイデアは言語と知識の獲得プロセスに単語レベルの統計的な情報だけではなくて、直接文章に書かれていない概念も発見する点にある。 以下のアニメーション(図1)では、「ボクサーがリングで顔を殴る」というフレーズを題材に、日本語の助詞などによって獲得した暗黙知がどのように文脈処理に役に立つかというイメージを紹介する。行為を表す短い表現で場所を変更するだけで、人間に浮かんでくる連想の内容とその連想の強度に違いが生じ、行為に対する気持ちや次に起きうることの推測に影響を及ぼすことを検証している。 また、言語菌と他のアプローチとの大きな違いは、さまざまな人の経験をできるだけ個別に分析することにある。現在の言語モデルはなるべく大きいインターネットの塊のファイル一つからすべての知識の関係を平均化する。それに対し言語菌は入力に対して多様な人間が書いた関連する文書を検索した上で、現在の文脈に一番近いシチュエーションを優先する。それにより、平均化で消えてしまう珍しいケースを記憶に残すこともできる。

図1. Bacteria Lingualis(言語菌)
言語を「消化」して暗黙知を発見するエージェント

解説2:Semantic Primesに基づく暗黙知データベースの作成及び評価

自然言語処理の分野は爆発的な人気を博しているが、現在最も多い知識を含んでいると言われているGPT-3言語モデルも「馬の目は馬の足にある」のような「勘違い」をすることがあり、子供でもわかる「当たり前」に弱い。本研究は、まずどのように新たな「目に見えない知識」を収集すべきか調査を行う。次に認知言語学で用いられている意味の原子要素の概念からヒントを得た「意味の分解」を用いることでどの程度の新たな「暗黙知」が収集できるか調査をする。さらに、その知識の内容と構造化の変更が言語理解タスクにどのようか影響をもたらすか、という問いへの答えを見つけるための研究を行う。 以下のアニメーション(図2)では、AIが暗黙値をどの程度推測できるかについて、大規模なデータ収集を行い、収集した知識の有効性を普段より困難な文章理解のタスクで検証する研究の概要を紹介する。

図2. Semantic Primes
意味の最小限の要素がどうのように「理解」を支えているか発見する研究