HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル58

ネットジャーナル58

研究者にとって必要な情報を的確かつ十分に抽出・整理
新しい知識の発見につなげる探索技術の研究開発

写真:博士(工学) 吉岡 真治

情報科学研究科 情報理工学専攻
知識ソフトウェア講座  知識ベース研究室・教授
博士(工学)  吉岡 真治

プロフィール

1991年、東京大学工学部精密機械工学科卒業。1996年、同大学院精密機械工学専攻博士課程修了、博士(工学)。1997年、学術情報センター(助手)。2000年、国立情報学研究所 情報学資源研究センター(助手)。2001年6月、北海道大学・大学院・工学研究科(助教授)。2004年4月、北海道大学 情報科学研究科・大学院(助教授)、2008年4月、北海道大学 情報科学研究科(准教授)を経て、2018年1月より現職。専門は情報アクセス技術を用いた知識の発見・組織化・再利用。ACM (Association for Computing Machinery)、言語処理学会、情報処理学会、人工知能学会、情報処理学会、日本機械学会、精密工学会等に所属。

膨大なデータから知識を発見・組織化・再利用する手法の研究

――知識ベース研究室ではどのような研究をしているのですか。

吉岡 現在の私たちは、多種多様かつ膨大なデータに容易にアクセスできる環境にあります。しかしその膨大さゆえに、コンピュータの助けなしでこれらのデータを有効活用することは不可能であり、YahooやGoogleといったブラウザの検索機能などを使って必要な情報を探し出すことが当たり前になっています。近年はAIを活用したデータマイニングが急速に発展し、ビッグデータなどから情報を自動的に取り出す技術が注目されています。

本研究室では、膨大なデータの空間から有用な知識や情報を発見・抽出するだけでなく、さらに既存の知識とともにそれらを組織化・体系化し、再利用を容易にするための技術や仕組みの開発を目指しています。『知識の発見・組織化・再利用』をキーコンセプトとして、文書群の組織化と物語データベース、データマイニング、 モーション生成・合成、プログラム・マネジメント支援等について、理論的および実験的側面から研究を行っています。

その一例が、世界各国でのニュース記事の比較の研究(解説1)です。複数の国の新聞記事を比較し、記事の中に含まれるキーワードの種類や頻出度を分析することで、各国の新聞読者の興味や重要視しているテーマの違いを見つけることができます。

情報や知識の持つ「意味」や「価値」は一様ではありません。インターネット上には似たような文章が無数にありますが、同じ文章でも、読み手がどのような情報をそこから取り出したいかに応じて、その価値が変わってきます。私たちは、文書中から読み手が取り出したいと考えるような情報の断片をあらかじめ抽出・分類し、「メタデータ」(データに対するデータ)として与えることで、様々な観点からの類似性の議論や、データの集約を支援することで、大局的な分析を可能にする枠組などの研究を行なっています。

ページの先頭へ