HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル5

ネットジャーナル5

知識断片の関連性を見つけ出す半構造マイニングの研究

――知識創出学の確立の中で、有村先生が取り組んでいらっしゃる半構造マイニングの研究は重要な役割を担っていますね。

有村 インターネットをはじめとするWeb上にはエクサバイト規模(10の18乗)の情報が存在するといわれていますが、そのほとんどは個々の知識断片の膨大な集積に過ぎません。一人の研究者が混在する知識のすべてを理解し、多様な分野を関連づけ、横断的に研究することは非常に困難です。そこで、大量のデータから有用なパターンや規則を半自動的に抽出し、知識獲得の手助けをする。それが私の研究テーマです。平成13~17年度特定領域研究「情報学」に採択された研究や、 平成17~19年度の特別推進研究に採択された「知識基盤形成のための大規模半構造データからの超高速パターン発見」という研究を通じて、WebページやXMLデータなどに代表される半構造データ(解説2)から、特定のルールやパターンを見つけ出す技術の研究開発を進めています。これらの研究によって、ツリー構造の中から特徴的な部分構造を小さなツリーのパターンとして発見するツリーマイニングのアルゴリズム「FREQT」が開発されました。(解説3/図1

半構造マイニングは、バイオやナノテクノロジーの研究に役立つと考えられています。例えばゲノム解析では、個々のゲノムの機能や発現パターンを抽出・分類・解析するのに、一つひとつの組み合わせを検証していかなくてはなりませんでした。半構造マイニングを使えば、すべてのゲノムを同時に比較し、共通するルールやパターンを抽出することができるようになります。「FREQT」は実データ上での検証でも安定した動作が確認され、バイオ・ナノテクノロジーなどの研究分野だけでなく、ビジネスベースでの利用も十分可能であると期待されています。これらのマイニングエンジンはネット等を通じてオープン化し、知識の発見・連携に役立てていきたいと考えています。

(2007/08/06)

ページの先頭へ