HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル5

ネットジャーナル5

解説

解説1:「21世紀COEプログラム」

「大学の構造改革の方針」に基づき、平成14年度から文部科学省の事業(研究拠点形成費等補助金)として措置されたもの。わが国の大学に世界最高水準の研究教育拠点を形成し、研究水準の向上と世界をリードする創造的な人材育成を図り、国際競争力のある大学づくりを推進することを目的としている。平成14年度に工学研究科で「知識メディアを基盤とする次世代ITの研究」というテーマが採択され、田中譲教授を拠点リーダーに、知識メディア・量子ナノ・知的通信の技術を融合し、新アーキテクチャ量子集積回路とそれを用いた通信機能付きIQチップ技術、それらを利用した知識メディア技術の研究開発を行ってきた。

本文にもどる

解説2:「半構造データ」

ツリー構造を持つXMLデータなどのように、構造自体は持っているが、あらかじめ定められた形式を持たないデータのこと。ツリーマイニングの場合は、ツリー構造内に存在する半構造データの中から特徴的な部分構造を小さな木のパターンとして発見する。

本文にもどる

解説3「性能保証を持つ高速発見アルゴリズム“FREQT”」

FREQTは「最右拡張法(Rightmost expansion)」という世界初の多項式時間アルゴリズムを用いている。ツリーの要素を追加する際、右側だけに新しい頂点(赤い部分)を追加するように設定すると、すべてのパターンのツリー構造が自動的に生成できるというものである(図2)。ツリーデータ以外にも、さまざまな組み合わせ構造を効率よく列挙できる。日本語文書から自然言語処理技法でツリー構造を構築し、それにFREQTを適用することでテキストマイニングを行った事例もあり、高速・堅牢で汎用性に優れたアルゴリズムとして多様な分野への適用が期待されている。

ツリーマイニングの例
(図1)「ツリーマイニングの例」
Web上のオンラインデータベースのツリー構造から、
くり返し出現するテンプレート構造を抽出している。

最右拡張法の例
(図2)「最右拡張法の例」

本文にもどる

ページの先頭へ