HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル38

ネットジャーナル38

解説

解説1:物語データベース

オンライン文書を話の筋や展開構造からデータベース化する試み。テキスト間の構造類似性の検出や結束性と文脈性に基づく文の評価などを行う。

図1図:単一物語から抽出可能な複数の類比関係

図1図:文の情報伝達モデルと物語の構造解析

図1図:話題連結:繋ぐ情報

本文にもどる

解説2:グラフの差異の検出

グラフ構造における差異の検出をターゲットとし、異なる地域、イベント発生の前後等、異なるグラフを比較し差異を表す頂点集合を検出する方法。

資料1

ご覧の環境では、object要素がサポートされていないようです。PDFファイルをダウンロードしてください

資料2

ご覧の環境では、object要素がサポートされていないようです。PDFファイルをダウンロードしてください

本文にもどる

解説3:相関マイニング

複数の単語の相関量の差を求めることで関係性の変化を検出する手法。この方法では、データマイニングにおいて最も基本的なトランザクションデータベースに対する手法を与えている。
まず、いわゆる属性の集まり(アイテム集合)で、一方のデータベースで相関が低く、もう一つのデータベースで相関がある程度高くなるものを求める。

相関差異が大きな場合は、目立った変化として比較的抽出しやすい話であり、例えば、相関を変数集合に対するカイ2乗統計量で計量した場合は、一方のデータベースで無相関(独立)だが、時間や場所の変化に伴い強い相関を示すものを抽出することになる。
本研究ではそうではなく、相関の兆しをみつけることが目標であり、そのためには、より膨大な属性集合をチェックする必要性があり、その問題を克服するための技法を組み込んでいる。

(資料:A. Li, Aixiang, M.Haraguchi and Y.Okubo:Contrasting Correlations by an Efficient Double-Clique Condition,Transactions on Machine Learning and Data Mining, 5(1), pp. 3 - 22, ibai Publishing, 2012.)

本文にもどる

ページの先頭へ