HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル29

ネットジャーナル29

汎用性の高い多変量データ解析を用い
実社会のさまざまな情報・現象の解明を目指す

写真:博士(工学)金井 理 教授

情報科学研究科 コンピュータサイエンス専攻 
数理計算科学講座 情報解析学研究室・教授
博士(工学) 今井 英幸

プロフィール

1987年、北海道大学大学院工学研究科情報工学専攻修士課程同修了。同年、北海道根室高等学校教諭。1989年北海道大学工学部助手、翌年、同大学院工学研究科助手に配置換え。2000年、同大学院工学研究科助教授、同大学院情報科学研究科助教授を経て、2009年、同大学院情報科学研究科教授に昇任。2005年、Seventh International Conference on Computing Anticipatory Systems (CASYS’05)におけるBest Paper Award受賞。

さまざまな情報を集約・可視化する
多変量データ解析手法の開発

――先生の研究室ではどのようなことを研究しているのですか。

今井 主にデータの理論的解析からソフトウェア開発まで広範囲にわたる研究を行っています。データは基本的に①ある特定の目的を持って集められたもの(定型的なデータ)と、②日常的な活動の中で蓄積されたもの(非定型的なデータ)の2種類があります。

定型的データの典型は、学生の学力試験の結果、世論調査、臨床試験に使われるような患者と検査結果のデータなどがあります。非定型的データの例はメール、TwitterなどのSNS、POS、インターネットショッピングの購入履歴などが上げられます。近年の「ビッグデータ」と呼ばれているものも非定型的データの一種です。

私たちの研究室では長年定型的なデータの解析手法を研究しています。例えば、センター試験の結果であれば、数十万人の受験生×5科目といった大きなデータが得られますが、それを元に、平均を取る、最高点・最低点を求めるなど必要な情報を得るための処理を行い、直感的に把握しやすいようなものに集約・可視化していきます。

こうした解析に用いられるのが「多変量データ解析」です。多変量解析とは、複数の結果変数からなる多変量データを統計的に扱う手法で、技術そのものは古くからあったのですが、コンピュータの計算能力が低い時代には処理に時間と労力がかかっていました。近年はパソコンの発達のおかげで身近に使えるようになり、活用範囲が広がっています。

ページの先頭へ