language
注意事項
当サイトの中国語、韓国語ページは、機械的な自動翻訳サービスを使用しています。
翻訳結果は自動翻訳を行う翻訳システムに依存します。場合によっては、不正確または意図しない翻訳となる可能性があります。
翻訳サービスを利用した結果について、一切を保証することはできません。
翻訳サービスを利用される場合は、自動翻訳が100%正確ではないことを理解の上で利用してください。

情報幾何学を用いて統計学の本質的問題に迫る
医療や防災など社会への応用にも期待

写真:博士(情報理工学) 廣瀬 善大

情報科学研究院 情報理工学部門
数理科学分野  情報解析学研究室・准教授

博士(情報理工学)廣瀬 善大

プロフィール

2012年、東京大学 大学院情報理工学系研究科 数理情報学専攻 博士課程 修了。
2008年10月~2011年3月、東京大学大学院数理科学研究科グローバルCOEプログラム「数学新展開の研究教育拠点」リサーチアシスタント(RA)。2012年4月~2017年3月、東京大学 大学院情報理工学系研究科 数理情報学専攻 助教。2017年、北海道大学 大学院情報科学研究科 情報理工学専攻(現・大学院情報科学研究院 情報理工学部門)准教授。

統計学の新しい展開と応用を目指した研究

情報解析学研究室ではどのような研究を行なっているのですか。

廣瀬 本研究室では、統計学をベースに理論的な研究から応用的な研究まで多岐にわたるテーマを扱っています。私が現在取り組んでいる研究領域は「情報幾何学」「ベイズ統計学」「スパース推定」の3つです。情報幾何学は私が特に興味を持って取り組んでいる研究テーマです。

情報幾何学では、一つひとつのデータや確率分布を空間中の点と考え、確率分布の集まりを空間的にとらえます。点と点の間の距離は確率分布の距離であり、それらが幾何学的な構造になっているのです。研究分野として体系化されたのは1980年代で、比較的新しい分野ですが、統計学に情報幾何を取り入れると直感的な見方やとらえ方ができるため、使い勝手が良く効率的な手法として浸透し、現在は機械学習や深層学習にも使われています。

統計学に幾何学を取り入れるメリットは、(1)本質的な部分をとらえやすくなる、(2)グラフや図などが描けるためイメージがつきやすい、という2点があげられます。例えば、統計学で有名な「シンプソンのパラドックス(解説1)」も情報幾何を使って表現すると視覚的・直観的に問題点を見つけることができます。

統計学は必ずしも幾何学的な見方を使って発展してきたわけではありませんが、統計学的にとらえられてきたものを情報幾何の側面から見てみるととても自然に見えることが多く、統計学を見直したり解釈し直したりするときに非常に役立っています。

地震波を分離・分類することで震源地を特定する技術の開発

現在どのような研究を行っているのですか。

博士(情報理工学) 廣瀬 善大

廣瀬 「双対平坦空間の情報幾何を利用した統計推定(解説2)」や「一般化線形回帰問題と情報幾何(解説3)」といった研究を行っています。これらはパラメータ推定手法に関する研究で、情報幾何学を使うことで直観的に理解しやすいパラメータ推定法を提案しています。

また、医療統計への応用を目指した研究にも取り組んでいます。医療分野では臨床研究などにさまざまな統計が使われていますが、中でもよく使われているのがオッズ比です。オッズ比の基本的な数式は長年使い続けられている計算式であり、使いやすいさの面では優れているのですが、研究の対象や目的、調査方法などによっては適切な結果が得られない場合もあります。私の研究では、オッズ比の新しい扱い方を提案し、研究の目的に合った適切な統計解析の手法を提供することを目指しています。

さらに、JST(科学技術振興機構)のCRESTで地震のデータを使って震源を正確に求める技術の研究開発にも携わっています(解説4)。地震大国と言われる日本では、全国に1000箇所以上の地震観測点があり、高精度な地震計の計測データが常時収集されています。しかし、高精度であるがために都市部では車の走行や機械動作などによるノイズが多数発生し、それらを分離・選別することが解析の第一歩となるのです。私たちのプロジェクトでは、最先端ベイズ統計学を用いて多種多様な地震計測データを解析するアルゴリズム群の開発に取り組んでいます。

適切な解析結果につながる解析手法の開発に取り組む

統計学と情報幾何学は今後どのように発展していくのでしょうか。

博士(情報理工学) 廣瀬 善大

廣瀬 統計学は高度な数学を必要とする学問ですが、統計そのものはとても身近な存在です。政府が行う統計調査から、アンケート調査や顧客の購買行動分析などビジネスに活かす統計まで社会のあらゆる場面で統計が利用されています。

世の中で一般的に使われている統計ツールを使えば、集めたデータを入力するだけで結果が出てきます。統計ソフトはブラックボックスのようなもので、中身を知らなくても結果を得ることができます。高度な分析もボタンひとつでできるツールが普及したおかげで、最近は膨大なデータを用いて新たな知見を見出そうとするデータサイエンスブームが起きています。

ツールの発達により誰もが簡単に統計を扱えるようになるのは喜ばしいことですが、私自身は統計の結果よりもブラックボックスそのものに興味があります。ブラックボックスがどう動きどのようにデータが解析されるのか、どのようなシチュエーションだったらどの程度の精度で解析できるのかを解明したいと思っています。「原理的にここまでしか解けない」という限界を確認することも統計学上の重要な課題です。シンプソンのパラドックスのように、今でも扱いが難しい問題もあり、そうした謎に挑むことも統計学を研究する面白さのひとつですね。

また、情報科学研究院には数学の専門家から情報科学の専門家まで幅広い研究者が在籍しており、画期的なコラボレーションが生まれるのではないかという期待があります。私は数学分野にも情報分野にも関わる中間的な立場にいるので、双方の研究者から最新の知見を学びつつ異なる分野の橋渡しをすることもできます。実際に共同研究が進んでいるテーマもあり、今後の展開が楽しみです。

解説

解説1:シンプソンのパラドックス

統計学の有名なパラドックス。⺟集団での相関と⺟集団を分割した集団での相関が矛盾する解釈を与える。図では、分割した2つの集団の平均(黄色の丸)は青い曲面上にあるが、母集団全体の平均(⾚い丸)は曲⾯から出てしまっている。平均が曲面上にあるかどうかで結果の解釈が異なってくる。ひとつのデータから異なる結果が出てくるためパラドックスと呼ばれる。

図

解説2:双対平坦空間の情報幾何を利用した統計的推定

数学の成績データに対する解析結果。5つの科目(1: 力学、2: 線形代数、3: 代数、4: 解析、5: 統計)の関連を示すグラフ。左上から右下まで辺がひとつずつ少なくなっていく。頂点が5つあるグラフにおける辺の与え方は1024通りあるが、情報幾何学的な手法により候補を10個に絞っている。

図

論文リンク:http://www.kurims.kyoto-u.ac.jp/~kyodo/kokyuroku/contents/pdf/1834-02.pdf

解説3:一般化線形回帰問題と情報幾何

回帰係数の推定を幾何学的に行う方法。パラメータを推定するだけでなく、回帰係数の一部を0にすることにより説明変数を選択する効果をもつ。

図

論文リンク:https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/223324/1/1916-07.pdf

解説4:次世代地震計測と最先端ベイズ統計学との融合によるインテリジェント地震波動解析

統計学と地震学の専門家が協力して、地震現象の解明に取り組んでいます。統計学の観点からは、特にベイズ統計学を利用した高度な手法を研究しています。将来的な防災・減災に貢献できるような研究を目指しています。

サイトリンク:http://www.eri.u-tokyo.ac.jp/project/iSeisBayes/