坂地 泰紀(サカジ ヒロキ) |
情報科学研究院 情報理工学部門 複合情報工学分野 |
准教授 |
様々な産業・経済システムのデジタル化が進展する中、デジタルデータを活用した価値創造への期待が高まっている。その流れを受けて、異なる事業者間でデータを交換・取引するデータ流通エコシステムが萌芽し、新たなイノベーションの源泉として注目され始めている。このようにデータ流通を通じた価値創造への関心は高まっているものの、法制度設計と技術仕様が複雑に絡み合うことから、データ流通エコシステム全体を包括的に捉えた議論が進んでいるとは言い難い。加えて、データ流通プラットフォームの仕組みやサービスについてのシステム面・ビジネス面に絞られた形での議論は存在する一方で、実際に取り扱われるデータ自体の特徴やデータ間の関係性などのデータ流通メカニズムについて十分には明らかになっていない。そこで本論文では、データ流通プラットフォームにおけるデータ連携・相互作用メカニズムを、実証分析に基づいて検討した。プラットフォーム上のデータネットワーク分析から、1) 連携可能性を高めるデータの特徴、2) 連携を促進するデータ共有条件、及び3) データネットワーク構造の特徴に関する知見を得た。具体的には、「時間」や「場所」などに関わる変数が多様な異種データの連携可能性を高めることが示された。また、秘匿データと共有可能データの混在が密なネットワーク構造の構成を促し、異分野間データ連携の成立可能性を高めることが明らかになった。加えて、データネットワークは人間関係と似た「局所的に密、大域的に疎」な構造をしており、疎の部分を埋めるデータを提供することで、異分野をつなげるデータ活用を活性化できる可能性が示唆された。これら分析結果をもとに、データ流通プラットフォームの設計・運営及びデータエコノミー推進への示唆と課題を議論する。
本論文では,地方銀行が業務利用のために蓄積しているテキストを用いて,その地域の景況感を示すインデックスを生成する手法を提案する. 銀行内には業務で扱っている様々なテキストデータがある. 我々は,その中でも接触履歴に着目した. 接触履歴は,行員が顧客と何かしらのやり取りを行った際に記録されるデータであり,様々なことが記述されている. そのような接触履歴を解析すれば,その地域の景況感が分かるのではないかと,我々は考えた. そこで,本研究では,接触履歴から地域景況インデックスを生成した. まず,景況インデックス作成に最適なモデルを景気ウォッチャー調査と接触履歴を用いて検討した. その後,そのモデルを用いて景況インデックスを作成し,既存の指標と比較することで,性能を評価し,高い性能を示した.
近年,社会の様々な場面で機械学習・深層学習手法による予測が活用されている.深層学習手法を用いて学習したモデルは高い精度で予測を行うことができるが,予測信頼性を十分に考慮できておらず,予測の困難な外挿データに対しても高い確信を持って予測を行ってしまう危険がある.本研究では画像識別タスクに対して,通常の深層学習手法および近年提案されている不確かさを考慮した深層学習手法を適用し,外挿データに対するモデルの頑健性を検証した.通常の深層学習手法により学習したモデルはモデル学習用データに存在しない特徴を持つデータに対して高い確信度で予測を行ってしまうが,不確かさを考慮した深層学習手法により学習したモデルはそのようなデータに対し確信度を低く出力し,誤った予測を回避することが可能となる.実験結果より深層学習手法における不確かさ評価の重要性が示唆された.
インデックス投資が市場の価格形成に与える影響を調べるため,証券市場とその参加者,価格決定をモデル化した.そのモデル上でインデックス投資が価格形成にほとんど影響を与えないことをシミュレーション実験により示した.
市場参加者にとって、各国の金融政策や財政政策、あるいは2国間の貿易摩擦などのマクロ経済の不確実性は、意思決定をする際に重要な役割を果たす。本研究では、ニューステキストを用いてマクロ経済の不確実性指数の構築を目指す。トピックモデルを拡張し、テキストデータのみならず、数値データを教師信号として用いたモデルの適用を試みた。また、構築した4つのマクロ経済の不確実性指数を対象にした定性的・定量的な分析を行った.
決算短信の因果関係ネットワークを構築する実験を行った.因果関係を決算短信から抽出し,表現の類似度を算出してネットワークを構築した.類似度の計算には日本語版ウィキペディアのコーパスから作成したword2vecモデルを使用し,単語の重要度を表すidf値の組み合わせることで,単語ベクトルから因果関係表現のベクトルを獲得した.また、極性辞書を用いて因果表現の極性の反転を捉えることで,word2vecモデルにより同一視される対義語と類義語による違いを検出した.実験によってネットワークから,因果関係どうしを結ぶ100個のエッジを無作為に選択し、目視により評価した。 その結果、妥当な接続と考えられる割合は84%であり、さらにその中で極性の反転が正しく捉えられたエッジの割合は86%であった。
本研究は,金融市場における高頻度取引(HFT)のマーケットメイク(MM)戦略と呼ばれる注文行動について分析を行うことを目的とした.株式会社日本取引所グループより提供を受けた,東京証券取引所の注文データを使用し,仮想サーバーの名寄せを前処理として行なった.その結果得られた,取引主体別の注文データを,いくつか指標を使うことで,クラスター分析を行い,高頻度マーケットメイク戦略(HFT-MM)を取っている取引主体を抽出し,それらの注文が,直近約定価格から何ティック離れたところに置かれているかについて計算した.その結果,HFT-MMとされる行動主体は,直近約定価格からかなり離れた位置(5-10ティック)のところにも注文を置いていることが明らかになった.この結果は,HFT-MMとされる取引主体が,マーケットメイク戦略だけではなく,他の戦略も採用している可能性を示唆しており,さらに確認すると,価格が急変した際には,不安定化効果を引き起こす可能性をも示唆していることがわかった.
イタリアの銀行間預金オンライン取引システムe-MIDで行われた取引データから, 1999年から2016年の期間について営業日ごとの銀行間ネットワークを構築した. 構築した銀行間ネットワークについて, ノードのネットワーク特徴量を計算し, それを入力データとしてクラスタリング構造変化検知による分析を行った. この分析の結果, リーマンショック後のダイナミクスの特徴が銀行の種類によって異なることが明らかになった.
本論文では、新聞記事からのテキストマイニングによる因果関係を考慮したアナリストレポートの要約文生成手法の提案を行う。因果関係抽出本手法を用いれば、機関投資家の大量の文書を熟読しなければならない負担を軽減し、証券アナリストの肩が投資判断に関わる重要な経済情報を簡単に収集することができる。そこで今回は、本手法における因果関係表現抽出手法の妥当性を野村證券株式会社のテキストデータを用いて評価及び分析を行う。全アナリストレポートの7割程度で、予想の根拠情報を取得することができ、本手法における因果関係抽出手法の有用性を示した。また、評価をするにあたり、証券アナリストの予想の書きぶりも示すことができた。
近年経済のグローバル化によりある金融機関の破綻の影響がその業界や国を超えて国際的なものとなっている。 関連する分野の先行研究は、銀行単体もしくは企業単体でのエージェントシミュレーションを行うものがほとんどである。 そこで、本研究では銀行と企業の相互作用に焦点を当てた多層ネットワークのモデルを提案し、銀行から企業への投資の有無が企業の成長率に与える影響を調べる。 具体的には、投資を受けているかどうかによって成長率の変動幅を変化させ、最終的な企業の規模の分布の変化について議論する。 銀行が持つ貸借対照表は全国銀行協会が公表している全国銀行財務諸表分析に基づいて作成した。 シミュレーションの結果として、投資は企業の成長の平均には影響を与えなかったが、企業間の格差が広がった。 これは投資を受けた企業のうち、投資を活かして成長することができたものと失敗したものに別れてしまったことが原因だと考えられる。