HOME > 研究活動・産学官連携 > ネットジャーナル > ネットジャーナル53

ネットジャーナル53

解説

解説1:運動の相互知覚を通したコミュニケーションの進化

運動のみからコミュニケーションを行うために、他の個体までの距離がわかるセンサと車輪のみから構成されるロボットを用意。ロボットはリカレントニューラルネットワークによって制御されセンサから感知した他のロボットの動きに基づいて行動を行う。3体のロボットは「お互いに離れずに一定距離以上進む」というタスクが課され、それを達成できるように遺伝的アルゴリズムによって進化する。3体がまとまって進む方向は決まっておらず、ロボット同士がコミュニケーションを行って進行方向を決定する。

図

図

本文にもどる

解説2:ディープラーニングによるロボットの自己位置推定

ロボットの一人称視点画像とそのときの自己位置との関係を学習する畳み込みニューラルネットワーク(CNN)を用いて自己位置推定を行う。世界がブロック単位で構成されているゲーム空間であるMinecraft(https://minecraft.net、 http://planetminecraft.com/project/monumental-imperial-city)上で実験を行い、未知のデータに対する精度、ノイズに対する頑健性の検証を行った。

ロボットが動きながら得られる複数の画像情報を自己位置推定に利用するために、CNNに再帰的な構造を追加したリカレント型畳み込みニューラルネットワーク(RCNN)を自己位置推定に用いて、そのときの性能を検証。実験の結果、RCNNはCNNによる一枚の画像からの推定よりも、また、CNNによる複数の推定結果の平均よりも、高い精度で推定可能であることを示した。

図

図

本文にもどる

解説3:Expectimaxによるゲーム木探索

通常のMinimax法に対しチャンスノードと呼ばれる確率的な分岐点を導入し、不確定ゲームにおいてMinimax探索を行う手法。デジタルカーリングへの適用にあたっては、①候補手である投球情報には実数値が含まれるため無数に存在する、②デジタルカーリングではAIの出力した手(投球情報)に乱数が加わるため、生じうる局面が不確定であるという2つの課題があり、これに対しては、①盤面全体に格子状に細かく離散化した座標を設定し、その座標を投球の目標座標として有限個の候補手を生成する、②生じうる局面を「狙った座標から一定半径内の座標にズレた場合に生じる局面」に限定し、候補手の評価を生じうる複数の局面のから求められる評価値の期待値により候補手の評価を行うことで課題を解決している。

これまで、デジタルカーリングにおける公式大会は二回行われており、一回目は準優勝、二回目は優勝している。

図

図

本文にもどる

ページの先頭へ