2016年3月14日月曜日

アルファ碁も採用している囲碁アルゴリズムのモンテカルロ法のわかりやすい資料:将棋は苦手らしい

アルファ碁とイ・セドルの対局がめっちゃ盛り上がっているけど、そのアルファ碁が採用している
アルゴリズムであるモンテカルロ法に関するわかりやすい資料を、機械学習研究会というところが
公開していたので、興味のある人はこれを見てみるとよいかと。
モンテカルロ⽊木探索索の理理論論と実践

どうもこれ、ランダムシミュレーションの結果で、各手の勝率分布を評価していくみたいな方法の
ようで、評価関数無しでも探索できるという画期的なアルゴリズムらしいよ。そんでもって面白いのが、
今回のアルファ碁とイ・セドルの対局の結果を見ていたら、将棋でもこの方法を採用すれば、
今の将棋ソフトより全然強いのができるんじゃね?って思うじゃん?ところが、どうもこの方法は、
囲碁は得意だけど、将棋は苦手らしいのよ。

なぜかというと、囲碁は打つごとに選択肢が減っていくけど、将棋は指しても指しても、長く続く、
みたいな構造のゲームだかららしい。

というのが、私が一通りこの資料読んで理解できた内容なんだけど、一度読んでみるとよいかと。