AlphaGo

各所で話題になってるGoogleDeepMind 囲碁の論文が面白い。

https://storage.googleapis.com/deepmind-data/assets/papers/deepmind-mastering-go.pdf

RAVEやProgressive wideningのようなUCT系の探索ノード決定ヒューリスティックを使わず、ニューラルネットが吐いた確率分布を使ってたりはするけど、rollout policyやtree policyはもろいままでの囲碁AIどおりだし、ニューラルネットへの入力にダメの数やシチョウ入れてるので、一部ニュースの汎用AI作ったら囲碁も強かったんだいって言うのは無理がある気が・・・