AI 竜星戦 2017 - MATSUZAKIの日記

Raynzで出場して、予選11位突破(参加者全員突破だけど)、本線6位でした。
またPolicy network + value network + owner networkの重み共有による教師あり学習について、独創賞をもらいました。

目的関数としてOwnerとValueの二乗誤差を足し合わせることでValueの寄与を1/361にすることで棋譜生成無しでもVNの学習出来ています。
# この部分についての詳細は「Rayn の技術と自戦記 UEC 杯3 位への歩み」にあります。
しかし、上位8位付近までのソフトでは棋譜生成と強化学習に成功している状況ではVNとPNの精度でじわじわ押されていた感がありました。

Raynzの構成としては、Rn.4.20部分の思考エンジンと、Tripleizeさんによる1中央サーバー+10ワーカーでのリーフ並列になってます。
春のUEC版Raynから竜星戦版Raynzで、Rn部分で+145、分散処理部分で+200程度は強くなっているのに対して、他ソフトの話を聞くと+600だったり
前バージョンに4子だったり、勝率100%だったりと景気のいい強化っぷりにはついていけてなかったようです。

OSS公開してることでいくつかのソフトの対局相手・調査対象として使われているようで、コンピューター囲碁界隈の底上げには繋がってよかったのかな…