TASさんのメモ帳

TAS動画作成などをしております。動画一覧: http://www.nicovideo.jp/mylist/18908465

Deep LearningでぷよぷよAIを作ってみる

https://github.com/mizusearchdemon/DeepuyoLearning

chainerrlのquickstartのネットワークそのままで試したら、やたらと2個組みを作りたがる子になってしまった。。

やるべき事は、

盤面を色別に分ける
数手前の盤面を入力に含める
QFunctionのネットワーク構成を検討する
GPUを使ってくれない原因を調べる

あたりかな。

強い、弱いは後回しで、とりあえず大連鎖を組ませたい。