TASさんのメモ帳

TAS動画作成などをしております。動画一覧: http://www.nicovideo.jp/mylist/18908465

Deep LearningでぷよぷよAIを作ってみる

https://github.com/mizusearchdemon/DeepuyoLearning

chainerrlのquickstartのネットワークそのままで試したら、やたらと2個組みを作りたがる子になってしまった。。

やるべき事は、

  • 盤面を色別に分ける
  • 数手前の盤面を入力に含める
  • QFunctionのネットワーク構成を検討する
  • GPUを使ってくれない原因を調べる

あたりかな。

強い、弱いは後回しで、とりあえず大連鎖を組ませたい。