ひとつ前に戻る

囲碁の「次の一手タスク」をニューラルネットワークで作る

学習させて次の一手を打たせてみた1

棋譜（SGFファイル）を300個作成して、学習させて次の一手を打たせてみました。
学習局面数は4135個でした。

1		盤上に石が打たれていないときの黒の次の一手（初手）です。値が1番大きいものを赤、2・3番目のものをオレンジ、4番目のものを白その他をピンク色で表示しています。天元が0.437と一番大きい値となっています。棋譜の数がまだ50くらいのときはこの値が0.1程度で、棋譜数が100のとき、 0.2程度となり、棋譜数を増やすにしたがって値が増えていきました。青は実際に打った手です。
2		この局面でも値が一番大きい手がいい手になっています。値が2、3、4番目のものはイマイチですが。
3		この局面でも値が一番おおきいところがいい手になっています。ただし4番目に値がおおきいところ(白数字）はすでに打ってあるところと重なってしまっています。これ以降こういうことが多くなってしまっています。
4		この局面でも値が一番おおきいところと4番目におおきいところがいい手になっています。
5		この局面でも値が一番おおきいところがいい手になっています。また他の候補手もよいです。
6		この局面では3番目に値の大きいところがいい手になっています。
7		この局面では2番目に値の大きい手がいい手になっています。
8		この局面では1番値がおおきいところがいい手になっています。
9		ここでは値が大きいところはすでに石と重なっていたり、いい手にはなっていませんでした。
10		この局面では値が3番目に大きいところがいい手になっていました。

さてこの結果ですが、一番うまくいったところを取り出しました。
これ以外はこうまでうまくいっていませんでした。
同じ形でも90度回転していたりするとうまくいかなくなっていることも分かりました。

ひとつ前に戻る