teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]


新着順:65/3173 記事一覧表示 | 《前のページ | 次のページ》

Re: AobaZeroで学習される局面の手数の割合

 投稿者:zakki  投稿日:2021年12月27日(月)15時04分28秒
  通報
  egの自己対局(この部分に関してはKataGoと同一)での手数とPolicy Surprise Weightingの平均値のグラフです。
19路の囲碁だと50~150手目ぐらいがネットワークの生出力値と探索結果の差が大きくてそれ以降はどんどんPNやVNとの差が減っていて、囲碁の難しさは中盤>序盤>終盤のようです。
400手目以降はサンプル数10とかでぶれてます。

将棋と囲碁でゲーム性は違いますが似たような統計値使って調整できるんじゃないかと思います。

https://github.com/lightvector/KataGo/blob/master/docs/KataGoMethods.md#policy-surprise-weighting

 
 
》記事一覧表示

新着順:65/3173 《前のページ | 次のページ》
/3173