teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]

【重要】teacup. byGMOのサービス終了について
 <思いやりのあるコミュニティ宣言>
 teacup.掲示板は、皆様の権利を守りながら、思いやり、温かみのあるコミュニティづくりを応援します。
 いつもご協力いただきありがとうございます。

 投稿者
 メール
  題名
  内容 入力補助画像・ファイル<IMG>タグが利用可能です。(詳細)
    
 URL
[ ケータイで使う ] [ BBSティッカー ] [ 書込み通知 ]


Re: 優勢な局面でうっかり千日手?

 投稿者:mak  投稿日:2022年 4月29日(金)15時08分48秒
  確かにこちらの局面は6八に金か銀を打って78で清算したときに同玉とすれば先手が受け切れる局面ですね。一方私があげた例はおそらく千日手を打開する手段がない例だと思います。
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2022/04/26/wdoor+floodgate-300-10F+AobaZero_w3960_n_p30k+Yane710-128_R5-5625U_6t+20220426080011.csa
 
 

Re: 優勢な局面でうっかり千日手?

 投稿者:山下  投稿日:2022年 4月29日(金)09時16分46秒
編集済
  v32で連続王手の千日手で負けるのを修正しようとして
王手を含むだけの千日手を負けとするバグが入っていました。
(連続王手は3度目だけど王が逃げる手で4度目、となるケースを除外しようとして)
この場合だと△78金(67)の王手が指せないと錯覚してました。
次版で修正します。ご指摘ありがとうございました。
 

優勢な局面でうっかり千日手?

 投稿者:mak  投稿日:2022年 4月29日(金)05時50分22秒
  金と銀と角の打ち換えで一回のループがかなり長いので両者勘違いしています
Suisho6test_TR3990X vs. DLSuisho1224_RTX3090
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2021/12/25/wdoor+floodgate-300-10F+Suisho6test_TR3990X+DLSuisho1224_RTX3090+20211225050006.csa/111
sfen 7rl/1R3sk2/p1+P1Sp3/2p1p1plp/9/2g2nPPP/P1N1PP1G1/2+p3S2/L4GK1L w P2bgs2n3p
 

優勢な局面でうっかり千日手?

 投稿者:mak  投稿日:2022年 4月29日(金)05時38分50秒
  千日手の一回のループが長手数のときに評価値の上では千日手を打開できると勘違いしているかのようなことがやねうら王でも以前に見たことがあります。読みが深くなりすぎて末端の局面評価が不適切になっているのだと思います。  

優勢な局面でうっかり千日手?

 投稿者:tns  投稿日:2022年 4月26日(火)10時26分41秒
  floodgateに流していたAobaZero_w3960_n_p30kが優勢な局面で千日手にしてしまった棋譜を発見しました.122手目の局面では69角で特に問題なく先手優勢みたいですが,千日手になる79銀を選んでしまいました.評価値を見るに千日手になるということを認識していないのでしょうか.

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2022/04/26/wdoor+floodgate-300-10F+AobaZero_w3960_n_p30k+Yane710-128_R5-5625U_6t+20220426080011.csa
 

相掛かりで素抜き狙いのただ捨て▲85角の王手

 投稿者:山下  投稿日:2022年 4月20日(水)12時55分45秒
  floodgateでちょっと驚いたのがAobaZeroが下図の▲85角打、という相手の飛車の利きに
ただで打つ王手を読んでいたことです。
以前のNNの入力に利きを入れてない版なら指せなかった・・・と思い調べると
そうでもなく、利きなしの w3880 でも着手確率90%の1番目で読んでました。
この手は簡単?なようです。
長い利きの認識は苦手なのにこれだけ高いとは、これに類似した局面が学習で多発してるのでしょう。

このただ捨ては水匠5でも最善手のようで、それを△同飛と取って▲53桂成から素抜くまで当然の?流れのようです。
納得しずらいのですが・・・。
この手を含め、この先の55手目までノータイムで進める相手の ntest も不気味ですが。

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F2022%2F04%2F18%2Fwdoor%2Bfloodgate-300-10F%2Bntest%2BAobaZero_w3953_n_p800%2B20220418210005.csa&go_last=on&move_to=45
 

(無題)

 投稿者:48  投稿日:2022年 4月20日(水)11時33分4秒
  なるほど,評価値はPolicy温度の影響大ですか。
旧バージョンと対戦させた場合に新しい方が千日手に気付かずずっと大きな評価値を出していたのが印象的でした。
 

Re: v32のCPU負荷

 投稿者:山下  投稿日:2022年 4月19日(火)13時08分35秒
編集済
  800playoutまでしか調べてなかったので1手6万で速度を調べてみました。
初期局面と終盤の詰が絡む局面、の2つです。
元々Swishで25%ぐらい遅くなってたのが、dfpnありだと終盤で2倍近く遅くなってました。
ただ、dfpnなしのv30も同じぐらいの遅さで原因がよく分かりません。
8コアマシンで動かしたのですが、途中CPU使用率が1200(12スレッド)ぐらいになりGPUの負荷も
80%とか下がるので、コア数は8コアだと足りない感じです。

> -sオプションに関わらず時間切れすることがあります

これはdfpnで停止フラグを見てないせいだと思います。追加してみます。
そもそもノード数が多い局面でdfpnのノード数も比例して増やすのが効果的なのか
よく分かっていませんが・・・。

> また評価値スケールがかなり大きくになったような感じですね。雰囲気が違います。

Policy温度を1.8に上げた影響で、序盤だと全部の手を1度は探索する感じになってます。
学習棋譜の分岐も増えてる感じです。
初手の▲26歩の確率が35%から20%まで下がり、▲76歩は0.6%から7%に上がっています。
勝率調整で学習が一時期失敗していた影響もあるかもですが。

       v18      v28     v30      v32
初期 12606/s  9887/s   9887/s  10066/s
終盤 11220/s  8378/s   6625/s   6763/s

v18 利きなし
v28 利きあり、Swish、3手詰
v30 利きあり、Swish、3手詰、Policy温度1.8
v32 利きあり、Swish、3手詰、Policy温度1.8、dfpn

1手60000playout、"-b 7 -t 21"(ミニバッチ 7、スレッド数 21)
RTX 3090, Ryzen 7 3700X 8コア 16スレッド
 

v32のCPU負荷

 投稿者:48  投稿日:2022年 4月19日(火)05時24分2秒
編集済
  v32を試してみましたがv18比ですがCPU負荷が増えた分NPSが大幅に減っていますね。
p800はともかく高負荷時デュアルソケットなどのコア数が多いマシンでしたら問題ないのでしょうか?
また評価値スケールがかなり大きくになったような感じですね。雰囲気が違います。
あと,レアケースかもしれませんが終盤1スレッドだけ負荷が残って-sオプションに関わらず時間切れすることがあります。詰み探索スレッドかと思います。
 

AobaZeroにdfpn探索を追加しました

 投稿者:山下  投稿日:2022年 4月18日(月)19時47分12秒
編集済
  ノードの訪問回数が10回で1000倍の1万ノード、100回で10万ノード、
とdfpnでの詰を読むようにしました。CPUコアは1.2倍ほど必要とします。
dfpn自体は保木さんが昔マルチスレッドで動くdfpnをBonanzaに
実装されていたので楽でした。
ただ、ノード数を増やしてもほとんど強くならないです。
全ノードで10万ノードを常に、でも+60 ELO程度でした。
これだけ読むとCPUの処理が多すぎてGPUが遊んで7倍ぐらい遅くなります。
詰将棋よりもPolicyの読み抜けを減らす方が効果的なのかもしれません。
そもそも詰がある局面に持っていきにくい棋風になってる?のかもしれませんが・・・。

他に未探索のノードの勝率の初期値を負け(-1)から「(親の勝率)/2-0.65」にしてみました。
これも+20ELOあるかどうかの微妙な効果です。
 

レンタル掲示板
/318