teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]

【重要】teacup. byGMOのサービス終了について
 <思いやりのあるコミュニティ宣言>
 teacup.掲示板は、皆様の権利を守りながら、思いやり、温かみのあるコミュニティづくりを応援します。
 いつもご協力いただきありがとうございます。

 投稿者
 メール
  題名
  内容 入力補助画像・ファイル<IMG>タグが利用可能です。(詳細)
    
 URL
[ ケータイで使う ] [ BBSティッカー ] [ 書込み通知 ]


優勢な局面でうっかり千日手?

 投稿者:mak  投稿日:2022年 4月29日(金)05時50分22秒
  金と銀と角の打ち換えで一回のループがかなり長いので両者勘違いしています
Suisho6test_TR3990X vs. DLSuisho1224_RTX3090
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2021/12/25/wdoor+floodgate-300-10F+Suisho6test_TR3990X+DLSuisho1224_RTX3090+20211225050006.csa/111
sfen 7rl/1R3sk2/p1+P1Sp3/2p1p1plp/9/2g2nPPP/P1N1PP1G1/2+p3S2/L4GK1L w P2bgs2n3p
 
 

優勢な局面でうっかり千日手?

 投稿者:mak  投稿日:2022年 4月29日(金)05時38分50秒
  千日手の一回のループが長手数のときに評価値の上では千日手を打開できると勘違いしているかのようなことがやねうら王でも以前に見たことがあります。読みが深くなりすぎて末端の局面評価が不適切になっているのだと思います。  

優勢な局面でうっかり千日手?

 投稿者:tns  投稿日:2022年 4月26日(火)10時26分41秒
  floodgateに流していたAobaZero_w3960_n_p30kが優勢な局面で千日手にしてしまった棋譜を発見しました.122手目の局面では69角で特に問題なく先手優勢みたいですが,千日手になる79銀を選んでしまいました.評価値を見るに千日手になるということを認識していないのでしょうか.

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2022/04/26/wdoor+floodgate-300-10F+AobaZero_w3960_n_p30k+Yane710-128_R5-5625U_6t+20220426080011.csa
 

相掛かりで素抜き狙いのただ捨て▲85角の王手

 投稿者:山下  投稿日:2022年 4月20日(水)12時55分45秒
  floodgateでちょっと驚いたのがAobaZeroが下図の▲85角打、という相手の飛車の利きに
ただで打つ王手を読んでいたことです。
以前のNNの入力に利きを入れてない版なら指せなかった・・・と思い調べると
そうでもなく、利きなしの w3880 でも着手確率90%の1番目で読んでました。
この手は簡単?なようです。
長い利きの認識は苦手なのにこれだけ高いとは、これに類似した局面が学習で多発してるのでしょう。

このただ捨ては水匠5でも最善手のようで、それを△同飛と取って▲53桂成から素抜くまで当然の?流れのようです。
納得しずらいのですが・・・。
この手を含め、この先の55手目までノータイムで進める相手の ntest も不気味ですが。

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F2022%2F04%2F18%2Fwdoor%2Bfloodgate-300-10F%2Bntest%2BAobaZero_w3953_n_p800%2B20220418210005.csa&go_last=on&move_to=45
 

(無題)

 投稿者:48  投稿日:2022年 4月20日(水)11時33分4秒
  なるほど,評価値はPolicy温度の影響大ですか。
旧バージョンと対戦させた場合に新しい方が千日手に気付かずずっと大きな評価値を出していたのが印象的でした。
 

Re: v32のCPU負荷

 投稿者:山下  投稿日:2022年 4月19日(火)13時08分35秒
編集済
  800playoutまでしか調べてなかったので1手6万で速度を調べてみました。
初期局面と終盤の詰が絡む局面、の2つです。
元々Swishで25%ぐらい遅くなってたのが、dfpnありだと終盤で2倍近く遅くなってました。
ただ、dfpnなしのv30も同じぐらいの遅さで原因がよく分かりません。
8コアマシンで動かしたのですが、途中CPU使用率が1200(12スレッド)ぐらいになりGPUの負荷も
80%とか下がるので、コア数は8コアだと足りない感じです。

> -sオプションに関わらず時間切れすることがあります

これはdfpnで停止フラグを見てないせいだと思います。追加してみます。
そもそもノード数が多い局面でdfpnのノード数も比例して増やすのが効果的なのか
よく分かっていませんが・・・。

> また評価値スケールがかなり大きくになったような感じですね。雰囲気が違います。

Policy温度を1.8に上げた影響で、序盤だと全部の手を1度は探索する感じになってます。
学習棋譜の分岐も増えてる感じです。
初手の▲26歩の確率が35%から20%まで下がり、▲76歩は0.6%から7%に上がっています。
勝率調整で学習が一時期失敗していた影響もあるかもですが。

       v18      v28     v30      v32
初期 12606/s  9887/s   9887/s  10066/s
終盤 11220/s  8378/s   6625/s   6763/s

v18 利きなし
v28 利きあり、Swish、3手詰
v30 利きあり、Swish、3手詰、Policy温度1.8
v32 利きあり、Swish、3手詰、Policy温度1.8、dfpn

1手60000playout、"-b 7 -t 21"(ミニバッチ 7、スレッド数 21)
RTX 3090, Ryzen 7 3700X 8コア 16スレッド
 

v32のCPU負荷

 投稿者:48  投稿日:2022年 4月19日(火)05時24分2秒
編集済
  v32を試してみましたがv18比ですがCPU負荷が増えた分NPSが大幅に減っていますね。
p800はともかく高負荷時デュアルソケットなどのコア数が多いマシンでしたら問題ないのでしょうか?
また評価値スケールがかなり大きくになったような感じですね。雰囲気が違います。
あと,レアケースかもしれませんが終盤1スレッドだけ負荷が残って-sオプションに関わらず時間切れすることがあります。詰み探索スレッドかと思います。
 

AobaZeroにdfpn探索を追加しました

 投稿者:山下  投稿日:2022年 4月18日(月)19時47分12秒
編集済
  ノードの訪問回数が10回で1000倍の1万ノード、100回で10万ノード、
とdfpnでの詰を読むようにしました。CPUコアは1.2倍ほど必要とします。
dfpn自体は保木さんが昔マルチスレッドで動くdfpnをBonanzaに
実装されていたので楽でした。
ただ、ノード数を増やしてもほとんど強くならないです。
全ノードで10万ノードを常に、でも+60 ELO程度でした。
これだけ読むとCPUの処理が多すぎてGPUが遊んで7倍ぐらい遅くなります。
詰将棋よりもPolicyの読み抜けを減らす方が効果的なのかもしれません。
そもそも詰がある局面に持っていきにくい棋風になってる?のかもしれませんが・・・。

他に未探索のノードの勝率の初期値を負け(-1)から「(親の勝率)/2-0.65」にしてみました。
これも+20ELOあるかどうかの微妙な効果です。
 

Re: KataGoの自己対戦から見るコミ、ルールによる勝率

 投稿者:山下  投稿日:2022年 4月17日(日)03時07分19秒
編集済
  >「中国ルール、コミ6.5、ただし白が最初にパスすればコミ7.5」

メイエンさんの「世界の囲碁ルール」によるとこのルールは
「収後」と呼ばれるものだそうです。
「収後」とは「最後」のダメを「収める」という意味で
黒が最後のダメを詰めた場合に集計で黒が一目支払います。

台湾では
「日本ルール」
「収後つき中国ルール」
の2つが現在も普通に使われているそうです。
「収後」は結果を日本ルールに合わせた中国ルールで
1966年までは中国でも使われていたそうです。

世界の囲碁ルール
https://www.amazon.co.jp/dp/4818206741
KataGoの自己対戦から見るコミ、ルールによる勝率
https://524.teacup.com/yss/bbs/3901
 

AobaZeroが読み抜ける局面

 投稿者:山下  投稿日:2022年 4月15日(金)03時27分43秒
編集済
  AobaZeroを水匠5と対戦させて勝率が30%以上下がった局面を調べてみました。

行の先頭に「*」が付いているのは詰関連です。
予想通り長手数の詰将棋の読み抜けが多かったのです。
意外と入玉宣言のミスも多いです。敵陣に残った敵の駒1枚を
自分のもの、と判断してるケースが多いです。

大駒の長い利きの素抜きのうっかりも多いです。

一番最初の「ただ捨ての桂王手」は下の局面の▲74桂の王手です。
最初、意味が分からなかったのですが、単に▲89銀と龍を取ると
△87飛▲66玉△74桂▲75玉△86飛成と5手で詰まされるので、先に▲74桂と王手で
捨てて、△74桂を消してから龍を取る、狙いです。敵の打ちたいところに打て、ですね。
Policyは▲89銀が着手確率99%で1番目なのですが、▲74桂も6番目にはなってます。
将来的にはこういう手も1番目になるように、何か特徴を(浅い探索の結果?)追加しないと
いけないのかもしれません。

あと、今はすべてのノードで3手詰を読んでるのですが、これをすべてのノードで
dfpnの1000ノード読む(Rootは100k)としても、+40 ELO程度しか強くなりませんでした。
単純に詰将棋を読むだけではあまり強くならないようです。


AobaZero(w3923,1手800playout)と水匠5(1手200k)の331局から勝率が0.3以上下がって負けたもの
---------------------------------------------------------
  ただ捨ての桂王手で3手詰を防いで竜を取る
 *5手頓死
  取れば1手詰の飛成。王の近く。ただではない。
 *角金交換の角切り。取るとばらして11手詰。
  動いた金を同馬(距離3)で取ると王が龍で素抜かれる。入玉形
 *5手頓死。どのみち負け。
 *11手詰の途中
 *11手詰の途中
 *9手頓死。角金交換で角を渡したため頓死。
  入玉で後手25点。明らかに足りないので負けに気づく?
 *15手詰。
 *9手詰。負けの変化多し。7手前の△48銀が9手の詰めろで受けにくい。
 *7手詰。どのみち負け。
  同香と取れない金打ち(飛車当たり)。王が素抜き。
 *19手詰の途中。3手前の△44金の歩頭に捨てる手が好手か。
  馬のただ捨て王手で龍を龍で素抜き。
 *13手詰の途中。どのみち負け。
  歩頭に銀を読み抜け。▲同歩は1手詰、▲同金は必死。17手の詰めろ▲77歩が正着。
 *21手詰の途中。どのみち負け。
  角王手での馬素抜き(龍)を読み抜け。
  △15桂(歩頭に13手の詰めろ)。△42角▲同角成の時、17手詰になるように。
  ▲41飛打から▲52桂成で馬を素抜くのを読み抜け。王手ではない。
 *23手詰の途中。△87歩の叩き王手が入ってからは負け。
 *29手詰の途中。
  後手で26点なのに勝ちと思ってた?
  ▲86同歩がまずい。詰めろの連続で負け。普通に▲47歩で勝ち
 *11手の頓死。龍を取れない。
  91手目の▲65同歩が敗着?歩頭の△85桂から寄ってしまった。
  ▲57飛打が詰めろ(1手)馬取り
  後手がまだ自陣の駒含め27点、で先手勝ちと錯覚。
 *15手詰の途中。相穴熊
  ただの場所に▲44桂打の両取り。△同角(62)なら△52銀が▲92龍でただ。
  ▲53角成に△同金は1手詰、は分かってる。その前に飛車先を叩いたので▲27同飛が1番目
  △67角成(12)▲同金△78銀の読み抜け?▲同角は金がただ。

下の画像の局面
sfen ln1s4+B/1k2g4/1ppp1p3/4p3p/3P1P1p1/1PP1P2P1/2K1S3P/1+pSGG4/1+r6L b P2NSGB2p2lnr 81
 

レンタル掲示板
/319