teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]

【重要】teacup. byGMOのサービス終了について
 <思いやりのあるコミュニティ宣言>
 teacup.掲示板は、皆様の権利を守りながら、思いやり、温かみのあるコミュニティづくりを応援します。
 いつもご協力いただきありがとうございます。

 投稿者
 メール
  題名
  内容 入力補助画像・ファイル<IMG>タグが利用可能です。(詳細)
    
 URL
[ ケータイで使う ] [ BBSティッカー ] [ 書込み通知 ]


Aoba駒落ちのGUIへの登録に失敗します。

 投稿者:masa  投稿日:2021年12月10日(金)19時20分9秒
編集済
  Aoba駒落ちOpenCL版のGUIへの登録に失敗します。
CPUは2950x、GPUは GTX1080tiです。
dataディレクトリのtune-ocldev0-sgemmb-b25m256n63k256H.txt
の内容です。
# CPU AMD Ryzen Threadripper 2950X 16-Core Processor  1800.11 (sse2,avx) 32 3500
NLM:16
NLN:8
NPM:16
NPN:8
NPK:16
TUS:3163

登録に成功する場合のtune-ocldev0-sgemmb-b25m256n63k256H.txtです。
CPUはi9-10850K、GPUは RTX3090です。
# GPU NVIDIA GeForce RTX 3090 471.41 82 1695
NLM:8
NLN:8
NPM:4
NPN:4
NPK:8
TUS:38

GPUが認識されていないのでしょうか。
 
 

Gumbel MuZero

 投稿者:匿名ファン  投稿日:2021年12月 8日(水)12時35分21秒
  また興味深いものが出てきましたね。
真偽不明ですが、PDF中で、
ポリシーネットワークにディリクレノイズを加えてアクションを選択し、摂動されたポリシーを用いて探索を行う。しかし、これではポリシーの改善を確実に行うことはできない。
と言っていますね。

https://openreview.net/forum?id=bERaNdoegnO

 

Aoba駒落ちを終了しました。

 投稿者:山下  投稿日:2021年12月 4日(土)17時15分0秒
  6ヵ月で1300万棋譜を作成して駒落ちをルールだけから深層強化学習させるAoba駒落ちを終了しました。
香落ちは上手が三間に振れば下手も振る相振り、角落ちは下手の陽動三間飛車、二枚落ちは銀多伝に似た新型に、など
面白い発見があったと思います。
棋譜作成や遊んでいただいた皆様、ありがとうございました!
論文や資料などはこちらです。


GPWでAoba駒落ちの発表をしました
https://524.teacup.com/yss/bbs/3840
 

YSS 1.0の自己対戦の棋譜

 投稿者:山下  投稿日:2021年11月25日(木)19時35分51秒
  30年前に最初に作ったYSS1.0がエミュレータで動いたので自己対戦の棋譜を作ってみました。

YSS 1.0の自己対戦の棋譜
http://www.yss-aya.com/komaochi/csa/sampleyss100.html

弱いのですが、局面を全く動かさずに(1手も読まない)利きテーブルと
駒配置だけから優先順位で指し手を決めてる割には
結構まともな将棋になっています。
しかし、この頃の将棋はその手を指した理由、を作者が完璧に説明出来て
なんか妙な安心感はあります。

YSS 1.0 のソースコード(N88-BASIC)
http://www.yss-aya.com/yss100.html
 

Leela Chess Zeroの現状

 投稿者:山下  投稿日:2021年11月24日(水)18時14分53秒
  ACGでEndgameデータベースと比較してLC0の性能を調べてる論文があるのですが、
それにLC0のまとめがあって分かりやすかったです。

・2020年にAlphaZeroの強さを超えた
・「残りの投了までの手数」(moves left)を予想
・「勝ち、負け、引き分け」(WDL)を個別に予想
・「T」ネットワークは自己対戦から学習され
・「J」ネットワークは「T」で作られた自己対戦の棋譜から学習
・「J」の方が強い

・・・。TもJも同じに思えますけど何が違うのでしょう?
下を見るとJは「jhorthos」さんが独自に作ってるようで
色々学習パラメータが違うようです。
40ブロックで作った棋譜を20ブロックで学習、みたいな感じなのでしょうか?
(その方が20ブロックは強くなるので)

What is Lc0? (for non programmers)
https://lczero.org/dev/wiki/what-is-lc0-for-non-programmers/

On the Road to Perfection? Evaluating LeelaChess Zero Against Endgame Tablebases
https://icga.org/wp-content/uploads/2021/11/ACG_2021_paper_13.pdf
 

Re: MixNetとSwishで+104 ELO

 投稿者:山下  投稿日:2021年11月24日(水)16時41分49秒
  > 強化学習で連続的に学習する場合どうなんでしょうか。

調べるとCosine Annealingって2016年からある、学習率を変動させながら小さくする手法なんですね。
論文だと追い抜くのが学習の最後の方なので、だらだら強化学習する場合ちょっと心配ですね。
最小の学習率、を段階的に変えて行く感じ?なのでしょうか。

参照の上はMobileNetが効果的で、PUCTを少し変形させると成績いいよで
下は探索木を2つ持って、一つは通常探索、もう一つはミニバッチ作成専用、ですか。

KataGoが作った学習用棋譜の方がはっきりLZよりいい、というのが一番役に立つかも。
KataGoの棋譜ってPolicyの分布や地合いなどが別ファイルになっていて使いずらそうでしたけど
SGFだけでも十分ぽいですね。
 

Re: MixNetとSwishで+104 ELO

 投稿者:zakki  投稿日:2021年11月24日(水)10時50分51秒
  こういうケースだとCosine Annealing便利ですね。強化学習で連続的に学習する場合どうなんでしょうか。

それから参照されてるTristanの別の論文も面白そうですね。

Improving Model and Search for Computer Go
https://arxiv.org/abs/2102.03467

Batch Monte Carlo Tree Search
https://arxiv.org/abs/2104.04278
 

MixNetとSwishで+104 ELO

 投稿者:山下  投稿日:2021年11月23日(火)18時23分47秒
  今夜から開催されるACGでコンピュータ囲碁に関する発表も
あって、下のMixNetとSwishを使ったら+104 ELO強くなった、
というTristanの論文が面白そうです。

T. Cazenave, J. Sentuc and M. Videau
Cosine Annealing, Mixnet and Swish Activation for Computer Go
https://icga.org/wp-content/uploads/2021/11/ACG_2021_paper_9.pdf

Advances in Computer Games 2021
https://icga.org/?page_id=3328
 

Re: 電竜戦のA級の先手勝率は72%

 投稿者:山下  投稿日:2021年11月23日(火)13時40分57秒
  ここまで差が出るのか、と少し疑問ではあります。
PUCTだと勝率が不利な方は多くの候補手を選ぶようになるので
そのせいで、最初から不利と思ってる後手がさらに負けやすくなってる気もします。
後手の勝率を初期局面では0.50になるように補正してやると
もう少し後手が勝つ気もします。
 

電竜戦のA級の先手勝率は72%

 投稿者:山下  投稿日:2021年11月22日(月)22時02分59秒
  電竜戦のA級の90局の先手勝率は
先手の63勝23敗4千日手、
で72%、と7割超えてるんですね。

電竜戦は先手、後手2局で1セットなので公平ですが
先後が乱数で1局しかしない選手権だと、運不運の差が大きすぎるかも。

第2回電竜戦 A級
https://golan.sakura.ne.jp/denryusen/dr2_production/league_table_pa.html
 

レンタル掲示板
/318