teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]

 <思いやりのあるコミュニティ宣言>
 teacup.掲示板は、皆様の権利を守りながら、思いやり、温かみのあるコミュニティづくりを応援します。
 いつもご協力いただきありがとうございます。

 投稿者
 メール
  題名
  内容 入力補助画像・ファイル<IMG>タグが利用可能です。(詳細)
    
 URL
[ ケータイで使う ] [ BBSティッカー ] [ 書込み通知 ]


Re: プロ棋士とfloodgateのレート

 投稿者:山下  投稿日:2020年 9月28日(月)23時04分46秒
  千田さん、技巧2のdepth11,12とも50局対戦されていたのですか。
貴重なデータでありがたいです。
以前チェスソフトの開発者のDon Daileyが、
持時間を増やしたときのレートの伸びはソフトより人間の方がはっきり高い、と言われてました。
 
 

(無題)

 投稿者:48  投稿日:2020年 9月28日(月)11時54分22秒
  メモリが16GB程度ではハッシュテーブルが考慮時間分もたない気もしますが
以前から千田先生が言われてるようなgikou2のdepth11か12のレーティングにも近いのですね。
http://blog.livedoor.jp/mizumon_/archives/20452513.html

次はプロ棋士にAobaZeroのp800と対戦して頂きたいです。
 

プロ棋士とfloodgateのレート

 投稿者:山下  投稿日:2020年 9月27日(日)22時00分30秒
編集済
  プロ棋士のfloodgateでのレートを推定してみました。
基準となるのはプロ棋士の千田さんが2015年にAperyと持時間1時間1分で54局対戦して
勝率2割(10勝40敗4千日手)だったことです。

Apery_WCSC25 1時間(2015年6月)
http://blog.livedoor.jp/mizumon_/archives/728040.html

千田さんのマシンは「i7_5960X_8c 16GB」
E5-2687W(3.1GHz, 8コア,16スレッド)で8スレッド使ってfloodgateで apery_WCSC25_E5-2687W_8t で走らせました。
495局対戦して3066点。
http://wdoor.c.u-tokyo.ac.jp/shogi/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=apery_WCSC25_E5-2687W_8t

floodgateは5分10秒。1手15秒として1手60秒は4倍。思考時間10倍で+330とすると、4倍で+199。
3066+199 = 3265

3265のAperyに勝率2割、は 240点差。千田さんの2015年は3025点。

プロ棋士のレートを計算してるページ(棋士別成績一覧)では、千田さんの2015年6月のレートは1683点。
http://kishibetsu.com/2015R/1291.html
このページのレートに 1342点 (3025-1683) 足せば floodgate のレートに一致します。

現在のトップは藤井聡太二冠の1978点(棋士別サイト)なので+1342でfloodgateでは3320点。

藤井聡太二冠 1978点(2020-09-27)   floodgate 3320?
千田さん     1837点(2020-09-27)   floodgate 3179?
             1683点(2015-06-02)   floodgate 3025?


思考時間10倍で+330、は下を基準としています。
KristallWeizenが
1手1000k -> 100m で +712 (100倍)。10倍で+356
elmoが
1手1000k -> 10m  で +303

レート3100点ぐらいから10倍で+356と+303なので、中間をとって+330としました。
(10倍で+330は2倍で+99です)

Krist_483_473stb_16t_100m    3962     +712 (100倍)
Krist_483_473stb_1000k       3250     +443
Krist_483_473stb_100k        2807

elmo_WCSC27_479_4t_10m       3330     +303
elmo_WCSC27_479_1000k        3027     +372
elmo_WCSC27_479_100k         2655
 

互角局面集を使うとAobaZeroは +150 ELOほど弱くなる

 投稿者:山下  投稿日:2020年 9月18日(金)19時25分46秒
編集済
  AobaZeroは対Kristallweizenとの棋力計測に磯崎氏が作成された互角局面集を使っています。
これを使わずに「やねうら王 標準定跡」を相手側だけつかうようにすると

AobaZero w1650の1手800 playoutは

Kristallweizen 1手500k 相手だと +114 ELO 強く、
elmo           1手346k 相手だと +155 ELO 強くなります。

これは互角局面集にAobaZeroが指さない戦型(穴熊や先手振飛車、対振で船囲いから急戦など)が
含まれてるためと思われます。

AobaZero(w1650)の1手800playout 対 Kristallweizen、elmoで互角局面集、standard_book.dbを使った場合。
AobaZeroは一切乱数性なし。

Kristallweizen 1手500k           勝 分 敗 局数 (宣 千 宣) 先手勝率        勝率   95%    ELO
互角局面集                      348-22-430 800 (183-14-4)(397-381,0.510), 0.449(0.034)( -35)
standard_book.db, 同一棋譜 3局, 482-15-303 800 (268- 9-1)(401-384,0.511), 0.612(0.033)(  79) +114差

elmo           1手346k
互角局面集                      580-11-209 800 (338- 9-0)(412-377,0.522), 0.732(0.030)( 174)
standard_book.db, 同一棋譜 5局, 693- 5-102 800 (423- 3-2)(403-392,0.507), 0.869(0.023)( 329) +155差

※1 standard_book.db は v4.73_book の「standard_book.zip : やねうら王 標準定跡」
※2 elmoは「elmo WCSC25版」に付属の standard_book.db を使うと800局で同一棋譜が5局から75局に増えます。
    AobaZero側で最初30手までは勝率2%以内ならsoftmax samplingで選ぶようにすると75局が5局程度に減ります。
    最終的な勝率も0.879程度とあまり変わらないです。

自己対局用に互角の局面集を公開しました
http://yaneuraou.yaneu.com/2016/08/24/%E8%87%AA%E5%B7%B1%E5%AF%BE%E5%B1%80%E7%94%A8%E3%81%AB%E4%BA%92%E8%A7%92%E3%81%AE%E5%B1%80%E9%9D%A2%E9%9B%86%E3%82%92%E5%85%AC%E9%96%8B%E3%81%97%E3%81%BE%E3%81%97%E3%81%9F/
やねうら王 定跡ファイル詰め合わせ
https://github.com/yaneurao/YaneuraOu/releases/tag/v4.73_book
 

AWAKEの映画

 投稿者:山下  投稿日:2020年 9月15日(火)22時33分29秒
  2015年電王戦の阿久津8段 vs AWAKEをモチーフにした映画が
今年の12月に公開されるそうです。
主役の吉沢亮さんは2021年のNHK大河の主役を演じる予定の俳優さんです。
CSAも少し手伝っており滝沢さんと私が昨年、撮影現場にお邪魔していました。

吉沢亮、AI将棋のプログラミングにのめり込む! 伝説の将棋電王戦描く「AWAKE」12月公開
https://eiga.com/news/20200812/4/
映画「AWAKE」公式サイト
https://awake-film.com/
 

AlphaZeroは思考時間が長いと先手勝率が高い

 投稿者:山下  投稿日:2020年 9月11日(金)20時09分7秒
編集済
  今まで気づかなかったのですが、論文のFig 2をよく見ると
AlphaZeroはelmoに対して思考時間が長いほど、先手での勝率が上がっています。

下はグラフから読み取ったAlphaZeroの対elmoの勝率です。
グラフに合わせて、AlphaZeroが後手のとき、先手のとき、の勝と引き分けの値、
そして先手と後手での勝率の差です。

思考時間が1/100の時は、先手と後手の差は+30 ELO、勝率で0.54程度の差で、
これなら通常の将棋の勝率に近いです。
しかし、思考時間を増やすごとに先手と後手の差は広がり、
same time(持時間3時間)では +390 ELO もの差になっています。

AlphaZeroは探索速度は4TPUで 58000回/秒 なので持時間3時間の100分の1、108秒だと
1手1秒程度かと思います。elmoは 44 threadで 25100k /秒 です。

現在のAobaZero(w1650)の勝率は
1手  800 playout 対 elmoの1手   346k   勝率 87.9%  (先手勝率 89%、後手勝率 87%)
1手 8000 playout 対 elmoの1手  3462k   勝率 80.9%  (先手勝率 83%、後手勝率 79%) 先手で宣言勝ちは94%の割合
1手58000 playout 対 elmoの1手 25100k   勝率 計測中

まだ先手勝率が上がっていく気配はないです。
1手1秒の再現実験でも20日間かかり、持時間3時間で1000局の再現実験は3年ぐらいで厳しそうです。


AlphaZeroの対elmoでの思考時間を変えた時の勝率(グラフから読み取った数値)

     勝  引分  勝率    ELO   先手と後手の差(ELO)
1/100
  42.8%, 5.6% (45.6%   -31 )
  49.6%, 0.5% (49.9%    -1 )  +30
1/30
  68.0%  2.1% (69.1%  +140 )
  79.1%  0.9% (79.6%  +237 )  +97
1/10
  69.9%  2.8% (71.3%  +158 )
  91.2%  0  % (91.2%  +406 ) +248
1/3
  80.0%  1.6% (80.8%  +250 )
  95.2%  0.8% (95.6%  +535 ) +285
same time
  84.2%  2.2% (85.3%  +305 )
  98.2%  0  % (98.2%  +695 ) +390

A general reinforcement learning algorithm that masters chess,shogi,and Go through self-play
https://science.sciencemag.org/content/sci/362/6419/1140.full.pdf
 

技巧2を基準にしたAobaZeroのレート

 投稿者:山下  投稿日:2020年 9月11日(金)20時07分47秒
  floodgateだとAobaZeroは max_moves が多くレートが正しく測れていない感じです。
gikou2_1c は悪くなると投げて max_moves にならないので技巧2相手だけでレートを計算すると、

過去30日だと gikou2_1c は w1705 から w1905 までの11個に対し72勝30敗
勝率 0.706 は 152 ELO差。技巧2 が 3300 なので、AobaZeroは 3148 程度で、
現在の3000程度より150ぐらい上かもしれません。
 

自己対戦と、対Kristallweizenとの宣言勝ちの推移を先手番、後手番で

 投稿者:山下  投稿日:2020年 9月11日(金)13時00分0秒
編集済
  自己対戦と、対Kristallweizenとの宣言勝ちの推移を先手番、後手番で分けて調べてみました。

10000棋譜ごとの自己対戦での宣言勝ちの推移(上のグラフ)
http://www.yss-aya.com/20200911declare.png

1000万棋譜から先手番での宣言勝ちが増えています。
現在もゆるやかに上昇中です。
ただ後手番の宣言勝ちは増加が止まってます。
それでも10000局で合計400局、4%程度が宣言勝ちなだけです。


10000棋譜ごとの自己対戦での引き分けの数(中のグラフ)
http://www.yss-aya.com/20200911draw.png

こちらは引き分けの数です。やや最近は増加傾向です。
800局なので全体の8%程度が引き分けです。
512手超えはほぼなく、99%以上が千日手です。


対Kristallweizenでの宣言勝ちの推移(下のグラフ)
http://www.yss-aya.com/20200911declare_krist.png

対Kristallweizenでもw950(600万棋譜)から先手番での宣言勝ちの
割合が増えています。
w1360(1000万棋譜)ではもうすでに、先手では60%の勝、と
大きく差が出てます。自己対戦では1000万棋譜で
ようやく先手が増えだしたのとは、かなり異なります。

現在では先手の勝ちの75%近くは宣言勝ち、後手では35%、と
大きな差が出ています。
ただ、先手、後手の勝率には差はほぼないです。AlphaZeroは
対elmoでは先手勝率98%、後手84%と大きな差があります。
 

KataGoのKataは日本語の「型」

 投稿者:山下  投稿日:2020年 9月 8日(火)19時42分4秒
  どこの言葉なんだろうと思ったら日本語の武術の「型」から来てるそうです。
強化学習で、自分自身を絶え間なく鍛錬して、独自のフォームを完成させる自己対戦のボット、
からの連想だそうです。

The Name of KataGo
https://github.com/lightvector/KataGo/issues/311
 

CGFオープンが10月10日(土)、11日(日)に開催

 投稿者:山下  投稿日:2020年 8月30日(日)12時06分23秒
  CGFオープンが10月10日(土)、11日(日)に開催されます。
今年は新型コロナウイルスの影響で、オンラインでの開催となります。
当日の対局の連絡などはSlack、Zoomで行います。
皆様のご参加をお待ちしております。

参加申し込み締め切り 2020年 10月 5日(月)
大会                 2020年 10月10日(土) 10:00-17:00  9路盤のみ
                     2020年 10月11日(日)  9:30-16:00 19路盤のみ
会場:               オンライン開催

CGFオープン2020、大会要綱
http://hp.vector.co.jp/authors/VA012620/cgf2020/cgf2020.html
現在の参加者予定リスト
http://hp.vector.co.jp/authors/VA012620/cgf2020/list2020.html
CGFオープン
http://hp.vector.co.jp/authors/VA012620/
 

レンタル掲示板
/290