teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]

 投稿者
 メール
  題名
  内容 入力補助画像・ファイル<IMG>タグが利用可能です。(詳細)
    
 URL
[ ケータイで使う ] [ BBSティッカー ] [ 書込み通知 ]


Re: 9路のPolicyを19路に流用

 投稿者:gg  投稿日:2018年 2月19日(月)10時53分57秒
  >逆はいまいちっぽいです
そりゃそうでしょう.狭い盤に出現する石の配置は広い盤にも
出現しますが,逆はあり得ません.別の例として,5路版は完全
解析されてますが,その知識は 7路盤には使えません.広い盤は
狭い版より(文字通り)世界が広いのです.
 
 

Re: 9路のPolicyを19路に流用

 投稿者:山下  投稿日:2018年 2月18日(日)22時15分42秒
  結局、GNU Go基準で、9路のPolicyは19路で624点弱くなりました(BayesEloで)。
9x9   DCNN_AyaF128a558x1    2286
19x19 DCNNAyaF128from9x9    1662

19路のPolicyは13路ではほぼ同じ強さで、9路では170点ほど弱いです。
19x19 DCNN_AyaF128a523x1    2350
13x13 DCNNAya795F128a523    2353
9x9   DCNN_AyaF128a523x1    2179

9路学習Policyは19路流用より100点程度強いだけですね。
 

Re: 9路のPolicyを19路に流用

 投稿者:山下  投稿日:2018年 2月16日(金)04時47分13秒
  GNU Goにも勝てないですか・・・  

9路のPolicyを19路に流用

 投稿者:山下  投稿日:2018年 2月15日(木)22時45分59秒
編集済
  19路のPolicyを9路、13路で流用はかなり有効なのですが、逆はどうかと思い試してみました。
9路、Ayaの1手10000playoutでの自己対戦100万棋譜から作ったPolicy(Filter128、Layer11、BNなし)
を19路に流用すると、初手の確率分布は下のようになります。
小目や33の確率がほとんどなくて、4線ぐらいがぼんやり高い感じです。
当然?ながら盤面全体を使う布石は打てず、直前の相手の周囲に打ちたがります。
囲碁では大は小を兼ねる、はありますが逆はいまいちっぽいです。

ネットワークは9路のCGOSで DCNN_AyaF128a558x1 で動かしているものです。
19路では DCNNAyaF128from9x9 で動かしています。
9路  http://www.yss-aya.com/cgos/9x9/cross/DCNN_AyaF128a558x1.html
19路 http://www.yss-aya.com/cgos/19x19/cross/DCNNAyaF128from9x9.html  序盤は19路用の定石使ってます。
9路、13路で動いている DCNN_AyaF128a523x1 は19路からの流用です。

19路での初手の確率分布。9路で学習させたものを流用
      A    B    C    D    E    F    G    H    J    K    L    M    N    O    P    Q    R    S    T
19:  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
18:  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
17:  0.0  0.0  0.0  0.1  0.1  0.1  0.1  0.0  0.0  0.0  0.0  0.0  0.0  0.1  0.0  0.0  0.0  0.0  0.0
16:  0.0  0.0  0.1  1.4  0.3  0.3  0.3  0.1  0.1  0.1  0.1  0.1  0.1  0.3  0.5  1.3  0.0  0.0  0.0
15:  0.0  0.0  0.0  0.2  0.0  0.1  0.1  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.1  0.2  0.0  0.0  0.0
14:  0.0  0.0  0.1  0.5  0.2  0.6  0.3  0.2  0.1  0.1  0.1  0.1  0.2  0.1  0.1  0.4  0.1  0.0  0.0
13:  0.0  0.0  0.1  0.7  0.3  1.2  1.0  0.6  0.4  0.3  0.3  0.4  0.4  0.3  0.1  0.3  0.0  0.0  0.0
12:  0.0  0.0  0.0  0.6  0.3  1.2  1.0  0.6  0.3  0.3  0.3  0.4  0.4  0.2  0.1  0.2  0.0  0.0  0.0
11:  0.0  0.0  0.0  0.5  0.3  1.0  0.7  0.4  0.3  0.2  0.2  0.3  0.3  0.2  0.1  0.2  0.0  0.0  0.0
10:  0.0  0.0  0.0  0.5  0.3  0.9  0.7  0.4  0.2  0.2  0.2  0.2  0.3  0.2  0.1  0.2  0.0  0.0  0.0
9 :  0.0  0.0  0.0  0.6  0.3  1.1  0.9  0.5  0.3  0.2  0.3  0.3  0.4  0.2  0.1  0.2  0.0  0.0  0.0
8 :  0.0  0.0  0.1  0.9  0.4  1.6  1.4  0.9  0.5  0.4  0.5  0.6  0.7  0.4  0.1  0.3  0.0  0.0  0.0
7 :  0.0  0.0  0.1  1.1  0.7  2.2  2.2  1.4  0.9  0.8  0.9  1.1  1.3  0.7  0.3  0.6  0.1  0.0  0.0
6 :  0.0  0.0  0.1  2.6  0.9  2.7  2.4  1.6  1.1  1.0  1.1  1.4  1.6  1.0  0.4  1.5  0.1  0.0  0.0
5 :  0.0  0.0  0.1  1.2  1.0  1.3  1.2  0.8  0.6  0.5  0.6  0.7  0.7  0.5  0.5  0.9  0.1  0.0  0.0
4 :  0.0  0.0  0.1  0.9  0.7  1.4  0.7  0.4  0.3  0.3  0.3  0.3  0.4  0.5  0.4  1.7  0.1  0.0  0.0
3 :  0.0  0.0  0.0  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.1  0.0  0.0  0.0
2 :  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
1 :  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0

9路での初手の確率分布。9路で学習させたもの
     A    B    C    D    E    F    G    H    J
9:  0.1  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.2
8:  0.0  0.1  0.1  0.2  0.5  0.2  0.1  0.1  0.1
7:  0.0  0.1  1.4  4.2  6.6  1.8  0.5  0.1  0.0
6:  0.0  0.4  2.4  5.5  7.4  4.4  1.5  0.1  0.0
5:  0.0  1.3  5.4  8.9 10.1  6.8  3.0  0.4  0.0
4:  0.0  0.4  1.7  3.9  6.7  3.8  1.1  0.1  0.0
3:  0.0  0.2  0.8  1.1  2.3  1.2  0.6  0.1  0.0
2:  0.1  0.1  0.1  0.1  0.4  0.2  0.1  0.1  0.1
1:  0.2  0.0  0.0  0.0  0.0  0.0  0.0  0.1  0.1
 

Re: Re: 盤のサイズ変更

 投稿者:ohto  投稿日:2018年 2月15日(木)11時29分30秒
  ありがとうございます。
CrazyStoneができているならやってみるのも無駄ではなさそうですね。
大会用は固定の方がいいでしょうが、マルチタスク学習するのに
バイナリを盤面サイズの数分用意するのはちょっとと思ったので
今は最大盤面サイズは埋め込んで、任意のそれ以下の長方形に設定できるようにしています。
知らない盤サイズでニューラルネットの返す値は全然信頼できないですけれど。
 

Re: TPUが一般人も使えるようになったようです

 投稿者:山下  投稿日:2018年 2月15日(木)04時12分14秒
編集済
  そうでした。2000個ですね。
5000個はAlphaZeroの方でした。

自己対戦に使ったTPUの数
AlphaGo Zero 2000個 48時間でLeeに追いつく 1手に1600回シミュレーション
AlphaZero    5000個 8時間でLeeに追いつく 1手に800回シミュレーション

シミュレーションの回数を考慮すると、どちらもだいたい同じ計算コストですが
800回で十分だった、ということでしょうか。
 

Re: 盤のサイズ変更

 投稿者:gg  投稿日:2018年 2月15日(木)01時48分33秒
  #そもそも人間はどうやって盤のサイズの違いに対応しているんでしょう。
そもそも脳には独立したメモリ(プログラムもデータも)はありません (処理=学習)
視覚で知覚した盤に合わせて連想される仕組みでしょうから
慣れたサイズなら既に学習済みの結果から
新規ならその場で色々考えて処理していると推測されます.
盤の大きさに無関係なものは流用しているはずですが
この「無関係」の範囲は不明(多分アバウト)です.
 

Re: TPUが一般人も使えるようになったようです

 投稿者:gg  投稿日:2018年 2月15日(木)01時35分21秒
  AlphaGo Zero が使った TPU は 2000台と Aja が台北の講演で言ってます.
(Master が 20 block というのもこれで公表)
http://sports.sina.com.cn/go/2017-11-10/doc-ifynstfh4024372.shtml
 

Re: 盤のサイズ変更

 投稿者:zakki  投稿日:2018年 2月14日(水)21時04分13秒
  Ray/Rnはグローバル変数に持ってます。PachiやFuegoは盤面のstructやclassのフィールドですね。
自作のは型変数に持たせて9路・13路・19路のプログラムを生成しつつコンパイル時チェック&最適化ってやってみてましたが、面倒になって途中でグローバル変数にしました。
 

TPUが一般人も使えるようになったようです

 投稿者:山下  投稿日:2018年 2月14日(水)19時05分24秒
  1TPUで1時間 $6.50 とのことです。
性能を考えるとリーズナブルですね。

AlphaGo Zeroだと5000台を2日使ってセドル版に追いついてますから
6.5 * 5000 * 24 * 2 = $1,560,000 = 1億7000万円
くらいでしょうか。

The TPU hardware we used for #AlphaGo is now available for everyone to rent on the @googlecloud
https://twitter.com/demishassabis/status/963324085097959424
 

レンタル掲示板
/253