teacup. [ 掲示板 ] [ 掲示板作成 ] [ 有料掲示板 ] [ ブログ ]

 投稿者
 メール
  題名
  内容 入力補助画像・ファイル<IMG>タグが利用可能です。(詳細)
    
 URL
[ ケータイで使う ] [ BBSティッカー ] [ 書込み通知 ]


Re: AlphaGo Zero

 投稿者:山下  投稿日:2017年10月19日(木)12時28分42秒
  Figure 3 の a が見直すとEloが-3500から+4500ぐらいまで上がってますね。
セドルが+3500としても、囲碁の初心者(ランダムプレイヤー)が-3500で
7000点も差があるのですね。
囲碁はよく50級、とか適当なランク?をつけてましたが、
100点1級としても70ランク差、10段から60級ぐらいまで存在することになるのですね。
 
 

Re: AlphaGo Zero

 投稿者:山下  投稿日:2017年10月19日(木)09時41分3秒
  自己対戦の棋譜はこちらにあるようです。

AlphaGo Zeroの自己対戦の棋譜
https://www.nature.com/nature/journal/v550/n7676/extref/nature24270-s2.zip
 

Re: AlphaGo Zero

 投稿者:山下  投稿日:2017年10月19日(木)08時22分17秒
編集済
  NHKや新聞各社でも取り上げられています。

囲碁AIが「独学」で最強に グーグル、産業応用探る
https://www.nikkei.com/article/DGXMZO2240734018102017TI1000/
「AlphaGo」が進化 囲碁の打ち手教えずに従来型破る
http://www3.nhk.or.jp/news/html/20171019/k10011182291000.html
最強AI「アルファ碁ゼロ」、人間の棋譜頼らず強くなる
http://www.asahi.com/articles/ASKBF55WWKBFULBJ00H.html
アルファ碁、さらに進化=自己学習のみで最強に-グーグル
https://www.jiji.com/jc/article?k=2017101900097&g=int
「アルファ碁ゼロ」最強AI、人間の棋譜頼らず強くなる
http://www.huffingtonpost.jp/2017/10/18/alphago-zero_a_23248198/

NHKの動画の「中国のトップ棋士を破ったAlphaGoに圧勝」
は「韓国の」の間違いですね。文章の記事では直っていますが。
 

Re: AlphaGo Zero

 投稿者:山下  投稿日:2017年10月19日(木)07時44分48秒
  衝撃ですね・・・。
内容は囲碁の知識などは一切なしで、ルールのみから作ったものが
セドル版のAlphaGoに100-0で勝つほど強くなったそうです。

1. 人間の知識などはいっさいなく、囲碁のルールのみ、からの自己対戦による強化学習
2. 入力は黒と白の石の配置のみ。ダメの数とかは一切なし。
3. Policy、Value、などと分割せずに、1つのネットワーク。
4. モンテカルロ法(Rollout)は使っていない。

個人的には 4. が衝撃でした。
以下はメモです。

--------------------------------------------------------
人間がよく打つ隅の定石を見つけた(5つの例)。
33に入る定石は5手目に黒がケイマに飛ぶ形を最終的に好む
学習の初期は石を取ることを好み、次に死活の基礎を学び、最終的にバランスが取れた美しい手を打つ
学習から36時間でセドル戦のバージョンに追いついた。
セドル版には100-0で勝つ。
プロの手の一致率は48%ぐらいと低い。プロの手から学習したものは54%ぐらい。
ResNetが単なるConvolutionより優秀で、PolicyとValueを一つのネットワークで評価するのが優秀。


出力はValueとPolicy。一つのネットワーク。
入力は石の配置と着手履歴(棋譜)。
  0から7手前までの黒、白の配置と手番(17面)
ResNetを使ってる。Batch Normalizationあり。
  40 Residual Block
  1 Block は (3x3 256, BN, ReLU)が2つ。つまり 80層のConvolution
ZeroはMasterに89勝11敗
MasterはZeroと同じ手法で作られているが、人が作ったRolloutは使っていた。


学習段階ではMCTSを使ってる。
学習の中に先読みを取り入れた、新しい強化学習
--------------------------------------------------------
 

AlphaGo Zero

 投稿者:荒木(ark)  投稿日:2017年10月19日(木)07時40分16秒
編集済
  AlphaGoの新しい論文だそうです。
https://deepmind.com/blog/
https://deepmind.com/documents/119/agz_unformatted_nature.pdf
http://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
 

Re: AQが公開されました

 投稿者:山下  投稿日:2017年 9月18日(月)11時24分46秒
  なぜかGitHubへのリンクはこの掲示板はErrになるのですよね・・・。

囲碁ソフト「AQ」を公開しました!
https://twitter.com/ymg_aq/status/909433035430420480
 

AQが公開されました

 投稿者:gg  投稿日:2017年 9月18日(月)01時24分1秒
編集済
  GitHub の ymgaq/AQ です.
#そのままだと投稿できないので,前半をカットしてます.
 

CGOSのサーバを修正

 投稿者:山下  投稿日:2017年 9月14日(木)03時08分16秒
編集済
  CGOSの19路が最近よく止まっていたのですがログを見ていると
3回中3回とも
proc infoMsg {msg} 関数の中の全員に通知メッセージを送るとことで
止まっていました。

error writing "sock18": connection reset by peer
    while executing
"puts $soc "info $msg""
    (procedure "infoMsg" line 8)

ですので
puts $soc "info $msg"

catch {puts $soc "info $msg"}
に修正して再起動しました。

Tcl/Tkの socket -server で呼ばれる関数がマルチスレッドかどうか
よく分からないのですが 観戦用のクライアントに送るコードには
catch {puts $v "info $msg"}
と catch が入ってたので単なる入れ忘れっぽいです。

これで安定するかどうか分かりませんが・・・。
ちなみに現在のサーバのソースは下です。
http://www.yss-aya.com/20170914cgos_yama.zip
cgos.tcl    ... サーバ
webuild.tcl ... html作成用
viewer.cgi  ... sgf viewer
 

CGOS Bot Operators Community

 投稿者:山下  投稿日:2017年 9月 3日(日)23時37分16秒
  海外の囲碁の掲示板でCGOSの話をしましょう!スレッドが立っているそうです。
https://lifein19x19.com/forum/viewtopic.php?f=18&t=14504
 

ICBM3 on CGOS19

 投稿者:gg  投稿日:2017年 8月21日(月)14時09分25秒
  CGOS 19x19 の ICBM3 は死石を打ち上げてないため,勝ってる碁を負けと判定されてます.もしここを見ていたら,プログラムを修正して下さい.  

レンタル掲示板
/243