爱吱声

标题: 真有在人机大战前放炮的:谷歌AlphaGo是科学欺诈 [打印本页]

作者: 燕庐敕    时间: 2016-3-7 18:19
标题: 真有在人机大战前放炮的:谷歌AlphaGo是科学欺诈
自从谷歌改名AlphaBeta之后,她的围棋人工智能程序也就改成了AlphaGo。Go这个音是唐朝时期“棋”这个字的发音的近似,现在考证类似“国”这个音发短促些。7 o; Q/ R! D% L( \& K6 s) ^
" V; u5 n& `4 N; t
可见语音的变化之大。/ |, [  U3 I+ y* W
9 H2 {  p1 R9 R
扯远了,今天,看见人工智能学家刘锋  (计算机博士,互联网进化论作者,人工智能学家主编)质疑谷歌的文章,我这里全文引用,之后在回复里面对某些段落做点评。这样是为了首先保证文章的完整性和阅读的连续性。
* {/ K1 o; E* f
5 i. i! `0 y4 n& D) X- G7 e4 _! S“把大象关进冰箱要几步”涉及的科学漏洞
! u- `0 m& e" a& R; q  ~5 N* {* K- p* S8 B
  在讨论谷歌围棋AI及其比赛问题之前,我们先看那个著名的笑话“把大象关进冰箱要几步“,2000年中国春晚,赵本山、宋丹丹的小品《钟点工》,曾经用到了这个笑话:问“把大象放进冰箱总共分几步?”答:“三步,第一步把冰箱门打开;第二步把大象放进去,第三步把冰箱门带上”。1 c" d# p2 s# x2 D) U$ u* u
* c7 r8 _  z2 \* t1 X* B0 b  q
  小品中的情景只是一个笑话,但从科研角度看,因为故意忽视最为关键的第二步,使得这个原本伟大的科学实验,变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现,根源也在这里。  g4 r1 W, B; S, a

0 k! v; m+ B/ I# T7 F3 H/ Q  J! ^" |  谷歌围棋AI在Nature上究竟说了什么* {! O" ]1 G, e8 O8 E9 u
" H$ S; S/ d' n: B
  谷歌在Nature发表论文阐述了其围棋AI程序AlphaGo的运行原理,这个原理描述相对专业,这里我们也力争用通俗易懂的语言描述谷歌究竟说了什么,谷歌围棋AI程序AlphaGo在下棋过程中主要通过四步完成工作,它们分别是:
: Y( t+ `9 p7 T+ p4 f" ^. r$ ^  u, ?! L  a/ }- Z. P$ R
  第一步快速判断:用于快速的观察围棋的盘面,类似于人观察盘面获得的第一反应9 h0 n! j  ~$ a; d1 G
3 o! [5 Y2 n! y1 f3 W8 q
  第二步深度模仿 :AlphaGo学习近万盘人类历史高手的棋局来进行模仿学习,用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。
3 b  ^: [, H# l3 \4 B( z6 e; ^0 n. F! Z' j$ Z' K% h
  第三步自学成长:AlphaGo不断与“自己”对战,下了3000万盘棋局,总结出经验作为棋局中的评估依据。+ F0 a* R6 K1 m4 R9 Z8 {

8 ^/ Q* M+ r9 E  第四步全局分析:利用第三步学习结果对整个盘面的赢面判断,实现从全局分析整个棋局。* V" w9 H, K4 A/ Z) K  r

5 o! X' h0 w) B/ d& i* w+ [  判断欺诈的第一个原因,谷歌的把大象关冰箱问题+ `6 [3 e: ^" Z& c

: U) e0 N! V5 G  Nature论文阐述的AlphaGo基本原理,按照人工智能专家的评价:”其基本原理并没有新东西“,但核心价值是学习了近万盘人类历史高手的棋局,和自我对战下的3000万盘棋局总结的经验。
8 P8 g, r7 |9 x$ i. F# A0 Q& S7 t1 X4 o# t
  请注意,这个关键内容,也就是AlphaGo到底终结出什么围棋规律,或者其神经网络的权重值是什么,谷歌并没有发表出来。也就是谷歌在”大象关进冰箱要几步“问题上,说出了如何打开围棋战胜人类的冰箱大门,和如何关上围棋战胜人类的冰箱大门,但唯独在第二步围棋如何战胜人类的方法塞进冰箱,同样做了隐藏。
7 Y8 c/ u: o7 C1 F$ J) \) A
' z' \6 v/ P; A2 \6 B  我们知道,围棋之所以很难被人工智能攻破,战胜人类高手,就是其可能的组合数异常庞大。至于多么异常,2016年1月普林斯顿的研究人员给出了最新研究结果:对于一个19x19的围棋棋盘而言,一共有361个位置,而每个位置可以单独放置黑棋、白棋或者留空,理论上所有的可能组合是3^361种。但根据围棋规则,不是所有位置都可合法落子,例如在围棋术语中没有气的位置就不能落子。那么排除掉这些不合法的棋局后总共还剩多少种呢?- }9 t4 `3 O; {# v5 h
5 x3 Z* _" z* o
  普林斯顿的研究人员给出的19x19格围棋的精确合法棋局数:208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935
; `, I- z/ K+ O% d" M
2 I6 a. S; f/ |6 A) e+ _  我们给它多分几行:$ G0 ^6 G; y2 {1 R. y) u# c: l

/ N3 S' U  ]$ b7 V  2081681993819799846
6 Y+ Y8 h2 ^3 V- o( Z6 w, D& {
. m6 |9 l2 B% {# ^( @9 h  9947863334486277028
/ a7 G8 G! _& m2 G, F6 x
6 F' h: R* I+ n9 X! q  6522453884530548425  Z/ E  a( G. c8 P5 y$ a) X, A) r) o

4 b) L+ x! j/ [7 q4 ^& J% O& J  6394568209274196127
( \- b7 F7 Y' L' a) H/ n$ h- x% }+ z8 j* u( ?6 i
  38015378525648451698 M# C1 H, u& b  C# j" d

  N$ f0 m* E) ?" H6 S1 C: u: x0 H  8519643907259916015
& D* u+ ^7 D8 y7 f
5 D2 ^/ B1 C0 e4 I8 s  6281285460898883144# a* @- L$ q$ W3 G5 H
1 w% g( Q+ |! M4 ^! ?
  27129715319317557731 ^* Z5 c/ ?8 ~5 j' j+ e

! m6 M1 Q7 ]# W1 [1 F  6620397247064840935
' l9 n, G# {, U$ h4 ^* U& z1 S
/ T$ D. L' I- \( V  不用数了,一共171位数! 这个数字比我们地球所有的沙粒数量还要多!比人类已知宇宙的所有星球数量还要多!对比一下,谷歌学习的近万盘人类棋局是5位数,谷歌自行对战的3000万盘是8位数。而围棋所有可能的棋局盘数是171位数。如果规避还有可能的重复变化,我们把大头去掉,那也有70位数的棋局变化。3 Q3 ?2 _; Q* j$ N
- `) Y* H- \. `! C5 Q1 q: D
  第一也就是说谷歌以幼儿园规模的知识量,就要获得诺贝尔奖级的知识规律,这违背了科学发展规律和常识。
! I$ D# M+ F* h, w; E3 n; S
. H8 E2 A/ G7 X8 |  r  第二,如果谷歌通过学习和自行对战学到了超出寻常的规律,或者其神经网络权重值达到新的高度状态。但谷歌不愿意公开这个最重要最关键的内容,其他研究者就无法真正了解谷歌围棋的真实水平。在这种情况下,匆忙举办获得巨大商业利益,没有第三方真正监督,无法洗脱作弊嫌疑的世界冠军比赛。受到科学欺诈指控也属必然。$ ]+ m( J# j9 s5 J, Y

; K; b% I- j$ P: n  判断欺诈的第二个原因,密室实验与棋手放水
0 u% y: I8 a( ^' v: Q& \0 s
! _+ _/ j$ ^/ C. U4 \% _  从科学实验的严谨性说,谷歌在论文中阐述的实验方法,表现不及格甚至恶劣,我们知道在物理,化学,生物,计算机等领域,进行实验时,要求实验对象必须达到一定数量,并进行多次独立实验。才能相对确保结果的稳定性和可靠性。譬如一个受到污染的试管,无论我们重复多少次实验,其结果也一定是不可靠的。
" w  D- }" A5 H& B) T
" J. G( L0 z0 [5 e& u- E/ O! p  谷歌在这篇论文中 对其他围棋程序选取了众多测试对象,并进行了495次实验,但对人类测试者,却只选取了一位曾经获得欧洲围棋冠军的棋手,并签署严格的保密协议,原本可以很容易邀请更多选手,但却没有按照科学规范进行多次实验。先不谈谷歌和棋手之间有无利益交易,就这一点,谷歌在Nature发表的论文从实验角度是不合格的。( F9 v$ K/ N0 Y) F. p

! h$ d8 E& @' s/ Q4 ^% a  更重要的问题出在与谷歌对战的欧洲围棋冠军樊麾身上,在对战棋谱公布后的二个月里,大量职业围棋高手含蓄或公开指出樊麾水平发挥失常,或不求进取,或就是放水。
* T, D* r" m: ?' H; _8 R/ ]# O. ^7 z% P7 Z. ?) B
  多次战胜李世石,当前世界最优秀的围棋选手柯洁评价道:“他可能也是好久不下棋了,实力表现非常糟糕”。前北京市高校围棋冠军王烁在财新发布的文章中评价道:“这五局棋下得反而是很平庸。樊麾抵抗不足,五盘棋没有什么激烈的战斗,开局、定式、占大场、小规模接触战,收官,对抗度很差。”! s7 S& c  D9 l2 i5 G1 ^. t( X
' L8 S2 f+ c2 D0 D
  虽然欧洲围棋冠军樊麾多次辩解“我发挥失常,当时崩溃了“,但更多棋友评价欧洲围棋冠军樊麾,“发挥有技术变形”,“樊麾的表现只有业4水准,关键地方明显放水”,“很明显樊麾是谷歌公司的托,全是50年前的招法极其保守,不输才怪”,“对于谷歌,没有什么谎言是不能用1千万美金解决的”。; B8 d; f& L4 Y7 y, K

8 U  X  L+ D1 R0 d+ J: Y) L* S  除此之外,谷歌也没有向Facebook那样把围棋程序放到互联网上,光明磊落的接受大众的考验,作为与谷歌AlphaGo原理相同facebook围棋程序DarkForest,目前水平相当于业余5段,与职业选手依然有巨大的差距。
" \6 j7 u. W& F+ n3 B2 {: h, ^, H+ P+ w4 b
  同时谷歌的论文结论也存在不可重复问题,Facebook围棋项目负责人田渊栋在评价谷歌围棋AI最为关键的快速走子策略时讲到”对此AlphaGo只提供了局部特征的数目,而没有说明特征的具体细节。我最近也实验了他们的办法,达到了25.1%的准确率和4-5微秒的走子速度,然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完全概括他们快速走子的棋力,因为只要走错关键的一步,局面判断就完全错误了“。
3 {1 [6 Z+ i$ M3 ?4 t: ?* H: t5 [2 ?/ R
  从上述情况看,谷歌在进行围棋实验的过程中,刻意违反科学实验规范,存在采用密室孤立实验,这些问题在3月9日与韩国选手李世石的比赛中没有消除。人们常说,互联网上,你不知道你的对面坐的是人还是条狗。同样对于谷歌围棋比赛,我们完全可以质疑,与李世石对弈的究竟是程序还是人?如何保证李世石没有被利益收买?
. q) _/ S+ G( A0 Z
- w( ?7 [4 G" G; x- z* q  判断欺诈的第三个原因,过度追求市场影响与提高股价) l$ Z- u( O3 K6 N

* i7 J% z3 N  v* M  谷歌选择欧洲围棋冠军和前围棋冠军李世石进行世界轰动的比赛,而且没有严格的第三方监督,排除作弊的可能,表明谷歌并不是追求科学的严谨和荣誉,而是在追求品牌和影响力最大化,从而获得巨大的经济利益。: f; _1 o/ R$ s8 O3 r( [

4 y7 A5 Z2 W) f! {& h% L  事实也证明这一点,2016年1月28日曝出了谷歌人工智能围棋击败欧洲冠军的消息,随后是谷歌拿出100万美元作为奖金挑战李世石。当日谷歌股价大幅上涨,涨幅4.42%,换算成市值涨了200亿美元。从宣传效果是看,谷歌这次的“广告”做非常巧妙。2016年2月26日彭博社报道,谷歌旗下设计围棋AI的公司DeepMind正推进自身医疗技术发展,因为其在围棋领域的影响,已经获得不菲的订单。
# |% [5 T. P: l+ A) \4 `* m/ p
' _$ @: g% o. k, |  谷歌的技术期货路径和消除欺诈指控的方法0 l1 |  Z  P1 m! N, ?) h  _0 Q4 Z

' ~7 ^7 E( `; K1 b4 H  西方谚语说”一个动物,如果它走起来像鸭子 叫起来像鸭子 它就是鸭子“,同样,对于谷歌围棋Ai及其比赛,如果它回避公开如何从3000万盘(8位数)棋局获得171位天文数字棋局的规律或神经网络权重值,回避不愿大范围邀请棋手参与实验,回避收买选手嫌疑,回避不在互联网上公开对战接受监督,那么谷歌的围棋比赛可以看作一场精心策划的科学骗局或有欺诈嫌疑。1 P. |: t2 b  n) Q; E( U2 Y( m

3 U* ?- J; N( I% h, g( ]$ `  商业中有一种做法叫产品期货,消费者购买商品后,要等到半年或一年后才能拿到,那时技术,原料成本大幅下降,商家因此获得利润。同样,谷歌的围棋程序应该获得一定进展,但远没有到达能够挑战职业选手或九段高手的地步,谷歌通过市场和技术手段,拔高其围棋水平。故意回避公开监督或公开大范围对战。等待未来水平继续提升后,可能会进行公开,这种做法也可以称作 ”技术期货路径。
' U5 ]) K9 g8 D, ~
3 k; T5 T! j* ~" W( {  谷歌可以消除欺诈指控的嫌疑,不是与李世石下棋,而是:
3 R+ a4 L9 I2 y5 l) E9 Y! }1 `* O+ N; F# D+ I: g/ ]- a& |
  1。完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律,或公开其神经网络权重值参数,让其他实验者可以重复谷歌的实验结果,还原谷歌对战成绩。
0 V* ~3 @7 L2 z' ^7 M& f& i. d. E7 p! w; v4 L  ]: g
  2。将谷歌围棋AI程序AlphaGo放在互联网上,接受百人,千人的同时对战。并检测对战结果,消除作弊嫌疑。
  P3 {. N. z: h8 \) r# V; @  ?4 i# D/ j
  这两条谷歌能做出任意一条,都可以看作是消除欺诈指控的强有力证据,但在未来一年或更长时间里,谷歌没有任何动作,那么谷歌将持续背负有科学欺诈嫌疑,利用科学炒作获得巨大经济利益的指控。
作者: 定风波    时间: 2016-3-7 21:22
我想谷歌觉对不会完全开源其人工智能系统,就像google的其它系统一样,核心不开源。
作者: 看客    时间: 2016-3-7 22:07
定风波 发表于 2016-3-7 21:22
5 w# l) P9 M6 i& `* l我想谷歌觉对不会完全开源其人工智能系统,就像google的其它系统一样,核心不开源。 ...

! v" j: \, v. O这跟开源是两码事。
/ o  H* G, u: F2 G. m: t, t开源与否不是学术语境,刘锋指控的是学术欺诈,主要是针对谷歌在 Nature 的论文而言。其实如果没有那篇论文,单就挑战人类棋手而言,作为商业行为没什么可指责的。
作者: 冰蚁    时间: 2016-3-7 22:31
看客 发表于 2016-3-7 09:07
. E( |1 M% ]7 a( x2 q( v7 h# j% s7 A3 \这跟开源是两码事。& Q+ v- m' n* h7 m
开源与否不是学术语境,刘锋指控的是学术欺诈,主要是针对谷歌在 Nature 的论文而言 ...

' W8 m  l: Y1 ?! {3 L# G$ I这样写论文我觉得常见吧。比如半导体里讲某个领先节点技术,具体工艺肯定不谈的,大概说说就完了,因为是核心机密。然后发几张图,表明性能是怎么样的。至于其它厂家能不能达到这个性能,那是其它厂家的事情。这种没法说成是科学欺诈。
作者: 定风波    时间: 2016-3-7 22:36
看客 发表于 2016-3-7 22:07
9 v* F4 @7 q) q这跟开源是两码事。
' T! D* h! H* N: h1 @$ k开源与否不是学术语境,刘锋指控的是学术欺诈,主要是针对谷歌在 Nature 的论文而言 ...

1 b, y& Q: G+ f' x3 {你觉得如下两条是商业公司干的吗?雷锋也不过如此吧。* v7 F: ]5 B9 H3 P' r% t" H+ X# Z
      1。完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律,或公开其神经网络权重值参数,让其他实验者可以重复谷歌的实验结果,还原谷歌对战成绩。
9 J& g4 r  ~+ P+ t) V4 M) w4 E. ^5 U! b7 ?( f8 ]- q5 o
  2。将谷歌围棋AI程序AlphaGo放在互联网上,接受百人,千人的同时对战。并检测对战结果,消除作弊嫌疑。'
作者: 冰蚁    时间: 2016-3-7 22:37
权值参数是核心中的核心机密,怎么可能公布。写这个的人是实验室呆多了,太不着调。
作者: 看客    时间: 2016-3-7 22:39
冰蚁 发表于 2016-3-7 22:31- a  M/ j1 Y5 X7 Q
这样写论文我觉得常见吧。比如半导体里讲某个领先节点技术,具体工艺肯定不谈的,大概说说就完了,因为是 ...
9 r1 r. l3 u4 f% {/ [3 M
我是说刘锋是这么指控的。国内刊物的论文这很正常。但不同的刊物有不同要求也很正常。刘锋的指控意思是,谷歌在论文里把这种挑战是当做科学实验的,那就要守科学实验的规矩。
作者: 冰蚁    时间: 2016-3-7 22:46
本帖最后由 冰蚁 于 2016-3-7 10:06 编辑
2 [( b8 U& {5 F2 P5 f# r0 E3 e
看客 发表于 2016-3-7 09:393 c) @- E6 ?$ `3 K/ Y6 i4 P
我是说刘锋是这么指控的。国内刊物的论文这很正常。但不同的刊物有不同要求也很正常。刘锋的指控意思是, ...
) G0 W0 u# z( |6 ~
) \( M! g& c6 U2 {. r) [0 i' b
我知道你是说刘锋,不是你的观点。国外其实也是这样。technology 和纯 science 并不是等同。google 这个属于 technology 上的进步,没有新概念。所以刘锋用纯科学实验的要求去要求这样的论文属于驴头不对马嘴了。technology 里的核心机密肯定是要保护的。
! u8 P+ b: R( @' b. I& O1 n" X4 G# I3 c" ^6 p
  u: m; P2 W0 c) S; o# T% y
9 Z3 U5 X. R0 |, O# q1 P* U4 Y
PS: 假如哈,打个比方,我们现在没有 Monte Carlo 的搜索技术。 google 这次发明了,用了。那么论文里就要写明 Monte Carlo 的算法,使用了什么具体参数,结果如何,效率等等的怎样。其它的组就会去重复这个实验,看看是否达到论文里所说的结论。这个就属于 science 范畴。
作者: 四处张望    时间: 2016-3-7 23:05
这作者秀逗了啊...
作者: 武工队    时间: 2016-3-8 02:31
生命科学领域提出类似的要求似乎还算正常
( I" ~. B+ L0 y. N5 V. k( D6 R+ r- Y
计算机科学领域不太可能吧,让人家把训练出的模型公布出来并分析原理??
作者: 删除失败    时间: 2016-3-8 08:49
作者有点失去理智了。个人倒比较能理解。狗以战胜樊麾的水平挑战李世石是根本没希望的,关键在这几个月的水平提升上,正因为google没有任何技术细节的透漏,外界无从判断水平可能提升的高度。所以现在石狗大战中以IT人士为主的挺狗派优越感爆棚,让人感觉莫名其妙。他们唯一的依据大概只有alphago是google开发的了,很有点狐假虎威的感觉。
作者: 冰蚁    时间: 2016-3-8 09:37
本帖最后由 冰蚁 于 2016-3-7 20:39 编辑 0 l7 B4 ]8 c. d, A' X7 Q: _8 q
删除失败 发表于 2016-3-7 19:49) m4 S, {2 X: f- d- y
作者有点失去理智了。个人倒比较能理解。狗以战胜樊麾的水平挑战李世石是根本没希望的,关键在这几个月的水 ...

& o. G7 L9 ~. V1 m* N$ y" R0 M5 T/ v  z: t9 w
IT 人士兴奋很容易理解。如果AI 能接近世界顶级选手,即使一盘不赢,只要场面不难看,都是里程碑式的突破。最后全面超越人类选手也就指日可待。大家都要来抢这颗AI界的明珠。这不又来个中国和日本的新AI系统:* _0 ^! |# ?, R6 A) y
  {" |9 e& L4 |* _, w
3月7日晚,由异构智能公司、极客帮创投与聂卫平围棋道场三方共同主办的“异构智能挑战未来”发布会在北京日坛会馆举行,异构智能创始人兼CEO吴韧博士、棋圣聂卫平、极客帮创投创始合伙人蒋涛、中国国家围棋队领队华学明以及总教练余斌出席了本次发布会,著名自媒体人王冠雄担任特邀主持人。会上,异构智能公司、极客帮创投与聂卫平围棋道场三方联合宣布启动人工智能项目“异构神机”,并向世界围棋第一人柯洁发起挑战。) X9 w, u9 E0 s; F. `8 e* c" i

3 A' H$ A- X4 p2 s! O7 Y! h; c日本也在3月1日发布了“DEEP ZEN GO”项目,打出了超越AlphaGo的口号。围棋人机对决已成为全球人工智能科学领域的一场国际竞赛,“异构神机”与柯洁的加入,使得竞争更加激烈。异构智能也在发布会上表示,未来或邀请Google AlphaGO等其他人工智能以及其他世界顶尖围棋选手,共同创办一场围棋人机巅峰大战。

作者: tanis    时间: 2016-3-8 10:06
冰蚁 发表于 2016-3-8 09:37
7 E( }: J' i2 m4 ]  w5 TIT 人士兴奋很容易理解。如果AI 能接近世界顶级选手,即使一盘不赢,只要场面不难看,都是里程碑式的突破 ...
8 w' l: U) r$ r# r: c, l& P
我不是很明白为啥那么多人类要那么在意。我觉得AI在棋类战胜人类就是时间问题啊~ 现在不行,五年后很可能就行了,五年不行,十年呗~ so what~
  ^6 ]) \4 Y4 m
7 ?" [8 n5 E1 ]" @最近很多创新点的技术在理论上早就可行了,就是当时的计算性能无法达到。现在计算性能可以了,把老文章的老算法拿出来稍一捣鼓~ NB的startup就出来了~
作者: 冰蚁    时间: 2016-3-8 10:09
tanis 发表于 2016-3-7 21:06. ?# B$ g' E  b% C2 |
我不是很明白为啥那么多人类要那么在意。我觉得AI在棋类战胜人类就是时间问题啊~ 现在不行,五年后很可能 ...

  n5 u! o& H9 k对啊,alpha go 在技术真是没什么新鲜的东西。
作者: 删除失败    时间: 2016-3-8 14:20
本帖最后由 删除失败 于 2016-3-8 15:38 编辑
5 e" {& f5 X9 v4 }* ^, I
冰蚁 发表于 2016-3-8 09:37  r9 f6 h# Z% i9 h- S! h
IT 人士兴奋很容易理解。如果AI 能接近世界顶级选手,即使一盘不赢,只要场面不难看,都是里程碑式的突破 ...
1 J& [8 M: y2 \8 `& I/ ?4 M$ j
4 v5 z: d0 J( a2 i4 L! p
和异构神机的对局已经有了,不过是赵哲伦。! D3 [0 [: Q; m! W4 |# r8 p0 Y- j
异构神机测试版详解
- L/ ]! F6 K: g4 Z7 u过程挺有意思,看来技术在扩散,从围棋爱好者的角度讲,有这样的围棋AI是件挺不错的事
% L8 |" `2 s% O: ?/ [异构神机还会在网络上公开对弈。
2 y+ L8 B* `5 U& c4 R$ l6 H& [- M6 h; |; K; K) I; g) J
另外石狗大战还是用几个月前的版本,性能略高5 S- M4 S+ i7 a" \
人机大战发布会韩国召开
' p8 |! V6 q+ p; j+ k+ \1 L又有的口水了
作者: 道可道    时间: 2016-3-9 11:48
陛下,为什么要杀了那只下金蛋的鹅呢?
作者: 小木    时间: 2016-3-9 13:51
本穷不懂围棋,也不大明白机器学习算法什么的,但是这个作者对期货的描述基本是扯淡。
作者: 冰蚁    时间: 2016-3-9 15:42
哈哈哈哈。狗赢了。
作者: 四处张望    时间: 2016-3-9 15:49
冰蚁 发表于 2016-3-9 15:42
6 O$ Q$ Z) z/ ]9 y7 G哈哈哈哈。狗赢了。
3 z8 ~9 ^+ |- p: ~: c- P) ]: `
你看吧,很快就有阴谋论跳出来的啦
作者: 删除失败    时间: 2016-3-9 15:59
老实说,很泄气。% [6 Y- V1 u3 A4 \
感觉小李下得有点问题,特别是开局,心理上有波动。但是输就是输了,没有借口。后面4局也相当不乐观。
# e: D0 T' }; p% @  c* z狗后面确实厉害,有点李昌镐的感觉。
作者: 冰蚁    时间: 2016-3-9 16:04
删除失败 发表于 2016-3-9 02:59
1 L( B# O7 o# ~" z% T, W老实说,很泄气。
( [* Y( {( ^0 Q8 W- J" T感觉小李下得有点问题,特别是开局,心理上有波动。但是输就是输了,没有借口。后面4局也 ...

8 ~+ {; p3 S( ^' e% A我觉得李没什么明显错招,昏招吧。
$ n; N+ |, Y" k" p7 I( G+ y9 z8 {7 J4 W1 i$ @
狗上来就开战,这么凶,倒出乎我的意料。
作者: 删除失败    时间: 2016-3-9 16:17
冰蚁 发表于 2016-3-9 16:04
$ z, P+ l: F$ U1 u" h. ]2 l9 M我觉得李没什么明显错招,昏招吧。- \  R; D% B& H( H
- \' N$ R" N% p8 ]
狗上来就开战,这么凶,倒出乎我的意料。 ...
! d( @2 \1 S) b  Q: B8 [6 a( U. p
小李的黑7少见,黑27直接分断作战勉强,结果也很不好,不过后面小李慢慢挽回了局势。在白棋打入黑棋右侧前,不少人认为黑棋是领先的。打入后黑棋损了很多。我的水平也说不准白棋是侥幸成功还是早就肯定成立。后面黑棋就没机会了。3 M& |# Q2 y# ]  E* ^8 P

! h5 ~/ K# G1 }" b# [4 F$ _6 ~8 ?目前我还是倾向小李应该可以发挥得更好,但是狗也很可能更强,也许今后一段时间人机对抗会成为围棋界的主题吧
作者: 财迷心窍    时间: 2016-3-9 17:28
本帖最后由 财迷心窍 于 2016-3-9 19:14 编辑 1 [4 K1 _' k( E
0 |# s) y* P; X" ]& R5 S
有不服的/ x) @9 ]9 q# n; Q0 z1 S2 }! I
@柯洁大棋渣* ], e4 I  c' P0 X" a8 x: o! J% Q" V
就算阿法狗战胜了李世石,但它赢不了我
" h( w! `6 Y  B. L' V6 ~
作者: 财迷心窍    时间: 2016-3-9 17:29
本帖最后由 财迷心窍 于 2016-3-9 19:15 编辑
1 \2 ]' C+ l1 S* `' A. o5 U, y2 {2 d( \1 f5 o
重复,删除
作者: xlan1976    时间: 2016-3-9 17:57
删除失败 发表于 2016-3-9 16:17
: P' P$ ]( O4 r) N小李的黑7少见,黑27直接分断作战勉强,结果也很不好,不过后面小李慢慢挽回了局势。在白棋打入黑棋右侧 ...

$ S: I& b. [* }" E2 x4 t我觉得李世石在右下角的处理还是有问题,轻易的就放弃了角地,不知道第127手不长,而是在128位倒虎会不会结果不一样?
作者: xlan1976    时间: 2016-3-9 18:35
http://sports.sina.com.cn/go/2016-03-09/doc-ifxqafha0534995.shtml5 e# G2 N. ?, S% w
新浪上的棋评,左下角的棋小李双飞燕的情况下被Alphago先手成活,处理的肯定有问题。右下角跟我上面想的差不多,应该守角,而不是罩住对手。
作者: 燕庐敕    时间: 2016-3-9 21:04
财迷心窍 发表于 2016-3-9 17:28
+ k" b& M5 T3 |. `# U& b有不服的
& k9 C9 k+ t1 j5 m' N@柯洁大棋渣
" C+ X7 K2 R0 j8 O就算阿法狗战胜了李世石,但它赢不了我
5 \4 s  h/ Y( d& s: K
现在赢不了,过个月就不好说啦!
作者: 煮酒正熟    时间: 2016-3-9 21:38
冰蚁 发表于 2016-3-9 02:42
0 r; e1 J0 s( f6 S" I/ W4 h4 C哈哈哈哈。狗赢了。

$ l+ k7 J, h9 [李师师一定是签署了不许打劫等等条款了,以至真实势力得不到充分挥发
作者: 煮酒正熟    时间: 2016-3-9 21:44
燕庐敕 发表于 2016-3-9 08:049 `& w- Y% r9 c. K
现在赢不了,过个月就不好说啦!

8 m, [) A! u9 \7 `% M我觉得柯洁辣么说纯属放嘴炮儿。当然他是小孩子,不必苛责。如果阿法狗这次战胜李世石,如果古狗真的向柯洁下战书,两边开战至少也是三个月以后的事了,这三个月阿法狗的棋力增长绝不是柯洁可以望其项背的
作者: 燕庐敕    时间: 2016-3-9 21:51
煮酒正熟 发表于 2016-3-9 21:449 _' q, o/ {3 c7 o! `# `/ k, p
我觉得柯洁辣么说纯属放嘴炮儿。当然他是小孩子,不必苛责。如果阿法狗这次战胜李世石,如果古狗真的向柯 ...

. r, K. `7 h4 E2 S柯洁也涨棋,还能涨到25岁。
+ g/ a5 t: v! F- C* d2 z
5 w5 U! D( `  @9 S% V9 a( G5 c但是柯洁涨棋有瓶颈,机器则未必有这个瓶颈。所以拖的越久,柯洁胜算越小。
作者: 史老柒    时间: 2016-3-10 20:26
煮酒正熟 发表于 2016-3-9 21:38
# q/ X  n* f( `7 ^7 g李师师一定是签署了不许打劫等等条款了,以至真实势力得不到充分挥发 ...

. O6 X+ o+ K) }( z+ q% `这个说法是不成立的。因为阿狗会打劫。
作者: xlan1976    时间: 2016-3-10 20:39
史老柒 发表于 2016-3-10 20:260 B3 T4 e" k9 i$ r
这个说法是不成立的。因为阿狗会打劫。
/ \! U2 p; {$ _$ F6 i
不过今天的对局可没有证明阿狗会打劫。
作者: 删除失败    时间: 2016-3-10 20:59
在亲眼目睹之前,狗会不会打劫之谜是不会解开的,老梗不必多说。8 n1 F9 h9 R3 ^9 [* I
) H- C" c; a7 V, y# H  X
倒是有个新的疑问:狗是使用了数千个CPU的分布式系统,那么他加入更多的CPU提高计算力缩短计算时间应该不是很难吧,那么时间限制对狗好像没有什么太大的意义,算不过来加CPU就行了,谷歌不缺两个CPU的钱,毕竟没有人限制谷歌的硬件。如果确实这样那么现在的规则对人类是不利的,至少人类应该有打挂的权利。
作者: 燕庐敕    时间: 2016-3-10 21:02
删除失败 发表于 2016-3-10 20:59
' j& t2 P0 V5 f在亲眼目睹之前,狗会不会打劫之谜是不会解开的,老梗不必多说。
2 Z# A- V1 e) q/ Z% @- m& [
9 I, x% p" A" _; F/ Z倒是有个新的疑问:狗是使用了数千个CPU ...
1 m- H# @% V  P. B+ z/ L4 I
哈哈,这样是不是把李世石换下来,让秀哉爬出来和机器下?
作者: 删除失败    时间: 2016-3-10 21:07
燕庐敕 发表于 2016-3-10 21:025 m# b. F& |& y  m; b( m9 j, e# _
哈哈,这样是不是把李世石换下来,让秀哉爬出来和机器下?

' p5 @! I6 T+ y其实我是想看看不动心的李昌镐会如何打狗,不过他年纪大了,下一会歇一会才行
作者: 煮酒正熟    时间: 2016-3-10 21:19
史老柒 发表于 2016-3-10 07:26* J# s. u6 ]0 B! n0 j1 A
这个说法是不成立的。因为阿狗会打劫。
$ r. I/ G& O  ?
呵呵,老七没看出俺那是正华反说呢吗?对樊麾那场俺还真不敢说,但是对李师师这一场,万众瞩目,谷歌绝无可能再玩儿这种桌子底下的招数
作者: 燕庐敕    时间: 2016-3-10 21:20
标题:
本帖最后由 燕庐敕 于 2016-3-10 21:35 编辑
- g2 E& M& R: F0 q2 \% k* C
煮酒正熟 发表于 2016-3-10 21:19: I. i! W5 \; e; }) r
呵呵,老七没看出俺那是正华反说呢吗?对樊麾那场俺还真不敢说,但是对李师师这一场,万众瞩目,谷歌绝无 ...

  @; M# E: F3 ?9 \! G; ~8 S
' g; |2 K7 i. m+ G- s- H1 O7 l  F今天有记者当场呛小李不打劫,小李尴尬半天说不出话来~~~
作者: 冰蚁    时间: 2016-3-10 21:21
删除失败 发表于 2016-3-10 07:592 Z! Q9 h; e: s6 R6 D
在亲眼目睹之前,狗会不会打劫之谜是不会解开的,老梗不必多说。2 W9 D" U( F1 I
2 h& z! |# {$ C/ O  m4 ~+ n
倒是有个新的疑问:狗是使用了数千个CPU ...

/ l) [7 d7 {' V# t
5 J( a9 L" r& g% H这次不是用的单机版的么,没上服务器的。
作者: 冰蚁    时间: 2016-3-10 21:24
燕庐敕 发表于 2016-3-10 08:20
% E7 V$ _$ L* z8 E$ a7 x今天有记者当场腔小李不打劫,小李尴尬半天说不出话来~~~

! ?& m6 h* `1 O; d: G8 y这个打劫也不是说打就能打得起来的吧。
+ E9 I$ A$ \" e* n4 P  J
, o2 [6 N+ w# v8 n' P) c象第一局那个劫,打不打都无所谓了,机器也没理会那里。
作者: 煮酒正熟    时间: 2016-3-10 21:31
删除失败 发表于 2016-3-10 07:59
% [/ t7 Z# G* h; p: ]0 u在亲眼目睹之前,狗会不会打劫之谜是不会解开的,老梗不必多说。
, L5 H" S: I- L" u  u& Z+ `) j( S! ?( X+ h4 Q! p/ j% C
倒是有个新的疑问:狗是使用了数千个CPU ...

! j9 i0 G  C5 y5 F& a( ?我赞同人机大战时,人应该有打挂的权利。只是我估计这种带有浓重人机决战味道的赛事,也是一个巨大的广告和PR商机,但是打挂对商家来说很讨厌,对普通观战者来说也很烦闷。这些细节需要work out.# G8 ^$ Z1 R! H0 k& |
' I( F# x2 S3 j. ]
另外,CPU很便宜,古狗之所以只用了几千个而不是几万个,几十万,几百万个,是因为增加CPU对提高速度已经没有帮助了。distributed computation的前提是你的整体信息可以在某个维度上做切割。如果你的信息最大限度只能切割成五百块,那么你上1000个CPU就是浪费。. z; b  B9 q( u( o' S- i

4 R3 H2 m8 s2 ]阿法狗如果想继续提升速度(它现在的速度已经明显比李世石快了),唯有依靠算法的提高,也就是价值体系的进一步优化。比如,遇到一个棋型,现在它的价值体系首先要从天文数字的应对方案中遴选出8种来,再对这8种做深度推演。如果未来的价值体系可以从8种降到4种,只对这4种做推演,那样就可以算得更快了
作者: 燕庐敕    时间: 2016-3-10 21:37
冰蚁 发表于 2016-3-10 21:246 \/ ~0 Z2 o$ G; j
这个打劫也不是说打就能打得起来的吧。5 f- M4 R1 j7 Y1 t
6 P  n6 q  z, J( m4 J) w, P
象第一局那个劫,打不打都无所谓了,机器也没理会那里。 ...

! s: t- d3 o! Y8 Z* R机器可以判断打劫有利或不利,小李却在不利局面下不主动寻劫,只能觉得他被压得喘不上气了。
作者: 冰蚁    时间: 2016-3-10 21:52
燕庐敕 发表于 2016-3-10 08:37
8 l. v5 F  M) F机器可以判断打劫有利或不利,小李却在不利局面下不主动寻劫,只能觉得他被压得喘不上气了。 ...
" ]% p: `8 J. y8 L* G
昨晚上我没熬得住,看了开头就睡了。你看了后,觉得小李有机会寻劫么?
7 V, b/ l& r& |" L( u象第一局,我就觉得没机会寻劫吧。
作者: 财迷心窍    时间: 2016-3-10 21:57
燕庐敕 发表于 2016-3-9 21:04
$ a9 @% y8 M# `( {0 E+ i现在赢不了,过个月就不好说啦!
. L9 A) @2 V! j0 u- H/ Z& Z
今天看直播,发现柯洁至少在形势判断上明显碾压古力和小李。
7 z2 `& H/ w6 n# @右上打拔一子后柯洁已经认定小李必输了,古力是在左上打入失败后才勉强承认小李劣势。。。
作者: 删除失败    时间: 2016-3-10 22:13
冰蚁 发表于 2016-3-10 21:21
# v2 a/ W0 e& k6 X/ W这次不是用的单机版的么,没上服务器的。

, H- i2 r/ ~5 `0 `是我孟浪了2 u) t$ x5 A+ n5 C7 A3 \4 r
不过单机版48CPU也不是善茬啊
作者: 冰蚁    时间: 2016-3-10 22:20
删除失败 发表于 2016-3-10 09:13
! ?5 [& r) ~- F. J; z是我孟浪了
) ?$ i) P4 U+ f5 @% i不过单机版48CPU也不是善茬啊
* `5 R7 y8 e( L8 ~1 G( y! z& X) P
以后要出36天罡版,72地煞版,108水泊梁山版& n% b' i/ P( w/ T! c' m5 F
: h: N* `9 q; w1 ?
! N% L& K- X7 {9 X" T# L

作者: 燕庐敕    时间: 2016-3-10 22:22
冰蚁 发表于 2016-3-10 22:208 R* f3 f. l6 n4 `9 j% O( }, p! i
以后要出36天罡版,72地煞版,108水泊梁山版
: W; i5 W0 S2 s4 a. T* E+ T' U
哈哈,冰姨想象力太丰富啦,远超机器!
作者: 财迷心窍    时间: 2016-3-10 22:39
删除失败 发表于 2016-3-10 21:07
) q0 V# a6 _$ m; b其实我是想看看不动心的李昌镐会如何打狗,不过他年纪大了,下一会歇一会才行 ...

  l5 {! N9 z# V$ t+ c; Z  s' d昨天没看,今天看了直播,对于我这样的真棋渣来说很崩溃。。" W$ ^, z+ n  h( w0 h% {9 `
小目托退虎后居然脱先走中国流,还有5路的那个肩冲。。。难道说以前学的都是错的。。。。
作者: 史老柒    时间: 2016-3-10 22:56
xlan1976 发表于 2016-3-10 20:39
) A) T- M* [2 x, j9 ~不过今天的对局可没有证明阿狗会打劫。

) M- d% C4 X- x8 a$ X. \, F1 O+ L
6 i9 }; X9 J* P5 D+ I. O- p/ ^% h阿狗和樊麾对弈第五局第154手阿狗跟对方互相提劫玩来着。
! t7 L# F: U! g6 `6 B
7 N8 k1 L+ ]# D; p& P
作者: 删除失败    时间: 2016-3-10 23:13
财迷心窍 发表于 2016-3-10 22:39
: d: N% G. [, H" i/ p0 e# v4 O" C: O: ?昨天没看,今天看了直播,对于我这样的真棋渣来说很崩溃。。
/ d8 p- @! Z8 {3 g2 c, K小目托退虎后居然脱先走中国流,还有5路的那 ...
3 H' x4 x# Y# j: P6 P! r: [0 o
吴清源新布局被本因坊一门认为大逆不道,二十多年前韩国流也不被日本棋手接受,武宫正树也下过55肩冲,围棋理念一直在变化,从这个角度看,石狗大战让我们对围棋有了新的认识,其实也挺好
作者: 冰蚁    时间: 2016-3-11 00:05
删除失败 发表于 2016-3-10 10:137 l4 t, `/ e6 k7 a4 T
吴清源新布局被本因坊一门认为大逆不道,二十多年前韩国流也不被日本棋手接受,武宫正树也下过55肩冲,围 ...
0 D$ N. E! `: N9 e, _1 u0 o/ A
对,我觉得也挺好。对围棋的正面意义很大。
作者: 删除失败    时间: 2016-3-11 09:36
煮酒正熟 发表于 2016-3-10 21:317 d2 g* I% ~: }4 d
我赞同人机大战时,人应该有打挂的权利。只是我估计这种带有浓重人机决战味道的赛事,也是一个巨大的广告 ...
' N5 v  k: U; s- O" I6 L8 j4 \
您的回复让我有了一个想法,7 V9 D  m2 _5 T2 O. q: E

0 }% I& f# _) e. g阿法狗的深度学习神经网络是不是可以理解为回归分析,基础数据是人类的棋谱,NB之处在于短时间内背靠google的硬件自我对局3000多万盘获得的海量数据,最后获得的函数模型对棋局布局阶段或者棋子稀疏的地方实用性非常高,实际上不需要强有力的硬件大量计算。如果是这样,那么人类想战胜阿法狗可能不能按人和人对抗的思路,布局阶段必须打破常规不能按常理出牌,人和人下星小目最多,和狗要下33,天元,甚至闭着眼睛随便放,避开阿法狗的模型,就像我们玩电子游戏一样。
作者: 煮酒正熟    时间: 2016-3-11 09:48
史老柒 发表于 2016-3-10 09:56# Q- W! s' Y$ g) H" S$ P
阿狗和樊麾对弈第五局第154手阿狗跟对方互相提劫玩来着。

8 q8 Z' z! N. p+ }9 m' Q" X前面有一堆人说阿法狗不会打劫,现在都跑哪儿去了?另外爱坛的国手呢?@夜观天象 @胖得妙不可
作者: 删除失败    时间: 2016-3-11 10:26
史老柒 发表于 2016-3-10 22:56
# c( M# S* h- L9 Q+ L阿狗和樊麾对弈第五局第154手阿狗跟对方互相提劫玩来着。
7 w  m, }4 A/ e  b1 z' Z
对狗打劫的质疑不是说狗完全没有打劫的能力,而是有没有在复杂局面下正确应对的能力。
) _1 v8 ]1 b. ]6 G4 |+ v7 F8 R* ~! o: w( x4 e. x
这局棋其实和老燕的帖子是一盘棋:美女唐奕二段对樊麾的批评。老燕的帖子里阿法狗的白棋有个简单打劫做活的手段,实战不仅没下出来还下了一步废棋,而想用打劫威胁白棋的樊麾竟然也没有继续追究,还莫名其妙得落后手放虎归山,实在难以理解。您贴的棋谱大局已定,黑棋做劫强撑,而且几乎是白棋的无忧劫,现在市面上的zen,crazystone也能正确应对,说服力还不足。
) Q$ L0 v8 P/ Y- l% s( r/ p3 r
& L$ g9 |2 u: z8 U* ^( n  Afacebook的田渊栋博士介绍他们团队工作时,承认他们还没有解决打劫问题,目前狗对樊麾李世石的7盘棋还没有出现直接影响胜负大型劫争,师母已呆
作者: 煮酒正熟    时间: 2016-3-11 10:59
本帖最后由 煮酒正熟 于 2016-3-10 22:00 编辑 6 x) x6 l; ^+ e2 Z7 L5 C  L
删除失败 发表于 2016-3-10 20:36- @8 o9 L. }8 T1 C# X8 A9 t
您的回复让我有了一个想法," `4 ^, g+ D+ y9 U& k* I
5 B. y. O* D( s' b5 ]3 F
阿法狗的深度学习神经网络是不是可以理解为回归分析,基础数据是人类的棋谱 ...
  D5 x0 _" K4 G5 ]5 P' Y
' a/ ?" E* C5 G+ ?8 X5 ?( m: r
阿法狗到底是怎么回事,我也不十分清楚,只根据我的猜测胡乱说两句吧。
. I6 W, j) p' p. n% Y' z4 W传统棋类AI的基础是蒙特卡洛树型搜索 (Monte Carlo Tree Search). 阿法狗自然也有这个。但这个是很低级的计算方法,不是高级算法。阿法狗算法里面的高级部分是价值网络和政策网络,这两个东西合在一起,就是要模仿人类棋手的“棋感"。价值网络和政策网络负责掌控宏观形势,基于对宏观形势的研判,指挥蒙特卡洛做有限的树型搜索。注意有限两个字。如果没有价值网络和政策网络的宏观指导,光靠蒙特卡洛树型搜索去下棋,以围棋10的170次方的近乎无限种的应对方式,阿法狗一步棋会下到地老天荒。3 F5 `/ d$ [4 W+ k6 K' T
* `* }% K# I0 r' [
价值网络和政策网络的技术基础,是很高端的所谓深度神经网络技术。这个俺不懂,就不乱说了。
$ I$ V6 x& L5 Q' F. e/ G2 @. H" b/ A' G/ U, _
说到底,阿法狗之所以下起棋来比较像人,就是因为它有着相当复杂精妙的价值网络和政策网络。它在实战中的应对之所以屡屡技高一筹,得益于大数据时代的软硬件(比如cloud computing,你说它是硬件还是软件?)
4 h/ g7 z) K6 q$ V; h  D# y  n$ w$ @- v
至于你说的布局方面要打破常规,我觉得最大的可能是被狗狗直接识破并干翻。狗狗从一出生,喂给它的就是职业高手的应对之法,一开始也许是囫囵吞枣知其然不知其所以然,但训练久了,它就逐渐明白什么是假招儿虚招儿了,也就是说已经知其所以然了。就算你玩儿什么百花错拳,妄图乱拳打死老师傅,最多也就只能赢它一盘,甚至连赢都赢不了,只能暂时抢到一些优势。长久来说,百花错拳完全无用。
0 Q# z7 }/ N  D
8 c: [! z+ H6 ?" G8 Z3 X; b
作者: 冰蚁    时间: 2016-3-11 11:18
删除失败 发表于 2016-3-10 20:36
' `! h8 p. k4 e您的回复让我有了一个想法,$ Z! c6 V% P8 r1 a7 [' f3 k

3 `0 X9 z' M6 V' K2 x阿法狗的深度学习神经网络是不是可以理解为回归分析,基础数据是人类的棋谱 ...

, u! V# m) y: T8 J这样下会被狗扁得体无完肤的。
作者: xlan1976    时间: 2016-3-11 11:35
史老柒 发表于 2016-3-10 22:56
, Y+ M1 V' O5 P阿狗和樊麾对弈第五局第154手阿狗跟对方互相提劫玩来着。

3 t# B9 h0 b! U' l- e
( P; U5 e$ c( Y" \4 ~2 i0 o0 p7 D但这就无法解释李世石在第二局的着法,因为在最后右上角明显有一个打劫争胜的机会,而李世石只是简单定型,另外左上角的打入也是可以做劫的,而且那个时候明显白棋劫材有利,但李世石没有做劫,而是跳了出来,结果实地大损。2 T3 _, Y- c# R
你给的这局棋,打劫的情况非常简单,很容易把握。当然这可以说明阿狗会打劫,但没有证明它有处理复杂劫争得能力。
5 b- |. R' V. i, ^( I( Y- g另外,阿狗与李世石第二局棋,阿狗也有可以主动开劫的机会,但它也没有做,当然你可以说这是因为它觉得已经赢了,所以不开劫。但李世石肯定是会打劫的,而上面我说的那两个地方明显有利于打劫而李世石不开劫,当然会让人怀疑了。
+ I- \3 M4 c# l9 n% q. E% m# J第一局李世石左上那一子也有打劫搅和得机会,但最后那颗子无疾而终了。
作者: xlan1976    时间: 2016-3-11 11:39
冰蚁 发表于 2016-3-10 21:52+ G# N# o# s/ h* x
昨晚上我没熬得住,看了开头就睡了。你看了后,觉得小李有机会寻劫么?
+ z4 {. J! c2 u+ F& D8 g; y# q象第一局,我就觉得没机会寻劫吧 ...
( a+ O2 k4 a: g- C6 ?
有的,第二局至少有两个地方李世石有机会主动开劫,而且第一处开劫的处理明显比实战强很多,第二处则是最后争胜的机会。
作者: 冰蚁    时间: 2016-3-11 11:41
煮酒正熟 发表于 2016-3-10 20:48
9 M- u/ r8 g* J) M前面有一堆人说阿法狗不会打劫,现在都跑哪儿去了?另外爱坛的国手呢?@夜观天象 @胖得妙不可  ...

+ m, J4 D, Q7 V) S. N7 i
* J' t* e5 }* ohttp://www.youtube.com/watch?v=NH8fU2ZPHLk- d& I# O% v. S2 S, E! u/ p

1 Q. D/ W# g" c* g油管有个第二盘的复盘讲解。
作者: 冰蚁    时间: 2016-3-11 12:06
xlan1976 发表于 2016-3-10 22:39
* J* a% w" V: Y有的,第二局至少有两个地方李世石有机会主动开劫,而且第一处开劫的处理明显比实战强很多,第二处则是最 ...

3 j4 R  B/ t0 X3 w& |9 H. L不过我看完第二盘的讲解后的感觉就是小李这盘已经下懵了,到最后彻底放弃了。大概第一盘的失利打击太大。那样激烈的乱战,阿法狗都接下来了,没有大失误,反而算得比较清楚。这个结果导致小李第二盘棋下得非常保守,思虑过多,畏首畏脚,不敢开战,打劫又担心算不过计算机。后来要输的时候,心理已经崩溃,完全放弃。
/ u0 F3 h3 j5 o  Y( F6 [7 V) A
) Y2 g: B+ X' @3 I' F3 q樊麾曾经也为自己辩解说,和 alpha go 下好象面对一堵墙。这种心理上的压迫可能是小李失误的原因。
- H! \6 g9 u" p* ~. ^
( ^; U4 k1 f& J: S1 f! a个人观感。
作者: holycow    时间: 2016-3-11 12:25
冰蚁 发表于 2016-3-10 19:18; L* U" J( _3 ^0 d' X9 L, w+ ~: H
这样下会被狗扁得体无完肤的。

6 T1 k3 C6 T- {9 U+ s, u狗是彻底的1:0主义,从来不追求什么杀得体无完肤;反而是遇强不弱,遇弱不强
作者: 冰蚁    时间: 2016-3-11 12:31
holycow 发表于 2016-3-10 23:25
% c* o) E) w/ ~9 ?! r* I1 d狗是彻底的1:0主义,从来不追求什么杀得体无完肤;反而是遇强不弱,遇弱不强 ...
( X! z+ Q0 ]& a, m' W
不是啊。这次第二盘狗表现出的大局观非常好,对实地敏感。棋手乱走棋,自己就更算不清变化,而狗是无所谓的,实地的差距会越来越大。
作者: xlan1976    时间: 2016-3-11 12:39
冰蚁 发表于 2016-3-11 12:06
; J+ Q0 m$ j1 c5 g不过我看完第二盘的讲解后的感觉就是小李这盘已经下懵了,到最后彻底放弃了。大概第一盘的失利打击太大。 ...
5 R% G4 {0 V# g7 g6 h- }! ]
第二局最后阶段小李的确有些枪法散乱,但要说彻底懵了应该还不至于吧,他最后抢右下的大官子说明他对形势的判断还是清楚的,所以我觉得右上可以向里冲靠打劫撑住这个他应该能看出来,毕竟像我这样好几年没下过棋的纯纯的业余爱好者都能一眼看出来。最后时候全局劫材如何我也不知道,但对于职业棋手来说,输1目和输100目都是一样的,这里不管阿狗看没看清楚,只要小李自己没有看清自己的劫材一定不行,就肯定是要往里冲的。
( ^5 E# q3 Y) k: s7 E而左上那里,当时棋局还在正常进行,小李在自己劫材绝对有利的情况下不开劫实在匪夷所思,如果这种情况下他都觉得会算不过阿狗,打劫会输,那干脆就该直接认输了,后面根本没有下的必要。而正是从这里开始,黑棋实地取得领先。实战这里根本没有复杂的战斗,小李选择的变化非常简单,这么简单的就把实地损出去,小李的做法确实让人难以理解,所以柯洁为啥说恶心加绝望呢。
; h7 y* [# Q6 i8 m另外,第一局实在称不上是乱战,双方下的都很有章法,但小李在关键的细节处理上没有做好。. v+ @9 @8 T8 {+ v" o9 [
纵观这两局棋,我个人看法是觉得,阿法狗并没有表现出超出人类棋手的棋力,它也并不是完全不出错的,但它的行棋策略完全不受失误和退让的影响,每次它有失误或是退让之后都能冷静的把局面撑住,而人类棋手只能在少数情况下做到这一点。
作者: 删除失败    时间: 2016-3-11 13:01
google澄清了
% g# a4 k, L$ Y' ~/ @( v3 I/ E1. 没有限制打劫# w# r8 Y& n9 T# z7 F# ]$ ]
2. 用得是分布式版本
作者: 史老柒    时间: 2016-3-11 13:05
本帖最后由 史老柒 于 2016-3-11 13:12 编辑 ( l4 m$ H9 {4 h' Y3 ^
删除失败 发表于 2016-3-11 13:01, H, j, T/ \1 S: T! i1 ^7 z7 \
google澄清了
2 x* A; a1 @+ F% V1. 没有限制打劫
4 a8 j: i  |, [" Q8 Z9 x2. 用得是分布式版本
( o* o6 G2 u9 t

( c( D' g  z* i$ P# b5 b附议,我来发个全文。
( c# z. M5 h+ }; n/ ?+ a# E+ C$ X! X% b# b
AlphaGo开发者:不存在秘密协议 请尊重李世石
, d' H. z6 f; a3 v5 c0 {) _& {0 c8 H% o; |: k3 k
谷歌围棋程序AlphaGo昨日再次击败韩国围棋国手李世石九段,此结果迅速引发赛场内外关注,而且在国内直播中,中国围棋国手柯洁九段表示,对李世石始终没有“打劫”表示质疑,并继续称“是否因为签署了秘密协议不得使用打劫”。今日,AlphaGo的开发者之一黄士杰(Aja Huang)——比赛中替AlphaGo落子者在网上做出公开回应,表示不存在所谓的“秘密协议”。新浪科技也就回应向谷歌方面征询,尚未收到置评。8 V& y' W. C9 k: L5 Q2 B3 \' W
10日比赛直播时,柯洁就李世石一直不打劫表示质疑,并认为是否存在和谷歌的秘密协议,因为打劫会增加围棋比赛中的变数和精彩程度,可能存在机器无法应付的情况。8 V9 L! U& B1 g0 I( }# P/ P( x# c% q6 w
柯洁的质疑迅速在微博上传播,关于“不能打劫的秘密协议”迅速传播开来,甚至在韩国比赛现场的赛后发布会上,来自腾讯的记者以“是否存在不能打劫争胜的秘密协议”向李世石提问,引发现场哗然,被认为没有给于参赛的李世石足够的尊重。2 g4 e5 Y, l" l" H* l
当时,李世石回应称:“在比赛中确实有胜机,以后比赛会尽力下好。”
4 J0 i# g2 Y. U# M柯洁其后也在微博上回应了此事,解释称:“不是说怀疑他签了保密协议里有不准打劫这一条,是对李世石的消极抵抗感到失望……多么希望有一场复杂的劫争出现。毕竟~劫争是围棋艺术的不可或缺的一部分。”
( D5 h9 _' W9 n( I& k( w- A8 h但事件并未就此结束,国内众多网友依旧在微博上表示:为何没有正面回应问题?
$ x2 ?  {* c  ^) ^! S* T11日,AlphaGo的开发者之一黄士杰(Aja Huang)——比赛中替AlphaGo落子者在网上做出公开回应,表示不存在所谓的不能打劫的秘密协议,并且为李世石遭受的非议感到不平,认为没有给于这位满怀勇气和深受压力的九段棋手给于足够的尊重。% n0 g4 ?  M7 }. Y) A
黄士杰随后向新浪科技前方记者证实了言论的真实性,网上的回应确实出自他本人,他还表示为李世石深感不平。" X+ X' }" k: ~! }/ y! X$ r5 i
作为AlphaGo两名首席设计师之一的Aja黄士杰博士,是棋力6段业余高手,无论与樊麾二段还是李世石九段的比赛中,他都坐在对面,成为人机大战中代替AlphaGo落子的不二人选,被网友戏称为谷歌围棋的“人肉臂”。: N! \( {& e0 ~1 u8 y) v! O9 V
以下为黄士杰在“弈棋”论坛上的回应原文:4 Q1 X9 L8 j* _2 S* O, ^0 R
现在网络上有许多谣言,有些人甚至对李世石九段作出人身攻击,我觉得有必要澄清。这次比赛不论胜败如何,我觉得我们都应该尊重李世石九段。他接受AlphaGo的挑战,所承受的压力一定很大。
& A# Y+ A! Z% d  [; Q- w1。这次比赛并没有所谓的不能打劫的保密协议。第一、第二盘棋覆盘时李世石九段都有摆出打劫的变化,只是实战他没有下出来。我们也想知道,AlphaGo在对阵李世石九段这种级别的棋手,打劫时的表现。5 D1 Y' l8 l7 S$ l* n8 X
2。这次比赛我们使用的是分布式版的AlphaGo,并不是单机版。分布式版对单机版的AlphaGo胜率大约是70%。
( _1 a3 f0 F2 i请大家自由转帖我的文章。
+ o: s4 X" ^% e- @& ]/ d! s; E此外,需 要说明的是,黄士杰2011年毕业于台湾师范大学资工系博士班,在加拿大Alberta大学研究一年后进入英国人工智能公司DeepMind工作,曾获得 台湾大专杯业余围棋赛冠军,在网上下棋搜集大量棋谱,一天可长达16个小时投入写程序,数年前也曾写出围棋程序Erica击败日本Zen夺金,获得谷歌庞 大资源的支持后,他与大卫席尔瓦等人研发的AlphaGo开创了人工智能新的里程碑。) R& W6 j& r3 L3 m0 B1 j2 i' j
对于懂棋 人士来说,人类被电脑打败总有些难以接受,尤其是李世石九段在局中出现了失误,于是网上出现“为何不打劫争胜”的质疑,甚至怀疑李世石是受保密协定的约束 而无法制造劫争。而在电脑专家、韩国乌鹭网郭社长看来,打劫对于AlphaGo来说完全不在话下,懂围棋程序的人对此都认为是不值一提的。
: G& i5 u0 }. r8 a! X# Y确实,在 AlphaGo与李世石2局棋中打劫次数不多,但在与樊麾5局棋谱中并非没有打劫,尤其是第5局出现了多个回合的劫争较量。或许在人工智能眼中,打劫手段 并未简明取胜之道,所以属于下下策。而关于围棋打劫技术的相关内容的人工智能论文多达数百篇,说明此问题早已不是难题。
+ ~. \$ D) `3 b' S# b6 x8 Y' @: J% N2 d4 N
@煮酒正熟   这算官方正面回应了,不但会打劫,而且此前下过劫争。发给您去打他们的脸嘻嘻……
作者: 燕庐敕    时间: 2016-3-11 13:14
史老柒 发表于 2016-3-11 13:05) C/ l$ k: T2 }& n, x
附议,我来发个全文。
3 [' U9 X- G, ?) Y
$ p& F" g$ M  K; iAlphaGo开发者:不存在秘密协议 请尊重李世石

/ q$ C  j4 j% Y, h/ S4 ~/ _局面不利才造劫,这是常识吧?% F5 ?5 T4 _9 \; W& M( Q2 n, E4 a. ?

0 x; F# ]3 G+ y( W( F- T依仗劫财的优势扳回不利局面,是打劫的目的。; n1 J3 u9 q$ d* Z

' J2 v2 ?" J" x7 `0 Y有利还打劫的,基本不会是机器的选项。2 K( m2 z( Y1 ^8 H& F& g
# G( u, l3 J" D* q
棋手明明可以造劫却不做,当然可以被怀疑。就像可以面对守门员的单刀球你非要回传,别人多半会觉得有疑问。
作者: 史老柒    时间: 2016-3-11 13:15
燕庐敕 发表于 2016-3-11 13:14
9 o; d' {: ]: ~4 Y# T/ k局面不利才造劫,这是常识吧?2 {* P; V! ]: \- ~6 J1 Y

9 ]( t  _4 E0 O6 E4 J9 `6 `依仗劫财的优势扳回不利局面,是打劫的目的。
7 t: b* X# k5 H; N
怀疑当然可以,但是不要嘴硬" W7 B6 B$ o5 n# E( g( ?
尤其是有证据出现的时候。
作者: 燕庐敕    时间: 2016-3-11 13:17
史老柒 发表于 2016-3-11 13:15+ s# i) C% e! M' n2 ?
怀疑当然可以,但是不要嘴硬+ F: y0 R7 `' Z3 \( ]- U. m8 L, c1 o
尤其是有证据出现的时候。

" ~& i8 G8 g; l9 @- O+ W9 V& n所以李世石看来真实水平就是和机器下的水平,以前赢棋心理战成分更多。
7 j0 d& @7 _; O/ x1 N6 U$ e
6 G9 W7 |8 K7 ^3 Q碰到更年轻,计算力更好的棋手,或者彻底没感情的机器,只能下出这样的水准了。
作者: 史老柒    时间: 2016-3-11 13:26
燕庐敕 发表于 2016-3-11 13:17
% O1 s- K) W  B& B/ L4 b: m所以李世石看来真实水平就是和机器下的水平,以前赢棋心理战成分更多。+ v& L0 E; V5 s" j* J" L

( T2 C: j, V' {1 E! o! Q9 t3 s. `碰到更年轻,计算力更好的棋手, ...

3 t$ e  ?" P% [& j0 ]3 n( c+ A, o所以柯神才是人类最后的希望,谷歌公司已经公开发表声明下一个考虑让阿狗挑战柯神。: ^$ E8 q9 l1 Z! `( W; Z
% q# l- e/ X) A. Z
但是目前柯神有点怂。
) A, v. B- r0 s, i! E2 ?5 G8 r前天那局棋,小李子输了,柯神在微博嘚瑟阿狗你赢得了小李子赢不了我。
5 |, ~% c( r7 V& X2 d3 P  C昨天那局棋结束之后,柯神接受记者采访说对阿狗胜率65%,同时他表示对小李子胜率85%。
- {7 B7 E( J9 m: y+ t
6 a9 d# G' c2 D; ~2 g可以说昨天一局棋,世界围棋界各路九段高手基本都怂了。
/ z4 b% h0 P3 _2 ?俞斌九段和古力九段全程没看懂,一直说小李子占优结果被打脸,大局都判断错了我就不说了。
, Q0 B9 K6 O+ d柯神倒是没丢人,大局至少看得明白,但是柯神说阿狗几步棋他也看不懂,他说小李子就够让人看不懂了,阿狗比小李子还莫名其妙。  s8 a4 A# |8 R2 [% Y* Y. t
$ n7 L. B, z' ~0 U8 s" c
聂圣看到阿狗55尖冲那步棋直接脱帽致敬。
( G8 @# q- D; z# ?" Q8 Q( y( U- _" N
俞斌九段在当年阿狗赢了樊麾之后表示阿狗的水平职业初段以上无限接近职业二段。5 P/ F  B, U9 h
但看完昨天的棋表示无论以什么标准来衡量阿狗都具备职业九段的水平,记者还开玩笑的说5个月直升九段好快。/ o- E: F- D$ H( A1 h1 ]

! x# f2 e6 }" t2 U而且聂圣最后总结发言,虽然阿狗有几步棋他和其他几位九段谁也没看懂,但是通过复盘得出一致结论,至少棋不坏,因为不在任何棋谱里,所以可以认定为阿狗自主思考所得。
+ M7 n3 ~! l8 f1 Y6 p就为这个,聂圣脱帽致敬。
% ?7 w6 b0 X( D. R' ^. m
& O& o4 {# A2 t1 }燕老大,时代真的不同啦……
作者: 燕庐敕    时间: 2016-3-11 13:30
史老柒 发表于 2016-3-11 13:26
, O3 G) j* e" m4 ], S2 `所以柯神才是人类最后的希望,谷歌公司已经公开发表声明下一个考虑让阿狗挑战柯神。
) I6 y6 z% t5 L1 [
7 `3 V4 Z/ Z) G* E0 F但是目前柯神有点怂 ...

( F0 s' n# @) r他现在能胜,不代表两个月后还能胜。
4 H* z2 X: ~" o: o& |7 p5 K- s9 {9 e  D/ E; O, R) A9 D0 i
我在前面就这么说。机器未必有涨棋的瓶颈,人一定有。) }2 L7 {7 u6 t% v8 z/ z2 C
+ Z- l8 ?1 e. L5 o0 d
其实就像煮酒说的,就是这次小李5:0胜了,也改变不了过些天机器彻底压倒人类的趋势。
作者: 史老柒    时间: 2016-3-11 13:36
燕庐敕 发表于 2016-3-11 13:30: H. `4 [3 [3 `# ^
他现在能胜,不代表两个月后还能胜。% a/ ]  s; j7 u) k* M$ W6 m' |
: c! a1 `3 Z/ |! |! i# a% T4 V
我在前面就这么说。机器未必有涨棋的瓶颈,人一定有。
- T/ y2 a1 ]1 j7 }& }! E
如果电脑没有瓶颈,把围棋无限的发展下去的话,围棋最终是什么样的?  }4 ~/ i1 V4 m7 e5 u
穷举不可能彻底破解围棋,那么电脑以神经元算法每天20万局自弈棋局的速度在学习。
; m$ {! c  T$ r# p假如俩月之后就可以花样虐柯神的话。
, \1 b* R) q  W6 C' c( L* g6 U9 Y! b
* [% a% D7 j! t那么两年之后阿狗的水平会达到什么高度?
作者: 四处张望    时间: 2016-3-11 13:47
史老柒 发表于 2016-3-11 13:364 }$ F" {6 y0 `1 v$ I0 D
如果电脑没有瓶颈,把围棋无限的发展下去的话,围棋最终是什么样的?3 ]6 N5 ^2 ?0 L$ A( x
穷举不可能彻底破解围棋,那么电脑 ...

1 s4 R" w! a+ E) L% S0 j, N+ u已经有人在猜想,最终能达到让多少子。
作者: 史老柒    时间: 2016-3-11 13:49
四处张望 发表于 2016-3-11 13:47
5 g8 Q( x0 t. d& e已经有人在猜想,最终能达到让多少子。
( E) `$ o8 }6 e4 F' w
现在可是职业九段让职业初段3子基本稳输,让两子互有胜负,让一子基本能赢。
( \& m! b. q7 Q: \. d& n# m
+ H# q, {0 }9 ]2 D3 V5 x到时候电脑让职业九段三子,然后还稳赢……! e! P' [2 x' C; n0 c
艾玛,这画面太美不敢看
作者: 四处张望    时间: 2016-3-11 13:50
史老柒 发表于 2016-3-11 13:49* ]' ~9 \0 M% \1 m
现在可是职业九段让职业初段3子基本稳输,让两子互有胜负,让一子基本能赢。
" i; e* ?8 O$ c. w' N
  ~8 [9 j/ ~$ |. m6 e到时候电脑让职业九段三子 ...
# l* H3 R- d* w+ J+ _; F( N& {
或者可以用来衡量人类距离完美围棋有多远
作者: 寞洑    时间: 2016-3-11 13:51
看到一个神回复:李世石出门前,先在网上买了自己输,然后从容去参加比赛,这就是电脑不能战胜人脑的原因。
作者: 燕庐敕    时间: 2016-3-11 14:01
本帖最后由 燕庐敕 于 2016-3-11 14:15 编辑
6 w( U8 J% X5 g
史老柒 发表于 2016-3-11 13:49
) S4 q4 [% }, I' M/ _7 w. ~6 G  c现在可是职业九段让职业初段3子基本稳输,让两子互有胜负,让一子基本能赢。
( c* J9 N9 \0 V$ ^7 b3 u. D+ O% {+ t+ [, `. z4 V4 K
到时候电脑让职业九段三子 ...

4 u6 L( h. H7 |6 I" }9 Q- V3 a6 X. c5 X
之前《围棋天地》有对各个年轻棋手的采访,问到假如你认为有个围棋之神,那你觉得今天顶尖高手能被让多少子?$ y: ^  L: I  |
2 U2 M' S% i8 `, m. n
我印象里大部分棋手回答是3~4子。9 c% T2 \: X9 M; Q9 ?, m

' b; C) @7 h  R% b没有回答让先让两子的。也没人说让六子啥的。
7 F5 r+ u1 p% N) \* S9 i* A) O3 |" [- O7 H& r
老七,没有让一子,一般是说要么让先,要么让先还加倒贴子。
作者: 冰蚁    时间: 2016-3-11 14:12
燕庐敕 发表于 2016-3-11 00:14
$ j5 O! `; K; ^0 X4 ?局面不利才造劫,这是常识吧?
5 r7 n: v/ _: n  o) F! d. ?( }5 b% o# f' C
依仗劫财的优势扳回不利局面,是打劫的目的。

/ I: {, z/ Z, \, Z' j2 o按新闻描述,小李后来都摇头,手抖,叹气,出汗,满脸通红,这状态估计看不到劫了。我坚持认为他下懵了,压力太大,太想赢,就完蛋了。
作者: 燕庐敕    时间: 2016-3-11 14:16
冰蚁 发表于 2016-3-11 14:12/ [, y" |& d2 l4 K! x  x$ ~
按新闻描述,小李后来都摇头,手抖,叹气,出汗,满脸通红,这状态估计看不到劫了。我坚持认为他下懵了, ...

% {: N; k8 W! X* G6 w棋手的“不动心”,如李昌镐般,很难。
  a" f7 S, k& L. I& O4 @4 g9 ^1 S% ^" x
5 }& Y) U" r) o3 X* y' U/ ~7 P9 K小李确实是个情绪化比较厉害的选手,第一盘要是他胜了,估计他还能连胜几盘。现在看被碾压的感觉了。
作者: 穿着裤衩裸奔    时间: 2016-3-11 14:31
放个话在这等着打脸。柯杰没戏。! D+ T" W$ x3 x* u; Q1 @5 m" f
昨天第二局AGO表现出来的水平,人类完全不能敌。5 s) y8 l0 e: @; |
个人感觉主要是搜索深度问题,AGO开局到中盘过渡过程中,高举高打的招法多。而且对各块棋之间的连接理解能力超过职业棋手。
5 j4 [- _! g9 r: @人不敢下的太高,是算力不够的原因,ago没这个短板。所以可以高位落子,效率远超人类。
& b3 P) z+ d, F放眼望去,满盘都是黑棋。
, n& R- R( l) X总之是完全压倒性的胜利。
作者: 史老柒    时间: 2016-3-11 16:31
燕庐敕 发表于 2016-3-11 14:01# A3 ?( ]' w" `
之前《围棋天地》有对各个年轻棋手的采访,问到假如你认为有个围棋之神,那你觉得今天顶尖高手能被让多少 ...
, X, ~# n0 K% ?" k8 S
让子指的是先让黑棋在盘面上任意位置摆放子没错吧?
$ v% {: P% Q  O& J贴子指的是贴目吗?4 u: I% w* m( v5 x+ ^$ E

9 y9 N0 z5 ]& D* m, n) U3 C% m现在的九段让初段先在棋盘上摆四颗子(基本就等于让出四角)我的理解是这就叫让三子。
2 z8 L, T4 _$ |% n' u1 z" c( R在这种情况下,基本九段是输的。
! Z7 m' I; X" r+ c+ ?
" I# J+ u. F1 J7 @- i1 ]2 R/ t贴子以前我的理解是贴目,比如整场比赛黑棋贴白棋七目办,但是在非正式比赛的时候,可以多贴或者少贴。
作者: 四处张望    时间: 2016-3-11 16:32
穿着裤衩裸奔 发表于 2016-3-11 14:31
# B1 s6 i4 M5 H/ N+ G9 A  Z) S7 g$ ^放个话在这等着打脸。柯杰没戏。
6 B. R7 v. |7 {% s/ H$ S" m% J/ l昨天第二局AGO表现出来的水平,人类完全不能敌。
  q( O" E5 Z' y5 L  a个人感觉主要是搜索深度 ...
" f' |8 H3 z2 q3 g4 v

. _2 ?/ d8 \3 V2 O1 S, |我不懂围棋,但是如果第二盘小李觉得是毫无机会的,柯杰也没戏。下一步真的需要讨论实际上可以让先多少子的问题了。
作者: 四处张望    时间: 2016-3-11 16:44
寞洑 发表于 2016-3-11 13:51
$ V3 a  t7 D5 _3 Y3 j看到一个神回复:李世石出门前,先在网上买了自己输,然后从容去参加比赛,这就是电脑不能战胜人脑的原因。 ...

3 K9 L0 v( c( M( Y这种回复当段子也就罢了,但是实际上我看很多人真的这么想了。
作者: 燕庐敕    时间: 2016-3-11 16:45
史老柒 发表于 2016-3-11 16:31, u# \% P4 V( Y5 l+ R3 Y
让子指的是先让黑棋在盘面上任意位置摆放子没错吧?3 c' P: `! |, J5 B/ x
贴子指的是贴目吗?
7 |% y0 @6 @: l/ B
那个叫让四子。4 ]! G3 |- w; }. k; g& d# ?
" y" v$ _+ b  H, R
帖子是中国规则,韩日是贴目。一子等于两目,现在人机大战用的是中国规则,因为子空皆地对于机器更好计算,单算目还比较罗嗦。
作者: xlan1976    时间: 2016-3-11 16:48
史老柒 发表于 2016-3-11 13:49! p1 [7 L" H  a* z) O1 Q
现在可是职业九段让职业初段3子基本稳输,让两子互有胜负,让一子基本能赢。& [  O3 `+ A8 J7 ~. Z: T4 @# ~1 v" ]
' B! U. Q9 H* b
到时候电脑让职业九段三子 ...

; F0 K9 s+ H: j# o, t4 p' k没有让一子这回事你的这个说法是从那听来的。。9 ?) Y1 X# l3 O- @) |
按照最早日本的定段规则,名人(也就是那时的九段)与初段的棋格差是三子,但现在的职业棋手之间,基本不会存在让子的差距,甚至连让先的差距都不会有。
作者: xlan1976    时间: 2016-3-11 16:58
史老柒 发表于 2016-3-11 16:31
6 k' Z# P/ D  S% S, I1 w4 m让子指的是先让黑棋在盘面上任意位置摆放子没错吧?
! V+ a6 J1 _, q7 b( s- i, `贴子指的是贴目吗?

& U3 U( k, _4 H- ~/ v那个是让四子。被让一方盘面摆几颗子,就是让几子,让子棋是不贴目的,所以最少摆两颗,不然就是让先,不是让子棋了。* R) C9 {: J6 Y: l9 M) n6 c4 A
贴子是中国规则,贴目是日韩规则。因为中国规则是数子法,日韩规则是数目法。日韩规则,执黑一方贴六目半,中国规则执黑一方贴3又3/4子,相当与贴7目半。这次比赛采用中国规则。: Q% F8 ~" ^( ~  j" ~, {
不论是不是正式比赛,执黑一方都是按照相应的规则贴目或贴子。
6 {/ B2 N! S3 ~# C; `0 ?当然,规则是不断改变的,之前日韩的规则是贴5目半,中国规则是贴2又3/4子,后来觉得这种情况下执黑仍有利,才改成现在这样。在最早日本探索贴目规则的时代,还有过贴4目、5目之类的对局。
作者: xlan1976    时间: 2016-3-11 17:10
史老柒 发表于 2016-3-11 13:152 t$ K$ l1 R6 P5 ]  x
怀疑当然可以,但是不要嘴硬- W: t! _8 v8 R
尤其是有证据出现的时候。
2 w8 a; f& `% G. u. p( z# T
怀疑的不是狗为啥不打劫,的确这两局狗没啥必须要打劫的地方。怀疑的是小李为啥不打劫,小李会打劫这点就不用证明了吧。所以,你的证据没用
作者: 穿着裤衩裸奔    时间: 2016-3-11 18:40
xlan1976 发表于 2016-3-11 17:10
+ P' ^7 J1 Z; o5 ?& F0 \怀疑的不是狗为啥不打劫,的确这两局狗没啥必须要打劫的地方。怀疑的是小李为啥不打劫,小李会打劫这点就 ...

+ O5 s4 b2 H! r: e7 G打劫本来就是劣势方干的,go觉得自己一直在碾压,处处走厚,肯定不会打劫啦。
作者: xlan1976    时间: 2016-3-11 21:30
穿着裤衩裸奔 发表于 2016-3-11 18:40' Z! ^. M6 s2 e
打劫本来就是劣势方干的,go觉得自己一直在碾压,处处走厚,肯定不会打劫啦。 ...

% M" Y2 x- V, {6 I, d我不是也说了狗不需要打劫嘛。' s' `. o6 O7 X% u$ p% n7 k* @
另外,并不一定是劣势一方才会主动开劫。很多职业对局里,如果优势一方已经算清了劫材,也会主动开劫的,因为可以通过打劫把未定型的地方走清楚,把局面转换到更容易把握的地步。此外,有些对局是在开局或中盘阶段就开劫的,这时候还无所谓优劣呢。
作者: snark    时间: 2016-3-12 00:19
冰蚁 发表于 2016-3-7 22:466 p- Q1 w  f9 U- o  q+ D0 A
我知道你是说刘锋,不是你的观点。国外其实也是这样。technology 和纯 science 并不是等同。google 这个 ...
2 g* F- H' ]6 L  l" t! Z
要是发在Science估计也没什么好抱怨的,
5 E" y$ z" y. R2 U但是这样的东西发在Nature确实不合适。
) ]' a; E8 ~# L
* g* _& Q; [& q4 X& B# D就像你说的半导体技术,核心技术可以不公开,至少拿出产品让人验证性能总没错吧。& I* h, u1 w+ K( d, U

作者: 冰蚁    时间: 2016-3-12 00:28
snark 发表于 2016-3-11 11:19! y8 j! U" q9 E5 f6 m: o3 T
要是发在Science估计也没什么好抱怨的,4 }% v0 M9 c- G) |, G; j8 s
但是这样的东西发在Nature确实不合适。

7 j' @* }" r8 |那你等着吧。半导体这种有个 prototype 就可以发论文了。一整片晶圆上面只要有个别能工作的芯片就能整篇论文出来。别的公司要拿到最终量产的产品测试,那还得等个至少一两年。而且最终量产的产品的指标和 prototype 指标不完全一致也一点不奇怪,因为量产会有量产的考虑。$ o* `- Z/ j1 _7 c6 F
4 ]2 [8 H1 z+ z
nature 发点 technology 性质的文章也没什么不合适的吧。
作者: snark    时间: 2016-3-12 02:39
冰蚁 发表于 2016-3-12 00:28
: g; B* y" j! N+ c+ J) Q  W9 ]那你等着吧。半导体这种有个 prototype 就可以发论文了。一整片晶圆上面只要有个别能工作的芯片就能整篇 ...

! S8 W, I* U& ?& [  g就算只有一个prototype能工作,那也是可以验证其能工作的啊,你可以不公开生产技术,但你总不能不提供验证其能工作的数据吧。卖颗导弹也得先射几颗打打广告不是9 z/ l& `1 Q' ?/ f' [# p
我们生物这行,一般讲但凡论文中出现的都算公开的,质疑你的实验结果,可以要求你提供原始数据,提供实验记录;论文中构建的载体,试验方法,等等,只要有人出于科研目的索取,据我导师讲,你是应该提供的,当然索取者一般会主动承担相应的成本。
  l& m. f1 v( S! E7 v8 H/ J% f4 q4 A# A' D6 u/ v/ k
不是说Nature不合适,而是说不公开细节不合适。Science更偏技术一些,像这样隐瞒技术细节的东西发在Science上大家比较能接受吧,至少我能够接受。
作者: 冰蚁    时间: 2016-3-12 02:53
snark 发表于 2016-3-11 13:39
3 C# y6 G% G. V: `' N% r. c- U) P! ~就算只有一个prototype能工作,那也是可以验证其能工作的啊,你可以不公开生产技术,但你总不能不提供验 ...
3 J# ?& F$ \5 J/ }& A& q  s4 V+ B7 R
嘿嘿,数据都要normalized,或者百分比的。哪能轻易给原始数据。你要求原始数据什么的,这是搞science 的搞法。industry 这么搞,把自己的technology 都要泄个底掉了。
作者: snark    时间: 2016-3-12 03:37
冰蚁 发表于 2016-3-12 02:531 P' N. x. |% Y" s/ S
嘿嘿,数据都要normalized,或者百分比的。哪能轻易给原始数据。你要求原始数据什么的,这是搞science 的 ...
. W0 J7 a  k1 D% I9 |) o3 y& n
按industry的搞法在学术期刊发论文不就是学术欺诈么?
  N3 x8 T5 e3 c3 {0 h/ T0 e9 v. O这句话没问题吧0 ]1 v: K$ p0 i
$ o. i8 ^. I/ \) x( j
具体到AlphaGo,去nature翻了一下,人家这个仅仅是news,不是letter更不是article
! D' [) g/ I9 [4 J. ^http://www.nature.com/news/googl ... -game-of-go-1.19234! [) |! |6 B7 F% v7 E7 O
这个人工智能学家刘锋是有点借题发挥了
+ f3 ?( h# S- x7 n0 S1 c# T3 |+ x6 Q/ g! j( b0 Y* d
但是把AlphaGo定义成非学术是没有问题的,你自己也承认的这是industry的搞法1 d; A& b. l6 ~, t! N# Y8 w. b& p

0 R! d/ w9 G% ]" ?- g, b
作者: 冰蚁    时间: 2016-3-12 03:53
snark 发表于 2016-3-11 14:37
+ s0 P  r  H5 y+ V1 \4 n按industry的搞法在学术期刊发论文不就是学术欺诈么?
0 J8 B1 k: y' _/ e这句话没问题吧

1 h/ x/ L8 ^4 H5 R2 c+ P那你岂不是把比如 IEEE 底下的好多专业期刊 (journal,proceeding ) 全搞成"学术"欺诈了。那里面有学校的 research paper,可也有industry 的 technical paper。没这么玩的。
作者: sitan    时间: 2016-3-12 04:04
史老柒 发表于 2016-3-11 16:31# g% o" R) f; m: M3 [
让子指的是先让黑棋在盘面上任意位置摆放子没错吧?, t/ t  }$ U. Z: g9 g% U+ s: I3 I
贴子指的是贴目吗?

4 v# s! `  j1 t4 b- e4 F一般九段让初段让不动四子。大概让先(即不贴目)。超一流九段可能可以让两子。
作者: sitan    时间: 2016-3-12 04:11
snark 发表于 2016-3-12 02:39
- @) Z+ }, s/ N0 b) W' z% r就算只有一个prototype能工作,那也是可以验证其能工作的啊,你可以不公开生产技术,但你总不能不提供验 ...
, ^0 C4 ]2 O' y* a. Z
Nature 最热爱这种花里胡哨的东西了,图多好看啊。Science不一定爱发这样的。
1 ]* K+ W9 @& v' V你导师说的是无利益的情况,有利益情况不公开也是很正常的,只要有full disclosure就行。评审自然会考虑进去的。
! M7 J9 v( C) m: t1 X: s; e5 _& U论文里头把算法已经说得很清楚了,公开具体参数是很无聊的事情,有啥用呢,过一个月优化后参数又变了,还要更新不成?算法的思路是最重要的,已经公开了。
作者: sitan    时间: 2016-3-12 04:12
snark 发表于 2016-3-12 03:37: H" R) j, T! s( n# T! T1 s* h' ^
按industry的搞法在学术期刊发论文不就是学术欺诈么?
5 R' _' {/ |2 N% L: }) U这句话没问题吧
* M$ W- R3 }4 G/ X+ j
是article,你找错地方了。Deepmind以前还有另外一个论文也发在Nature好像,那篇里头他们灭了无数种游戏。: }# v; G& o' ]
http://www.nature.com/nature/jou ... ll/nature16961.html
作者: snark    时间: 2016-3-12 05:16
冰蚁 发表于 2016-3-12 03:53
4 m$ \5 q; f5 ?那你岂不是把比如 IEEE 底下的好多专业期刊 (journal,proceeding ) 全搞成"学术"欺诈了。那里面有学校 ...
# L# ]% T7 h2 ~6 c; x
我可能说的不确切吧6 a$ C% C2 g3 ]3 M' o
我指的论文应该仅限于research article
& f6 Q6 t( ~) _( z或者完善一下: N$ y* I/ X& }
按industry的搞法发学术论文才是学术欺诈6 A- h, r2 X1 d' ]5 d
这样就没问题了吧
: i1 E6 L) K) }+ n3 f7 ?# }8 L* o( @

作者: snark    时间: 2016-3-12 05:32
sitan 发表于 2016-3-12 04:11, e" }. ^' g/ R6 ^6 ~0 z0 M3 _! o
Nature 最热爱这种花里胡哨的东西了,图多好看啊。Science不一定爱发这样的。
( }* d3 M; Z  t3 ]  b; E你导师说的是无利益的情况 ...

. o( ?6 W5 p! R我倒不是觉得一定要公开具体参数
7 X; |* z- o' i# y! n而是要提供足够证据支持结论,要给出可以证伪的机会,才能让人信服,才算是学术。
: Y8 w$ Q/ _4 O* JGoogle声称根据某算法思路设计AlphaGo,但是不公开设计的细节,导致该算法思路不可以被其他课题组重复,同时又不给出机会让其他课题组验证AlphaGo的围棋水平,导致其他课题组无法验证AlphaGo的围棋水平。这不就像是车库里的喷火龙吗?
+ R  j3 t6 H) E9 m两个棋手签的保密协议,我就搞不懂究竟保密啥。
作者: 四处张望    时间: 2016-3-12 10:24
snark 发表于 2016-3-12 05:32
# x. T" l$ d. |/ _+ P我倒不是觉得一定要公开具体参数
1 ~4 _# ~2 {( S* a, I而是要提供足够证据支持结论,要给出可以证伪的机会,才能让人信服,才 ...

, _1 C& Y; t4 ]3 }3 c8 _那你可能不太明白围棋在人工智能领域的地位
作者: 史老柒    时间: 2016-3-12 11:43
李喆:这两盘棋 没人会比李世石做得更好!
) J: ]2 z1 y3 z! ^: E  G- J
% d4 |* B5 Z" H6 d0 a李喆,围棋职业六段棋手,龙星战冠军,AlphaGo与李世石九段比赛,新浪直播解说嘉宾。: I& e) f: y, i" Y. o" q( l
3 O3 e# S0 ^4 _) j/ c: T$ T
  引言  
, |. c- y* [) B" g3 u  我不知道这篇文章要怎么开头。
8 g+ G) m: P& `0 f  没有言语能够形容我现在的心情。% d; h; l; U& A( P1 g/ R
  19年前,围棋入门课,用十个棋子在中腹摆出两眼活棋。
3 J  q$ ?- G- f! b4 a1 a5 @: K& {( T  4年前,挥别围棋赛场,进了大学。: }! R% D% l: U
  怎么也想不到,在今天,竟然会为了一张棋谱,我哭了。
& M4 V# [- q1 e  A3 i0 U9 u' s  哭得很开心。
( R$ N5 I6 A0 }' S' _  我不知道这世界上还有几人与我此时有同样的感受。或许有,绝不会多。) `1 P3 J' k( z% a7 x; t) s! j
  我不奢求读到此文的人都能理解我在说什么。+ y% X7 R: j* p
  但是,我要把我看到的记下来。
1 ?8 }; Z  _$ J! ^/ X  不是纪念,而是感激。( |5 x) ]% T7 ~* |3 K; Q
  我发现,在情绪中,我只能记录下我的情绪,却无法写出这情绪的由来。虽然我自认为清楚地知道它的由来。
3 T: i" g+ A4 T, S7 w% ?  写一篇抒情的文章很容易,但没有什么太大的价值。我看到的东西,这似乎应该用“美”来表示的这种东西,难以抽象成语言将它描绘。于是,我只好等到情绪消退,从理性出发,试着把因果呈现。) ?5 |* u; H" T, U; |7 t
  这样,会有更多人享受到这种美吗?
0 F7 Q) Z* \# z. V  我不知道。
8 s/ ^! J: E1 s4 n  或许可以试试。# ]0 g! M0 R; t/ V1 q
  深夜。终于可以动笔。0 {" [6 o( t8 N$ y) c  m, h
- ~4 `; W$ z+ G' L7 E  @
  2016年3月10日,AlphaGo对阵李世石,人机大战第二局。9 Q* P& P; X2 e! c; r# K
( \: S3 e% T/ T8 @) b+ a* g( S( R
  对于这盘棋,虽然分歧远小于上一盘,但职业棋手之间仍然有许多互不相同的看法。# T. w4 \( R  s: d

9 D! C" N- U! F. K8 O  或许随着时间的前行,这些看法最终会汇流为一。但在今天,在故事发生的当下,面对经验以外的事情,人类观点的多元无法避免。我的观点同样也是这多元中的一元,正是人类思想的多元性丰富了我们的世界。
$ J' f# D$ C, E* o: d- h
% y1 r1 y. J4 K9 Z! I5 Z  在敲完上面这一串字之后,我原本准备神游到中午的状态,从头梳理一遍我的所见所思,将我看到的那无法用语言直接描述的感受的由来渐次呈现。
) u# ^+ w( t, y- G; F% ]1 v- y! I5 {
  然而,事实教育我们不要在写文章的时候刷微信微博新闻朋友圈……
! X5 m3 W3 ]! F( y
1 k3 q* \, v; I  {2 x: o) r  一个小时之后,我不得不再次改变写法。" P$ L4 [) R6 N$ d9 Y3 D* S- I
7 Y' m0 t0 r9 z/ G: Z2 O! U* \
  这两盘棋 ,没人会比李世石做得更好!
2 w* `; g6 s* v1 j1 ^7 [$ N6 k, f" N" l# P2 w
  是的,这就是我文章的标题。# u  s* X  m  k) t$ B9 b

' y7 A  i$ }  l) G' D$ F7 m; f7 W$ d  我知道我说服不了所有人。这样的标题也不是我一向的风格。  @" D, n4 C5 y7 s: I
' |& h: Z2 W( F5 h& d
  但是,在铺天盖地的对李世石的质疑声中,我必须把我看到的讲出来。
) s$ l) c9 L% r- \2 e( P% K  E9 T( Y- F/ x! v; o
  因为,我不相信这些质疑是出于恶意。我只能理解为有些我看到了的东西人们没有看到。每个人的认知体系不同,对待事物的态度也不尽相同,对此倒没什么好指责的。0 f: j7 R, a" v! v' `% u
$ S: V. z1 m! h/ n. Z0 `
  在小说《冰与火之歌》之中,有一场“黑水河之战”。守方的指挥者是一个侏儒,用尽了各种策略,最后亲上战场被割掉了鼻子,终于抵挡住了对方的进攻,拯救了那座城市。但在战争结束后,他被解除了职位,甚至成为阶下囚。他所做的一切,人们并没有看到。
8 d( P" s; k9 Z+ A- F! a9 B) W9 \- C" [3 H7 l
《冰与火之歌》电影截图《冰与火之歌》电影截图$ Q4 {- R" a2 O  q$ s; W" s% j6 U
  没有关系,我把我看到的东西讲出来。
* t/ r+ E9 L: D- m7 V7 N( V6 k+ H* N6 X# N( v: \
  我只希望,读者能耐心看完这一章,再做判断。; M3 o5 i5 v) C6 @

2 p1 `# Z3 }' n) ]  在阅读本章之前,建议先读昨天那篇“【火线速递】——李世石的策略与AlphaGo的弱点”,会帮助理解此文。
7 @' [# z& f$ u; Y) c4 q: s: A) a
; X' }: g+ G  k' q9 {  O  0.莫须有的“协议禁劫”1 ^/ D/ z8 m  V

- q% g6 X/ o9 \  这一节是本文最没有价值的部分,也是我最不想写的部分。谣言自破,本不需我来回应。但一方面我对谣言扩散到圈外而感到羞愧,另一方面也能帮助大家稍微理解AlphaGo的算法。" `/ \" S5 f# I9 _, \  M1 x4 U! {
0 D8 O; }3 v" ~! T. U3 i: N
  关于“协议禁劫”的质疑大概来自“AlphaGo七盘棋都没出现劫争”这一说法。' ^  I. g+ P) |
5 m1 l" J; F; A, }" A9 X1 y
  或许DeepMind会官方回应此事,或许在接下来的对局谣言自散。
7 Z0 I% h1 K, }. J$ Z- B1 D/ t
: }+ y0 w. h, B4 c2 p  但不需要这些证明,难道我们就不能分辨了吗?
4 ~& g( R* \% W" K* k3 r' n: J
5 U& r- G5 u5 D1 X) q9 D! O  由弱到强,我先给出三个回应。
  r2 Y5 E5 Y% [7 b! W2 B! z8 V: q8 @$ i$ f( z+ F, @) M: `3 B
  1,懂围棋的朋友,你真的相信李世石作为一名世界顶级棋士在代表人类出战的历史时刻会签这样的协议?不懂围棋的朋友,你真的相信谷歌团队会签这种改变围棋玩法的协议?$ Z6 L1 {2 g9 E0 F5 R

3 d* A" H/ N& A* W2 ~: n$ B/ V# s  2,AlphaGo的算法决定了他在不打劫就能获胜的条件下会尽量避免劫争,因为优势下的劫争增加了搜索的不确定性,常常会使他对胜率的估计降低。这也是我在上一篇里谈到的逃避劫争问题的本质。但是,非胜不可的劫,电脑必然会打。可逻辑推断或参考第3条。8 J) W4 l; d1 E

6 u3 q2 b7 ~7 |( E  3,难道不能去看一眼去年10月AlphaGo对樊麾的棋谱吗?第三局、第五局,都出现了劫争。其中第三局马上消劫形成转换;第五局劫争过程持续18手,亦形成转换。7 u! X  h8 p- t; I- P3 }* G( z4 h
4 q1 i+ X7 u" D; M3 K* W& B
  在围棋受到空前关注的时刻,我认为圈内人有辟谣的义务,不助长谣言则是底线。
# v+ I5 [. ]) y9 N
& x/ J7 v2 q3 D* F: E* {  1.AlphaGo算法的关键特点
8 j4 A5 B: Q8 e5 }4 }0 d* [$ @  a- k% e6 ~' Y, F
  很多人说发现了AlghaGo的很多失误,不能理解这么弱的一个AI怎么能赢李世石,所以blablabla……
1 k$ c8 |. y! C( _( d5 c  o5 D' L
  如果你看过上一篇分析仍然这么认为,那可能是我没有讲清楚。绝大多数对AlphaGo实力的错误估计,都是因为对AlphaGo算法原理的不了解。) V. D4 r& r: q2 \7 f- i- R

& I+ v4 v- Y6 @3 j  强调一下:
+ B: Z4 c8 k# d: S$ V' t1 [9 x, u4 {9 d4 v" B
  AlphaGo的算法决定其落子的决策基于“胜率”而不是“最优”!- T0 s" ?5 Q$ Z6 J% ]7 l
0 ~3 J4 r4 U0 [9 K3 Z$ w- ^  S1 y
  所有质疑AI失误的同学请记住这一点。
, Y& O& C8 z7 y2 E- G) @, H  ]4 l
  这也是这篇文章整个分析的逻辑起点。
1 F; u( Y1 V! T
5 F5 b# j, h% ?  这意味着,我们人类所谓的“失误”对于”AI“而言很可能不是失误。
: f3 w& L4 |, S1 }$ ?# n! ^# Z6 F% z5 e* H2 B/ \
  2.第一局李世石在做什么?! C( U( Z5 U  q3 |
5 u7 W& Z6 P8 l/ C' l% R: z
  第一局下完,有棋手提出”李世石心态不对,太过急躁,电脑计算力肯定强,应该慢慢下跟它拼形势判断,它的判断力肯定不行”。' {4 I2 W8 l- u* w6 y& O9 P+ ]

9 B% |2 a  G6 I% m1 L% p+ V  说得好。李世石第二局就是这么做的。  A8 g& D4 `9 }( f' y

( A5 J* R. d3 ]9 Y/ _5 p! m  只是,在第一局之前,几乎没有人认为李世石的乱战能力会不如电脑。
' x5 Y% U4 j, A1 ^  `: }% {& Y+ I' L  Y5 c- W# @( f

1 j, A8 k6 ~9 f5 n$ C  在上一篇中,我谈到在赛前对AlphaGo算法的分析认为,它在面对“开放性复杂局面”的时候可能会变弱,因为深度学习加蒙特卡洛的剪枝和搜索在面对开放式复杂局面时可能会变得失效。
7 ^7 ?4 x" T4 L+ g# C
. h* v/ r; r6 _* x  第一局,李世石上来先试探了无谱布局(你说李世石没用什么策略?好吧),然后马上导入开放式复杂局面,呈现出六七块棋纵横交错的场景。
' U5 t. z) d; J, B1 C0 t4 X% b5 O" n5 a5 D* h
  结果,第一策略失败。起码下到中盘收兵为止,赛后职业棋手基本上都认为李世石亏损。, P( f2 j* ^; j& |' L8 N* `

4 K% z6 b: x- c% W: H, _  如果是我在场上,或许也会在第一盘选择这样的第一策略,但我只会考虑一盘棋试一个策略,毕竟有五盘棋的空间。
5 I3 l- Y; o& E# _, L. ~/ v: ]6 l+ A8 M  e2 i3 v
  然而,李世石在中盘及时收手,第77、79手主动停战转向收空,导入细棋局面。
! U& x" o$ P4 C' T
' ]/ E0 ^* s- Z  他在第一盘竟然试探了两个策略!
, X% n2 ?5 K4 H' v. b: k1 o0 o+ L- Y' ~4 S
  那么,你可能会问,如果李世石原本形势不利,怎么能导向细棋甚至反而领先呢?那不是说明AI出现了足以颠倒胜负的错误吗?
9 B, B2 d* I. |& C- E0 }( R, ^- _! {- Z) i' S
在昨天,对此问题我还不能完全肯定地回答,但在今天我可以确认:% h: }8 n! }& `3 l% l

6 U+ K$ R5 q+ \' i" o% I  第一局所谓李世石的领先和细棋都是人类经验带来的错觉!从开局战斗到最后结束,一直是AlphaGo优势!
. t6 w* {" @. l; o9 l2 s; R
1 y# i+ M" ^; ~; \5 m2 D' X0 d  这一判断也符合AlphaGo自己的胜率走势。+ `# o4 b) a0 A8 F! a; X, |) k
/ }( s: o; L( y7 A
  在上一篇,我提出AlphaGo对局面的判断是基于一手对方没有算到的严厉手段(102),我们认为它在左上的缓手(80)和左下的恶手(86),确实并不肯定好,但在AI看来却是最接近胜利的选择。观战棋手认为左下之后黑棋已经逆转甚至大胜,是由于
9 g4 `  G5 k5 Q2 i' h
' t1 F3 B5 ]/ K! m2 a! f8 z: r  z  1) “左下白棋大亏”$ t" n2 z8 l. w( Q1 t3 l( C: J3 T

1 z# S+ X# s5 t  2)对第102手没有充分的准备。
7 i9 b3 j" m# N4 `! F8 D* q  w
  E5 B9 }# R5 `" M  3)人类的傲慢自负。# J9 o( e) _" H8 u, N# d4 d6 D
/ M. U; n  \( s: m: {( J& o
  然而,) n( Z, E# E& F5 d" B$ b

4 ]% \( H* a+ }% f  1)是一个依靠经验的局部判断,并不具有能构成证明的准确性;
: r8 _8 `1 f) s$ k6 Z; {9 i6 |( L( {  S- x( v
  2)AlphaGo的局面判断基于有102这一手;
9 e/ P6 [8 ]& [4 i8 A  q1 l% k; ]' D% V- f: E; `
  3)人类的情绪降低了判断能力。4 E9 h7 z; r5 _7 M% T: `  T1 j% B/ v

8 d% n- f' E* l  102手一出,李世石长考无果,局部大亏。然而,这个大亏根本就在AlphaGo的判断之中,对它而言,这只是搜索树中可能出现的一个分支。
7 b6 t& r: R2 `9 V8 X- ^  I3 ?  v9 e0 Y" y% N4 G* x( p) q
  至于很多人认为后面黑右下走好还能收——确实是能收,但恐怕不能赢了。当然,跟我下或许你能赢,但对AlphaGo不行,这是从AlphaGo的算法和下法的逻辑推出来的。当然,这个结论的得出依赖于AlphaGo在对阵人类时这套方法不会出现问题。基于这两天它这套方法在对人类时还没有出现任何问题(关于失误问题请看上一章或上一篇),我只能极大程度地相信它。这个信念只有在AlphaGo这套方法在对阵人类出现问题而败北时才会动摇,才会需要去寻找它的问题在哪里,以及人类能够怎么去利用。
: Y1 T4 x- {0 ~* \) ^& \
& y3 I4 Z# Y9 m  有趣或者说可怕的是,对于人类而言无比闪耀的”胜负手”102,包含了如此多的计算、判断和预谋,对于AI而言却只是它这一局平凡的93手棋中平凡的一手。* v) M0 U+ q  U0 r; x

; ?5 E; r: `: M* p. @0 q  这样的话,李世石的第二策略起到什么作用了呢?
, b$ x, N3 K  J' D8 g7 `; o; a) e  ~4 w/ t/ t2 t; w( f
  非常大的作用。对于第一局的80和86手,我们在经验上认为它们可能是不好的棋,但无法严格证明。但对于后面的136手和142手,我们可以严格证明它们肯定劣于另一个选点。这使我们确认了AI的一个弱点,即“缺乏逻辑能力”(见上一篇)。如果再补充一条,可以认为“缺乏局部封闭搜索能力”(这一条是否算弱点可讨论)。
/ B) [+ y- S+ j2 C5 R
1 U. b2 Q( O& ^  因为逻辑能力的缺乏,导致AI有时会出现人类看来明显的失误。
  i2 {' @7 }  r/ C
2 b' S3 ]/ ~. t2 {& `  但我们认为的不可理解的失误,只是在它看来不会降低胜率的选择。确实,我们可以指出他的一些基于逻辑的可证明的局部亏损,比如无谓的绝对先手交换,比如目数的白白亏损。在对第一盘的总结中,我认为这可能会是电脑的一个弱点(对AI而言不是失误),即“缺乏逻辑”而导致的局部小损,而这可能是人类仅有的两个突破口之一。AI在优势时会在局部有所退让以确保胜利,在均势时如果也退让岂不是人类就有了领先机会?因此我提出:# A3 J5 O/ g1 g
3 T1 c# N& L' u7 g  r* e: S* m- O
  1,我最期待的策略是,李世石按照人类研究很深的套路开局,因为AI并不会背套路。即使不能凭此占优势,也要尽可能保持局面的均势。在这个条件下,AI或许会在一些简单的局部因逻辑缺失而有所亏损,人类牢牢把握住这些微小的利益,最终取得小胜。不过,这似乎并不是李世石常用的风格。
% k! r: r$ U7 c7 Y* O1 D1 m; A* q. C3 z) w1 h1 A
  这是第一局之后我分析认为针对电脑弱点的最优策略。
# u1 @: D/ `: d0 ~' k
% ^9 }9 x% {' z8 n3 L4 j9 F  3.第二局李世石在做什么?
2 \  I/ n# t) s! G# V
; r: H9 L( _6 @  如果是你,在第一局的下法失败之后,第二局你会怎么下?
/ G. ^& {/ Z% z5 u' q) b  f
1 v5 ^) W5 m6 X6 v" e  我的想法是,通过第一局我意识到AI的强大可能超乎之前的想象,在我认为他最可能失败的地方他居然成功了,但好在我也看到了他可能的弱点。我根据它最可能的弱点制定了一套新的策略,然后严格按照这一策略执行。
' {7 L. f$ s1 y, X/ k  k# I2 z4 k/ A
5 {8 L$ r4 [' n% Z4 @  这是因为,我发现可针对AI弱点执行的策略并不多,而第一局我使用两个策略失败了。我可能需要更专注于一个策略的执行,毕竟后面还有三盘的空间。这是我在第一局后会做出的决定。) j  V% U8 t: z
8 X1 W+ I/ ^% J6 @$ X8 t
  或许有人会问:”瞧你说得这么玄乎,你又不是李世石,他又没说,你怎么证其有?”: P8 @* [$ }; d. c0 |. y3 [& o
; Q  p( Q" C9 x6 G" d
  是的,我不能证其有。即使他说了也不能完全证其有。我只是用棋谱信息加上AI算法来做的合理推测。当然,李世石有可能并没有制定什么第几策略。如果是这样的话,他就太天才了——别人用知识和推理达到的方案,他仅凭意识就做到了。9 G& z& Z' ~- C

0 y' ^3 |0 J3 A! k2 v6 s  前面说了这么多,总还得用棋谱说话嘛。那么让我们看看第二局到底发生了什么。
& d. K& ?* y4 T5 _! q
8 ^0 T& [8 a8 n$ c8 K/ H5 |7 N  我个人认为,对于这一局,传统的棋评解说意义已经不大了。7 M$ E. f8 ]) M2 H% n% L4 Q
3 H- |5 q/ L! z, I# ^" `

' t& |& Z1 D) e/ e# h6 O& ?  先看第13手。右下先虎之后脱先中国流,这又是“职业棋谱中从未出现过的布局”。看到这一步,李世石站起来,出去抽了根烟。$ Q, D5 P3 O6 M

* Y3 Q. d/ q# d& {  下面请允许我趁李世石出去抽烟时暂时代入他来思考。(画风突变如有不适请勿见怪)。
6 B! m* s+ A3 K0 ?1 E
6 G2 x. j' k$ [2 J. ^+ K  此局我下决心执行一个策略,这个策略是针对AI弱点的攻击。这个策略简单说是:”熟练开局,争优保平。细微局面,等待失误。“(原因在前面讲得很清楚了)
9 C& N, l. p5 c& @& l- N- Z$ a; l. _  e5 W6 N2 |
  于是我开局选择了最普通的布局应对。白方这一布局在历史上经久不衰,没有千局也有几百局实战了(感兴趣可以去搜一下)。经过昨天试探,AI不会背谱,人类整体的经验很可能是最有力的,我要尽可能导入到熟悉的套路中。0 ?" N( Q% L: R+ B. `. h

4 W6 w. D% P9 K! g7 {  下到12手,我心里还有一点兴奋:这个布局我是见得多了,白棋总是不亏的。, u& A( ]2 a- ?/ \* t6 a

5 A" r8 x  ?; Z, L. o  然后,看到对方落下黑13。, p9 f! f* H! z. G( M" |
, e3 p# ^+ v0 {7 n# Q9 o+ E
  纳尼?
9 \3 ^, j0 O0 G+ ^. K/ e
$ D( N, J& \; m3 U, O  定式不下完?
1 W9 T$ o$ h5 m6 D: ^" I/ N; h+ y* w: s/ @1 D
  这还能脱先?
  Q3 {6 g( [9 F$ d) t4 c* E$ V& r- f1 l
  我勒个去,AI你不会是知道我在想什么,跟我玩心理战吧?" u- Q( {' T' v& G

2 h0 `* [, N+ ^  啥时候通过图灵测试的?  n# M( R, I( S5 d2 Z! r1 C

/ J* G" z+ y+ f4 M/ P9 {  好吧让我想想。你定式不下玩就脱先我得制裁你啊,夹击如何?1 ^% g/ j/ I2 c# X

& B. L3 R7 m0 D* C6 y/ l
8 f: d. a/ Q. [2 S- h! g  我拆1,你拆2,我攻3,你抢4……这棋失控了啊,这局面没人下过啊?$ ]" X$ W) S  E

& X; j) P+ n5 ?0 W5 ~- T  我这棋好不好呢?下边会攻成什么样?是否足以抵消黑上边阵势?
# v' T# `7 @; R1 I. g! C/ s! [/ u& ~4 D) m& j- m
  以下省略几十个脑海中飞速出现的变化图……# d5 f5 M+ Y1 C

, P6 q5 {2 e+ T  判断不清,好像没啥把握。
7 U% }0 d" A) S0 O8 t% ]# Y! ~
- M1 v4 Q4 N# }5 a/ c  怎么办?策略就这么被破了?
- i, [3 w2 S  K( g4 o5 U
, k/ X& [1 p7 q  w  有了!我就当右下黑棋没交换虎那一下不就行了!
$ U  n% Y+ J, z7 S, Y+ p
6 q/ o- P) g% G. j5 O  咱谱着该走哪还走哪,机器你能怎么着?/ Y  _; A8 q0 v
9 q" L1 q* A6 T/ D5 z5 Q: [
  哈,我咋这么机智呢?7 P* w5 D2 d3 V- [5 m2 m* l9 q( w# ~
% X5 U9 b0 }- C( u% a/ O0 b
  AlphaGo你有我这么机智吗?7 _, a& F+ D( @# w: R% g/ p

8 S2 t( z: U  l: h- o  一盒烟正好抽完,李世石回到了座位上,落下第14手。
: b" I, [0 H2 M  e' E( a* ~& c
' K% z2 V: B0 c; I* J+ e  ?% O+ K; ]6 N! g# c2 Z& s$ X
  这是右下没有虎和拆一交换时最常见的下法,也不知有几百盘。而且这时黑棋虎白棋也多半会拆一。0 S" l* r  P8 c$ p( A9 j; c

( a6 B* {  K7 I/ {, L1 J* b$ |/ X  好了,这个小故事告一段落。我并不是说这就一定是李世石的心理过程,而是说,如果是我,我会这么做。* t) L8 a% j9 K9 o& o, P9 ~

, A# O% r* z1 H. x& g  这盘棋技术上无与伦比的精彩我想留到第二部分再谈,那里有更加精彩的新世界,但在这里暂时先略过。' h7 F% K6 @9 F. n' m0 E. {/ L& {

( e# B' l0 s; {  再简单回应一下所有认为李世石后来84、146、172这三手棋没选择打劫有问题的观点。
2 t$ e4 b6 f, ~" @# Z( U" U
# x8 u8 z  i( w* i  1)认为李世石不选择打劫是因为签了协议的人。
: j8 r- R, s6 \
8 x& S0 w' ]4 m8 A  您好,再见。6 e) F5 R% ?( ?& j

) ?/ u# Z3 J" N5 Q" F0 _  f( H  2)认为李世石不选择打劫实在太怂了的人:
) v8 \( i6 ]( x; G7 ?6 o% r* B3 \- t8 l) A
  如果你看完前面的分析还这么认为,那请回答:打劫能赢?8 o- o$ K8 O; [: C. x2 W8 B
! G5 V% n0 S) U$ w9 F
  当然,你可以说84托虎明显优于实战,146应该夹进去才能争胜,172不冲不足以平民愤……
2 s0 d& z6 {' r0 M7 z7 C# Q( b! m! m7 z" D& w+ P
  那句话怎么说来着……你以为你以为的就是你以为的吗?(这句话用来看人和AI真是金句了)
3 L! a8 x' ^: ^# D0 y" N1 k/ t6 ]/ f" G) s7 j* @* i0 G+ l
  对AI来说,气势是什么?血性是什么?胜负感是什么?
; I, n7 A" q3 E8 c+ `; q
  q4 O* l2 B5 {2 W  AI只看:胜率是什么。# r9 b" m' K' n3 t
) l& U  b/ s! u" a) E5 D: @) \/ ]
  的确,我这不也是我以为的?' C0 d; Q# z* @, q  {& w

- v/ E. r2 J/ p. Y( D  好吧,请告诉我托虎做劫在当时为什么比实战好,后两处哪一处你认为会对胜负产生影响?给一个有效辩护吧,不要摆几步说个看不清就赢了。
$ q  l1 v. a8 f7 J( F! d% O" @/ l: X4 _# L2 R' [
  在我看来,这盘棋李世石完整地贯彻了他的策略。
! q/ \6 u5 e  Z! F! K3 J7 @# s' L4 D* _' G! u( P% y) u3 j
  可惜的是仍然并未取胜。原本预计在熟练的布局套路下能在前半盘占优或持平,然后在后半盘等待AI因逻辑缺失而造成的局部小亏损。然而,在形势接近的情况下,电脑的局部“失误”变得比第一局更小、更难确认(比如15、117等先手不保留)。
; `  L; ~* G  U2 s
1 R/ a1 v/ q2 b& B) t) [  这可能是一件非常可怕的事情。它告诉我们,在形势接近的情况下,AI的“失误”也会变少,甚至消失(不被人发现)。AlphaGo形势越好,他的”失误”可能越多。我们基于这些”失误“对它进行棋力的判断,只会造成对它无止尽的误解。: W5 [0 n4 \0 {5 k+ F

( V! |" x/ \+ X, y3 ?  还是把上一篇文章的结语在这里引用一下:, @$ I" B( S. W7 b

) i' e4 W2 D3 N9 l) \7 n  如果我们只用人类思考围棋的方式来理解AlphaGo,或许我们将永远都不知道是怎么输的。% ]# P) k1 h! O! f

( l! q: a% o( g' B+ @8 ^  读到这里,相信大家对AlphaGo有了更直观的认识。# Q  j* x" k, p
9 ]- b) c! V7 l' X  _
  或许有人会想到这一点:这么看来,AlphaGo岂不是遇强更强?
! S# C+ l7 M, G( f8 M3 V4 c+ V" g, H1 p+ r- d7 v7 ?! h6 r
  的确是!
$ T- G5 v/ h. Q; k9 i: F, L
- R: L: T4 t0 Q7 G  它的目标只有赢,不求最优。
) u7 a$ r  e7 V7 \2 n: [' F) a0 r7 w0 A
  在对手弱的情况下,它可能选择的类似胜算的点就更多。1 d3 E! ]% D, A  f4 z  o

3 o% E8 e/ t! m$ U& b! n  在对手强的情况下,它可能选择的类似胜算的点就更少。& W. J3 c! z! o! q- j! J# Y

8 u, |# R4 S# q. G  后者,意味着更精确,意味着在人类思维的意义上更少失误。
3 A0 G- e7 |" ^( m, Y# o3 t% a9 q( @
  那么,AlphaGo的极限在哪里?我不知道。5 V( G# c! D8 E+ O; C" v* J

' B6 g3 ?" Q2 q, B. X  但我认为AlphaGo饶天下一先是指日可待的事情。. m' W/ g# c) }3 ^8 a
" K: D! z% |* O  K2 m: J7 P& N+ n+ |
  虽然我赛前和现在都无比希望李世石能获胜,因为人机相持的时间越长,可供围棋界反思的时间就越长。4 T0 E3 d0 ~: }) n: c: R* [

+ y/ X5 ?: t; b7 |( E  但是,理智告诉我,AI真的绝尘而去了。
2 y1 o. I- P1 e' _2 c( f9 u  _- c- r3 b4 H
  让我们回顾一下老罗的这段话:
4 D0 W+ l/ [+ W% n0 J' f
! C" R! K; A7 P* \" J; _7 p, n' z  “人工智能就像一列火车,它临近时你听到了轰隆隆的声音,你在不断期待着它的到来。他终于到了,一闪而过,随后便远远地把你抛在身后。”/ |/ c9 k( W" e' Q" I2 z/ L
0 N+ y8 {$ j# @  ?9 h: @
  围棋AI,是这段话最好的注脚。
+ n' t  G  W; w- w8 J: Y, [; u; m+ Z3 ]* `" J6 Y' P2 L0 y& n
  看完第二盘之后所有认为AlphaGo 只是后半盘强的人,如果你能理解前面提到的知识和逻辑,那你也应该能理解这一点:
2 \5 P' \. k3 y& K- C; g
1 q9 H7 T0 V' U; Z8 x  是李世石的强大逼出了AlphGo的后半盘。
9 O- u# E0 \4 [" o& H1 o8 ]
3 Z, ?. _% e; N6 E0 u/ K  S  为什么第一盘AI的后半盘”失误“更多?因为”失误”时AI已经胜定。
3 V' e1 Q6 l, Z
, G0 ]4 K: T4 ^1 b  第二局赛后的采访中,Demis Hassabis表示程序中间一度认为形势接近(根据胜率显示),而李世石表示自己是完败。5 s8 i  y! F/ Y/ s+ W
, z, v% p0 v" b* Z( _# |2 q
  如果说第一局李世石输棋之后还有曾经领先的错觉,这一局他自己则完全没有了错觉。即使在棋界几乎公认为AlphaGo明显亏损的左下角定型之后,李世石都不觉得自己有过任何优势。正是这种正确(保守?)的认识加上前半盘相对熟练的格局,使得AlphaGo一度认为局势接近(很好奇AlphaGo有没有认为自己落后过)。这也激发出AlphaGo强劲的后半盘,在对阵世界顶尖棋士时,仅仅通过收官就将胜负差距扩大到盘面十多目。
: @$ f% N9 T  |$ x1 B
$ Y* j1 g( w  `( S  对于这件事情的夸张程度,棋手们能否正视?人类面对不能理解的事物,总是用固有的知识体系来理解。但是,新时代真的来了。" A: t, j9 R8 T
8 ]7 v# ~+ P4 t' A9 W& C# S) e2 \
  4.李世石,直面AI的围棋英雄
. w0 F1 a7 Y. k. N1 \8 j% z5 ~/ _' S% t* M" V( w# D. {
  读到这里,我希望有一部分人能够理解在李世石和AlphaGo之间究竟发生了什么。# P' i# N; B8 j* h, q/ ^: O

6 k! V3 Z- e* \% n9 I& H' z  这一节,我是对你们说的。
% y( k* E; z% k6 b7 K  n5 I8 I) t6 H/ j- f
  从古至今,我们从来不知道在围棋技术的浩瀚空间里,人类到底站在了什么位置。是离天只有三尺远?还是仍然站在地平线?3 c! C8 k* x5 K, A
3 p2 _% S+ s+ w0 v
  如果把穷尽看作天,把入门看作地,人类今天对围棋的认识究竟在什么层级?6 E: _" _, p- l/ \- h+ ^3 f

6 ?% E$ S3 A* z- E# O  藤泽秀行先生曾说:”围棋,我只知百分之五”。相信包括我在内的绝大部分棋手,都曾认为这是谦辞。往正面解,是敬畏心;往负面解,不知是什么心。2 q& d/ ^; j1 ?3 Q! `

) X  f; W5 F: m9 y) K9 H  真的是谦辞吗?& P: h4 E& u6 u' e2 x; o0 W1 c) [* |

. v0 j. _9 F9 ~& G* }/ P  纵向看不清,横向比较一下总可以吧。其他有职业体系的棋类项目,变化比围棋少很多,未知的东西少很多,那么其职业选手是不是很可能相比我们在各自体系中站在更高的层级?* o- s, B3 u$ V2 l8 B

0 ?0 l/ {) h, p1 T, F# |8 R& q  可是,他们都早已接受了AI的层级在人类之上这一事实。
  \. I- }  N+ w! q
- I; c/ K6 z% K  诚然,在不短的时间里围棋是仅存的硕果,围棋选手看着用机器训练的同事们,发出”围棋永不会被机器打败”的豪言,似乎在捍卫着什么了不得的东西。
/ h- K9 r  V$ v9 r1 V6 `! S! J  O% D0 I
  并不是我想要戳破这种幻象,而是事实摆在眼前,不由你不信。
2 H. X9 j0 U" e9 `4 q( W- E
6 h6 u. T: G& z! T4 M3 }4 H  国际象棋遭遇深蓝挑战时,人机之间还相持了一段时间。直到今天,在国象和象棋,虽然人不能战胜AI,守和还是可能的。一方面AI的技术层级可能并没有比人类高出太多,另一方面和棋的空间是一个很大的缓冲带。& t$ F2 U9 z0 p# e/ ]
& _9 O( Y& A# }& |. \
  围棋呢?确实围棋更难于被AI攻破,可是一旦攻破,会有多少高出人类的空间?围棋AI离天还有多远?人类棋手离天又有多远?没人能给出准确的回答。! |1 w& `3 K" `5 \+ A

7 Q; e$ b! C  W  如果没有围棋AI,我们将永远不知道自己在围棋的天地之间究竟处于什么位置。  r2 ]' w* O7 O3 R& t, s

/ n" F: q6 G) a8 W  围棋AI是我们唯一的参照者。# h4 E( {: K* i3 C

: B4 A8 k9 b" k4 C( s- i  虽然在围棋被穷尽之前我们仍然不能准确地定位自己究竟处在什么位置,但是,  r+ K7 ~" s) G4 Z% A2 b
4 z; H8 _" y( V
  我们不再孤独。% a& a4 s- Z" _6 I
2 {* V6 S2 v( J! J+ [+ C! T% G- W
  多年以后,围棋书上将会如何讲述这次李世石代表人类围棋最高水平与新生AI对决时做出的种种努力,又将会如何评价面对忽然之间凌驾于人类之上的围棋AI时李世石的表现,我并不能肯定。& t2 i/ |* e0 e, }9 u4 L
5 S# D$ |2 g. i; l, T
  我只是希望在这个连李世石的职业精神都会受到质疑的时代里,把我看到的事情告诉大家。是不是真相,请自行判断。
5 {. g0 f' @/ I& k1 e4 g
- |8 F" S8 R  Y  “李世石面对AlphaGo,并未因五个月之前的棋谱而有丝毫轻视,他做了非常充分的准备。他抛开人类的偏见和自负,试图理解AlphaGo运算的机理,并找出其中可能存在的弱点。在比赛伊始,他就对AlphaGo可能存在的弱点进行了直指要害的攻击,并且在失败后迅速调整,继而展开了第二次、第三次针对性攻击。正是他的策略针对性,使人们更好地理解了AlphaGo的强度和特点,以及不同于人类的决策模式。他在第二局中就已经找到了足以在中盘接近甚至抗衡AlphaGo的布局策略,使人类第一次见识到AlphaGo梦幻般的后半盘。”8 S+ P+ Q# e* |
: I" e1 K' H( ]+ o; {' x
  ——这是我对李世石在人机大战前两局表现的评价。3 _0 c) A% b' R# w! p

, A: K! P5 L' N) e4 G  从这两盘来看,我不认为这个世界上还有哪一个人能够代替李世石将这件事做得更好。
! l3 R+ B6 [0 v. k4 l
* f2 b$ c6 Q, S) e, ?5 q, g  写到这里,天已经亮了。
* M% f2 a% E* C. a
" r9 g4 o9 `# d* a$ V9 ~  但是故事还远没有结束。
# R# q9 y5 }3 V. U9 J( {1 `4 }8 ~4 W  @5 e( F
  5.在后三盘可以做什么  J, _$ E9 n7 N% f

3 g) [  z( h) @$ p) \' f  第二盘之后,我在上一篇文章中推测得出的最优策略已经被AI强大的实力证明难以取胜。虽然这一策略在最大限度上利用了人类集体的经验,从而能够在中盘取得接近的局势,但在这种情况下AlphaGo的后半盘不是限时人类所能抵挡的。那些认为李世石发挥太差、自己上去可以不失误的选手,既低估了人性的弱点,又低估了AlphaGo的实力。$ f( I9 `2 m/ S; s8 {- f5 E+ o
& p% W0 p7 X  e, b) s& B5 x
  昨天给出的次优策略则是关于劫争:3 l/ I) k8 z( Q; Q$ z

6 }: r1 |: _) R$ c6 S  2,另一个策略是在局面选择中尽可能制造劫争,即制造对方不开劫就不利的局面。当然,AlphaGo目前没展现出复杂劫争的能力并不能证明它没有这种能力,因此这种策略是存在风险的,太过刻意是不行的,还要考虑局面的自然和均衡。7 M" V5 g) r: r" F9 N
* b& K- r# n( Q$ H
  但是在看完第二盘AlphaGo的表现之后,我认为这一策略实际上也已经破产了。AlphaGo的算法使得它只会去打那些能影响到胜负的劫争,与胜负无关的劫他就不会打了。4 N. K' g" _0 H3 u) N

8 Z6 @! w* J( y/ I  虽然如此,我觉得李世石还是会去试试。我在第一局时只看到了AlphaGo的两个弱点,第二局则基本证明这两个弱点都是人类所无法利用的。AlphaGo在尽可能避开劫争的条件下仍然能完胜李世石,这才是关于劫争方面应该关注的焦点。* [2 }$ D7 }, n7 D& A1 q4 g7 A

0 W8 [8 P: ]2 l+ ]0 h9 U( d: M) n  关于弱点,李世石在第二局赛后表示,没找到AlphaGo的弱点。我认为他非常诚实,而且他确实已尽力寻找。
0 P( |" n% `  M1 R$ f$ L- T
4 @) B$ w# C. x  虽然我非常希望李世石在这次比赛能够获胜,为围棋行业的发展争取时间。但在我看来,后三盘在正常情况下李世石将毫无胜算。
, Q1 a5 R8 R* S: }7 |( V- y
6 {: U* V5 K* n  空中开局是否有效?我认为无效,但或许比较有趣。. R8 b% _7 R( [

) o; i6 a4 R/ X5 }+ t( o, S7 i  如果不去找bug,剩下的事情就只有——跟AI学棋。. ~* T% K8 W' T; E' X5 t
( v. N3 [6 ?5 O! Y8 {" t
  6.人类如何跟AlphaGo学棋9 Q+ T" e5 y8 T) t1 K/ f. o
# Y6 `8 ^# i" h7 ?3 b: `9 |8 `
  这是个不小的话题,在未来一段时期内会被围棋界的人反复拿出来讨论。在这里我只是简单开个头,或有不确之处。6 k" Z; g- m' \1 K; `8 d! K" v
! B+ d9 X* E2 O( l) O; `
  首先一句话:AlphaGo的棋既容易学又不容易学。
" \1 p# Z, B0 F, x2 B4 x) f
) n+ x, n  \5 f  H  为什么不容易学?因为ALphaGo所有的着法都是从全局考虑并基于它认为的胜率,如果只是单纯地模仿它的下法,将会掉入巨大的陷阱。
: Q- d6 R* u+ n, F2 n3 I$ h0 [) _) l+ d9 H
  陷阱1:AlphaGo的一些下法本身就不是最优,甚至不如人类的选择。例如第一局中的那两个典型”失误“。如果真要学局部的下法,或许只好期待他左右互搏时拿出最强功力(或者对人类的让目对局,总之需要给它增加难度以减少选择。)
3 c' e& Y1 j) ?2 A, @$ X# w
+ B- r" i/ F- K- X) j
+ s! j) X/ Z2 E  陷阱2:AlphaGo的下法基于全局,全局形势稍有不同可能就不适用。例如第二局AlphaGo在左下的下法,几乎所有人都认为局部明显亏损。但AlphaGo是基于上边和右边的情况而在左下做出的选择(对此我将在第二部分解说……学习),这对棋手思维的拓宽有巨大的好处,但具体的着法却不宜照搬。即使是天外飞仙的第37手,也是在独特的局面下才是当时的好棋,如果对任何高拆二都跑去肩冲就成了东施效颦。. e* `( o0 |* e# b% j
$ n7 {- z5 e9 d. [, @: u8 I
  为什么容易学?因为AlphaGo的围棋技术层级已经在人类之上,它每一盘下出来的招都值得棋手反复思考推敲。仅仅两盘,就已经有这么多的亮点、更多的不解,这绝对是史无前例的棋谱。
4 A: o/ u& V7 P9 C/ V9 L* w$ n! h: h6 t- Q9 |
  AlphaGo给出选点的思维方式与人类不同,但我们却可以用人类的方式去理解它,这是一件多么美妙的事情!同一个点,AlphaGo通过数据的方式来给出,人类却用道理的方式来接收,围棋的数与道在这种对话中得到完美的呈现。) [4 k. f: ^( ]) O

3 b( F, _8 u2 B0 K3 V8 Z  此文的第二部分原本准备用棋谱解读的方式来呈现我从第二局中看到的无法用言语来表达的震撼和美,但本文或许已经太长,两部分关联性又较弱,更主要的是,天色已大亮……留在下一篇吧。$ o) y( A. J" e, ~6 I) t: f

- a' I  |# p" ~( c  想念吴清源大师。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2