爱吱声

标题: 日本或者韩国也有这么厉害的人工智能围棋程序了? [打印本页]

作者: 燕庐敕    时间: 2016-12-31 23:07
标题: 日本或者韩国也有这么厉害的人工智能围棋程序了?
本帖最后由 燕庐敕 于 2016-12-31 23:09 编辑

居然26:0碾压当今一流超一流中韩人类顶尖棋手?

                        围棋网战雄霸横空出世 总教练:不排除是阿法狗                                                                                            2016年12月31日18:11                                                                                                                                                     
                    
                                                                                                                                                                阿尔法重现江湖?

                                                                                                                          新华社北京12月31日电(记者王镜宇)在2016年即将结束时,一个网名为Master的“网络棋手”在著名围棋对弈网站弈城网上对包括中韩顶尖职业高手在内的棋手创下26胜0负的战绩,中国围棋队总教练俞斌称,不排除这是在人机大战中一举成名的“阿尔法狗”。
  据弈城网工作人员介绍,12月29日晚至31日下午,Master在弈城网上与多位“披着马甲”的中、韩职业棋手对弈,其中XIUZHI、龙胆、剑术这3个棋迷们熟知的账号分别对应韩国第一人朴廷桓、新科百灵杯冠军陈耀烨以及中国名人战冠军连笑。这些对局采用的都是“20秒3次”的超快棋方式,结果Master在对这几位重量级高手的交锋中分别取得4:0、2:0和2:0的战绩。而且,其中大部分胜利都是轻松的中盘胜,最为接近的是31日对XIUZHI(朴廷桓)的一盘,Master涉险以半目胜出。
  此外,Master还在30日与账号为“吻别”的网络棋手交锋两次,均以中盘获胜。弈城网工作人员表示,很多棋迷认为“吻别”就是拥有4个世界冠军头衔的当今中国围棋第一人柯洁。如果“吻别”真是柯洁,那就意味着Master对当今中、韩第一人的战绩是6:0。此外,孟泰龄、谢尔豪、於之莹等棋手的账号也败在了Master的手下。
  Master的神奇表现引发了职业棋手和棋迷们的极大关注。老将罗洗河特意注册了新号准备与这位“网络明星棋手”一战,胡耀宇停下家里的装修工作关注Master的比赛。除战绩惊人外,Master在对局中的一些着法初看也有些“怪”,但最终总是笑到最后。

  十几年前,网名为“龙飞虎”的网络棋手曾在清风网写下一段传奇,后来“龙飞虎”被证实是当年鼎鼎大名的“七小龙”之一的丁伟九段。这次的Master会是隐姓埋名的职业高手吗?
  俞斌也关注了Master的对局。在他看来,Master可能就是“阿尔法狗”,也有可能是日本或者韩国新研发出来的人工智能围棋程序。
  “对中韩顶尖高手取得这么压倒性的战绩,几乎可以排除是人类棋手,我觉得Master是机器的可能性非常大。以今年‘阿尔法狗’对李世石的表现来看,它是有可能做到的,不排除Master就是‘阿尔法狗’。当然,它也有可能是日本的ZEN(的最新版本)。虽然前一段时间ZEN输给了赵治勋,但是它有可能在短时间内又有突破。也不能排除Master是最新研发出来的其他‘狗’。”俞斌说。
  中国围棋队领队华学明也关注着Master的表现。她说:“应该是新‘狗’,可能是韩国研发的‘狗’。主要是他们(职业棋手)说下的有些棋不合人类(的着法),我觉得仔细想想挺符合棋理。”



作者: 燕庐敕    时间: 2016-12-31 23:10
以后大家看人工智能世界大赛岂不是更过瘾?
作者: 蒸八宝    时间: 2016-12-31 23:27
燕庐敕 发表于 2016-12-31 23:10
以后大家看人工智能世界大赛岂不是更过瘾?

以后啊,说不定围棋世界大赛就是人类上半区,机器下半区,两个分区冠军总决赛
作者: 冰蚁    时间: 2016-12-31 23:40
燕庐敕 发表于 2016-12-31 10:10
以后大家看人工智能世界大赛岂不是更过瘾?


参考国际象棋吧。还是人下比赛。不过嘛,机器学会围棋,估计不屑于再玩了。哈哈
作者: mark    时间: 2017-1-1 00:13
一定是ALPHA狗了。日本韩国应该进步不了这么快。日本的上次下赵治勋都还不行。
作者: 燕庐敕    时间: 2017-1-1 11:22
mark 发表于 2017-1-1 00:13
一定是ALPHA狗了。日本韩国应该进步不了这么快。日本的上次下赵治勋都还不行。 ...

也许进步很快?
作者: mark    时间: 2017-1-2 22:46
燕庐敕 发表于 2017-1-1 11:22
也许进步很快?

可能性不大,这还是需要些积累的。日本韩国的程序现在能跑到去年阿尔法狗的水平就很不错了。
作者: 煮酒正熟    时间: 2017-1-3 01:38
如果希特勒还活着,我估计这厮会下令全球抓捕数据科学家和人工智能科学家。抓起来以后好吃好喝当猪养,直到老死。
俺兹持希特勒这么干。老燕呢?
作者: 鳕鱼邪恶    时间: 2017-1-3 07:48
煮酒正熟 发表于 2017-1-3 01:38
如果希特勒还活着,我估计这厮会下令全球抓捕数据科学家和人工智能科学家。抓起来以后好吃好喝当猪养,直到 ...

如果希特勒还活着,我估计这厮会下令全球抓捕顶尖围棋手。抓起来以后好吃好喝给阿法狗喂棋,直到老死。。。所以我支持所有顶级棋手不再上网下棋~~ 老酒咋看?
作者: 燕庐敕    时间: 2017-1-3 08:53
煮酒正熟 发表于 2017-1-3 01:38
如果希特勒还活着,我估计这厮会下令全球抓捕数据科学家和人工智能科学家。抓起来以后好吃好喝当猪养,直到 ...

我很怀疑老希能否理解人工智能。
作者: 删除失败    时间: 2017-1-3 12:28
mark 发表于 2017-1-2 22:46
可能性不大,这还是需要些积累的。日本韩国的程序现在能跑到去年阿尔法狗的水平就很不错了。 ...

从实力上看,倒是符合deepmind透露的领先顶尖人类棋手二三子的水平,不过deepmind也说今年是要公开挑战的,现在蒙着面杀得人心惶惶,到时候谁敢来攻擂呢。

现在教棋的老师们估计头大了,原来说这也不能下那也不能下,原来都能下。排着队枪毙实在太残暴了
作者: 蓦然回首    时间: 2017-1-3 16:51
最新消息,41:0,确认是阿法狗了
作者: 大脚丫    时间: 2017-1-3 17:13
删除失败 发表于 2017-1-3 12:28
从实力上看,倒是符合deepmind透露的领先顶尖人类棋手二三子的水平,不过deepmind也说今年是要公开挑战的 ...

以前的套路都是基于人类的局面计算能力的,现在AI超越了人类的计算深度,所以有新的观点不是奇怪的事情。

=========
master 从水平来说是ALPHA go的可能性比较大。日本的deepzen其实最近也是进步很大的,估计还是借鉴了阿法狗的一些设计思路。在弈城deepzen差一点就30连胜了,而阿法狗出来之前的zen可能还打不上9d。人类棋手现在已经是没有话说了,master上线以来还没有败绩。这一天的到来对我们这些看客来说早了一点,但是阿法狗的研发团队确实事先就宣示过了。中国自己也有AI上线,有一个叫刑天,在QQ围棋上,虽然也是胜多负少,但是与master差距还是明显的。

=========
从master的出现特点分析,这个AI不是直接和网络围棋接口的,应该还是有个“肉臂”在帮它下棋。就是不知道万一哪天肉臂滑标点错了怎么办?

===========
要穷尽围棋的道理应该在较小的棋盘上先进行,其实在小棋盘上电脑早就打败了人脑了,但是好像没有人试验是否电脑在小棋盘上自战会有固定的局面出现?

============
从国际象棋的经验看,AI也能帮助人类棋手提高水平。以后也会有很多从前是高大上的工作会被AI取代。

============
阿法狗的研发团队是英国的,这点让人对这个腐朽的老帝国不得不高看一眼。从我以前的职业经历了解,英国自己的精英人才都跑去金融领域去了,在科技公司打工的工程师大多是前殖民地来的移民。回过头来,我们自己还有很长的路要走啊。
=======

一点胡思乱想。
作者: 燕庐敕    时间: 2017-1-3 18:07
蓦然回首 发表于 2017-1-3 16:51
最新消息,41:0,确认是阿法狗了

怎么确认的?
作者: 蓦然回首    时间: 2017-1-3 18:40
早上看到个新闻,说韩国那边发微博证实master是阿法狗。不过现在我又不太确定了,可能是假新闻,再等等看。如果是阿法狗太可怕了,学习能力太惊人了。
作者: 怎这样呢    时间: 2017-1-4 02:21
50:0了 棋渣也跪了
作者: 大脚丫    时间: 2017-1-4 07:13
怎这样呢 发表于 2017-1-4 02:21
50:0了 棋渣也跪了

早就没有任何悬念了!因为没有人看得懂AI的棋了,只是因为下不过,才不得不承认那样下也是对的。AI超越了人类的计算能力,所以它推导的变化图是人类无法知晓的。
作者: 穿着裤衩裸奔    时间: 2017-1-4 08:06
估计是修改了算法本来打算上网训练一把,结果....
作者: 冰蚁    时间: 2017-1-4 09:54
燕庐敕 发表于 2017-1-3 05:07
怎么确认的?

2016年12月30日凌晨,推特账号Science News曾发布了一条推文,内容为----

AlphaGo:“Now,I am the master”
作者: 财迷心窍    时间: 2017-1-4 10:05
本帖最后由 财迷心窍 于 2017-1-4 10:07 编辑

国产有个刑天,似乎是企鹅家的,水平也相当高了,据说对一线棋手有90%胜率?包括新年期间2:1赢了柯洁。

柯洁在野狐目前为止与刑天对战八局,胜两局,但又一盘是掉线卡出去的,那盘棋是赢棋,也就是说目前战绩柯对狗3比5,胜率0.375,柯洁说现在的刑天相当于三月份的阿尔法狗。。。


作者: 删除失败    时间: 2017-1-4 10:18
本帖最后由 删除失败 于 2017-1-4 19:15 编辑
冰蚁 发表于 2017-1-4 09:54
2016年12月30日凌晨,推特账号Science News曾发布了一条推文,内容为----

AlphaGo:“Now,I am the mas ...


好像是乌龙,不是一回事,问到deepmind的人也没有回应。

从实力上看是阿法狗的可能性最大,不过master的风格比阿法狗积极得多,大多数棋手一个照面就被担架抬下去了
作者: 冰蚁    时间: 2017-1-4 10:44
删除失败 发表于 2017-1-3 21:18
好像是乌龙,不是一回事,问到deepmind的人也没有回应。

从实力上看是阿法狗的可行性最大,不过master的 ...


阿尔法狗在上次比赛后彻底重新学习过。deepmind 的人不回应,可能是有保密协议。
作者: 删除失败    时间: 2017-1-4 16:34
冰蚁 发表于 2017-1-4 10:44
阿尔法狗在上次比赛后彻底重新学习过。deepmind 的人不回应,可能是有保密协议。 ...

99%是阿法狗,谢尔盖几个月前到中国棋院来过一次,可能就是商讨第二次人机对抗,这次网棋可能是双方协商后的实力摸底,根据结果再组织公开的赛事,所以棋手也知道对手是谁。我唯一不理解的事谷歌没理由对围棋还有那么大热情。
作者: 大脚丫    时间: 2017-1-4 16:51
删除失败 发表于 2017-1-4 16:34
99%是阿法狗,谢尔盖几个月前到中国棋院来过一次,可能就是商讨第二次人机对抗,这次网棋可能是双方协商 ...

柯渣真的被抬下去了,今天他在医院住院打吊针呢。

围棋是人类最后的骄傲了,这个不打服不可能收兵的。

作为一项智力运动,围棋一直以来只是人与人之间的对抗,所以好多适用于人类的认识不适合AI。以后在AI的辅助下也许人类还有搬回面子的那一天,也许没有也许。
作者: 燕庐敕    时间: 2017-1-4 18:31
删除失败 发表于 2017-1-4 16:34
99%是阿法狗,谢尔盖几个月前到中国棋院来过一次,可能就是商讨第二次人机对抗,这次网棋可能是双方协商 ...

很有可能大家猜阿尔法狗是对的。陈经透露一个细节:

下午赢了老聂后,繁体字打出:谢谢聂老师。

应该是Aja Huang在后台,那就是阿尔法狗无疑了。
作者: loy_20002000    时间: 2017-1-4 19:20
删除失败 发表于 2017-1-4 16:34
99%是阿法狗,谢尔盖几个月前到中国棋院来过一次,可能就是商讨第二次人机对抗,这次网棋可能是双方协商 ...

出BUG,很多人不服。对局量太少,不说明问题。
作者: 野草魂    时间: 2017-1-4 20:23
大脚丫 发表于 2017-1-4 16:51
柯渣真的被抬下去了,今天他在医院住院打吊针呢。

围棋是人类最后的骄傲了,这个不打服不可能收兵的。

日本象棋(将棋)还没有人工智能战胜最顶尖棋手。当然这玩艺只有日本人玩,也是一个原因。日本象棋不懂,类似象棋和国际象棋吧,特色就是被吃掉的子可以在任意一时刻重新被吃掉方再利用,所以从算法上应该难于国际象棋和象棋。
作者: 冰蚁    时间: 2017-1-4 20:48
本帖最后由 冰蚁 于 2017-1-4 08:38 编辑
删除失败 发表于 2017-1-4 03:34
99%是阿法狗,谢尔盖几个月前到中国棋院来过一次,可能就是商讨第二次人机对抗,这次网棋可能是双方协商 ...


上次不是有一盘机器下崩了嘛。说明有根本性问题要改进啊。改完了还是要测试测试。
作者: 猪头大将    时间: 2017-1-4 20:51
删除失败 发表于 2017-1-4 10:18
好像是乌龙,不是一回事,问到deepmind的人也没有回应。

从实力上看是阿法狗的可能性最大,不过master的 ...

另外20秒3步的快棋走法,对人类棋手的压力也很大。所以今天老聂上台时,每手时间被延长到1分钟。如果再快一点的话,估计老聂输得还要惨。不过听赛后老聂的讲解,他还很不服气,认为master的前半盘棋力不行。
作者: loy_20002000    时间: 2017-1-4 21:19
上次对李世石故意隐藏实力,让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快棋,其他都是30秒快棋。DeepMind没诚意,这帮职业还真是配合。

计算机算30秒与人类算30秒是不同的概念。

围棋类AI核心是MCTS类算法产生的经验计算结果,而硬件在对局中死算的求解能力要么是边际递减的要么是线性的,况且硬件的增加并不会线性提升计算能力,当到达一个阈值后计算能力边际递减直到边际效应为零。Go的做法突出了经验结果的重要性,而躲避了计算瓶颈。总结就是Go实战增加计算时间意义不大。

而人类对局的判断方式是先凭借棋感找点,然后细算,再从几个候选方案中确定一个最优方案。

两者对比有:

      找点                                   细算
Go  快,自我对局积累                 快,增加计算时间意义不大
Hu  快,经验+学习积累               慢,人类思维单线程+短时长时记忆切换需要时间+机械记忆力有限

单步时间越短Go优势越大,人类反之。

上次对李世石后“据说”DM要清空人类对局库,尤其是开局库,让机器自我对弈学习。对这种说法我很是怀疑。人类对局开始几手无非33、星、55、天元,假如把这几手去掉让机器自己判断, 有348个起始点。而这些变化占到围棋博弈树复杂度(博弈树树叶的数量)的96.4%!也就是说DeepMind让机器落在金角附近就不不纯粹了,有人的参与。假设第一点落在哪个星位都没有分别,并且初始点只在9*9的范围内选择,那么不设置人类招法作为第一点,将计算多余的96.3%博弈树。初始落子的选点人已经替机器把大部分非优招法排除了,如果成立的话。听说DM在GitHub开源了部分电子游戏的训练数据,还提供了一个DeepMindLab的接口,不清楚有没有公布围棋的训练数据。如果它有第一手落在各种乱七八糟地方的对局,那么它的系统才是纯粹的非人工。
作者: 冰蚁    时间: 2017-1-4 21:38
猪头大将 发表于 2017-1-4 07:51
另外20秒3步的快棋走法,对人类棋手的压力也很大。所以今天老聂上台时,每手时间被延长到1分钟。如果再快 ...

他就吹吧。前半盘他也只能是感觉感觉。
作者: 穿着裤衩裸奔    时间: 2017-1-4 23:00
冰蚁 发表于 2017-1-4 09:54
2016年12月30日凌晨,推特账号Science News曾发布了一条推文,内容为----

AlphaGo:“Now,I am the mas ...

哈哈哈哈
作者: 冰蚁    时间: 2017-1-5 00:55
loy_20002000 发表于 2017-1-4 08:19
上次对李世石故意隐藏实力,让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快 ...

增加时间,计算机可以多算几层,人更没戏。
作者: 大脚丫    时间: 2017-1-5 02:19
冰蚁 发表于 2017-1-5 00:55
增加时间,计算机可以多算几层,人更没戏。

没有AI的辅助人类棋手是不可能打败AI的,现在AI下出来的棋人类棋手根本就不能理解。增加人类棋手的时间可以减少错误,AI的计算力早就超越了人类,再多算几层也没有多大的意义了,所以这个还是对人类棋手有利的。

国内有一个AI “ 刑天”,据说有2016年三月的阿法狗水平,当然也是胜多败少了。这个系统发展起来的话国内棋手才有希望打败AI,毕竟google不大可能配合国内棋手训练
作者: 武工队    时间: 2017-1-5 02:29
冰蚁 发表于 2017-1-5 00:55
增加时间,计算机可以多算几层,人更没戏。

多层神经网络就是训练的时候耗时间吧?

训练好的神经网络,实际应用的时候还有啥耗时的步骤么?
作者: 冰蚁    时间: 2017-1-5 02:59
本帖最后由 冰蚁 于 2017-1-4 14:05 编辑
武工队 发表于 2017-1-4 13:29
多层神经网络就是训练的时候耗时间吧?

训练好的神经网络,实际应用的时候还有啥耗时的步骤么? ...


阿尔法狗的算法还是要靠蒙特卡洛搜索啊。时间多,搜索的遍历结果更多(搜索窗口可以开得更大,搜索层数可以更深)。神经网络的训练在于估值网络(value network)与走棋网络(policy network)上。遍历更充分,提供给两个神经网络判断的依据才会更充足,结果才会更优化。临场下棋,搜索多的显然占优势。
作者: 冰蚁    时间: 2017-1-5 07:55
我现在就是比较好奇如果设定的目标不是简单赢棋的话会怎么样。比如设定的目标是赢得越多越好,狗会下出什么风格和招法。
作者: Dracula    时间: 2017-1-5 11:54
猪头大将 发表于 2017-1-4 20:51
另外20秒3步的快棋走法,对人类棋手的压力也很大。所以今天老聂上台时,每手时间被延长到1分钟。如果再快 ...

据孟泰龄说,聂卫平下那步点角的败着(第50手)以前,形势已经不好了。聂卫平是自我感觉良好,他的形势判断不能信。据陈耀烨说,好多盘棋都是没觉得下什么坏棋,不知不觉的进行着,然后一点目就发现已经输定了。在形势判断上,人类和电脑现在已经有了不小的差距。虚的地方,比如厚势的价值,判断要比电脑差很多。
作者: 冰蚁    时间: 2017-1-5 12:10
Dracula 发表于 2017-1-4 22:54
据孟泰龄说,聂卫平下那步点角的败着(第50手)以前,形势已经不好了。聂卫平是自我感觉良好,他的形势判 ...

反正现在这个下法以后电脑要让九段们几个子了。
作者: Dracula    时间: 2017-1-5 12:47
冰蚁 发表于 2017-1-5 12:10
反正现在这个下法以后电脑要让九段们几个子了。

现在的AlphaGo下30秒快棋应该是至少能让人类顶尖棋手2子。我看的孟泰龄的说法,让先的差距不会有60比0这么恐怖的比分。下3小时慢棋,可能会好一点,但应该也至少会是让先,让两子也有可能。未来的话,让3子、4子的机器出现可能也不需要等待很多时间。
作者: 删除失败    时间: 2017-1-5 14:55
冰蚁 发表于 2017-1-5 07:55
我现在就是比较好奇如果设定的目标不是简单赢棋的话会怎么样。比如设定的目标是赢得越多越好,狗会下出什么 ...


有意思的想法,一开始我以为只是变相的贴目,实际上是个开放的问题。

如果是以赢棋为第一位,然后再考虑赢多少,那么只要在AI里加入对对手的评估,根据下棋过程中对手体现的水平估算自己能赢多少,然后按部就班就可以,因为AI最强的是执行力,所以我认为和master的表现差别不会太大。

但是如果目标是能赢多少就赢多少就复杂了,因为AI的对手人类完全可能是个围棋白痴,理论上可以不停得吃子赢得目数直到棋盘上没有可以落子的地方,我觉得AI会先变成白痴

作者: 穿着裤衩裸奔    时间: 2017-1-5 20:18
Dracula 发表于 2017-1-5 11:54
据孟泰龄说,聂卫平下那步点角的败着(第50手)以前,形势已经不好了。聂卫平是自我感觉良好,他的形势判 ...

以前欺负机器的时候就说机器没有棋感。
人类的棋感其实是建立在无法精细计算的基础上,不靠谱。
遇到电脑计算力一旦超过人类,人类的棋感就不起作用了。
棋感肯定搞不清楚每一步盈亏多少目?
机器只要比人精确,人就没戏了。

作者: loy_20002000    时间: 2017-1-5 22:08
冰蚁 发表于 2017-1-5 00:55
增加时间,计算机可以多算几层,人更没戏。

Go不强在这里,强在局势的判断。
作者: loy_20002000    时间: 2017-1-5 22:57
穿着裤衩裸奔 发表于 2017-1-5 20:18
以前欺负机器的时候就说机器没有棋感。
人类的棋感其实是建立在无法精细计算的基础上,不靠谱。
遇到电脑 ...

围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大局观强,死活计算反而不是强项。李世石唯一赢的那盘,死活错误是很低级的,最后一盘的开局误算损失也很大。需要补断,普通人的处理是处理好借用和余味,不会直接补,而Go是直接连成大长棍,笨了点但扎实到没有任何弱点。

我今年两大预测,李世石会赢,希拉里当选,统统错了。诶。
作者: 冰蚁    时间: 2017-1-5 22:57
本帖最后由 冰蚁 于 2017-1-5 10:19 编辑
loy_20002000 发表于 2017-1-5 09:08
Go不强在这里,强在局势的判断。


没有否认go的神经网络的成功。但神经网络需要蒙特卡洛的搜索结果,比赛的时候是这样,训练的时候也是。一切都是计算。更充分的计算是神经网络能够成功的基础。
作者: Dracula    时间: 2017-1-5 23:14
loy_20002000 发表于 2017-1-5 22:57
围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大 ...

我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象聂卫平那盘,聂卫平点角那步败招职业棋手第一感其实觉得还不错,没想到电脑马上就出杀招,给吃了。这个版本也一点不惧打劫。我看的好几盘都有打劫,下的都很好。AlphaGo和李世石下完,我看了一些职业棋手的总结觉得还是有弱点。Master这个版本就真的好像是无懈可击了。


作者: 冰蚁    时间: 2017-1-5 23:36
Dracula 发表于 2017-1-5 10:14
我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

这个版本也是从零学起,只有几条简单的围棋规则起步,完全没有输入棋谱。
作者: loy_20002000    时间: 2017-1-5 23:57
本帖最后由 loy_20002000 于 2017-1-6 00:33 编辑
Dracula 发表于 2017-1-5 23:14
我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...


看过与李世石的五盘直播,Master还没看过。力量这么大呀,现在去看下。

—————

刚看过聂卫平的自战解说,不评论Master的实力,单说老聂。

右上58粘那种棋是自灭一眼,换我上也肯定59。白棋净活后黑棋独眼龙,苦。杀是没戏,可以占一些便宜。不过以老聂的力量,就算净活也捞不到多少便宜,他一招败的工夫独步天下。
作者: 冰蚁    时间: 2017-1-6 00:41
Dracula 发表于 2017-1-5 10:14
我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

这个版本也是从零学起,只有几条简单的围棋规则起步,完全没有输入棋谱。
作者: 武工队    时间: 2017-1-6 01:35
冰蚁 发表于 2017-1-5 02:59
阿尔法狗的算法还是要靠蒙特卡洛搜索啊。时间多,搜索的遍历结果更多(搜索窗口可以开得更大,搜索层数可 ...

蒙特卡洛重复的次数,到了一定的数目以后,再增加次数也不会有什么变化了

我的理解是,搜索是要依据神经网络的判断的,估值很低的棋着,就不会继续搜索下去。所以整体上来说,可以是一个很深的搜索,但是不会是太广的搜索,相对来说,时间复杂度不会太高

目前30秒的快棋,master落子基本都在10秒以内,似乎都没必要把时间充分利用了
作者: 穿着裤衩裸奔    时间: 2017-1-6 10:52
loy_20002000 发表于 2017-1-5 22:57
围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大 ...

大多数人的大局观都是靠死活计算以及打谱,棋局灌出来的,本质上也是个统计模型。计算机现在算法和计算能力上来后,可以做到更精细,直接用胜率表示就可以了。

人类最多也就做到对棋局的判断精度精确到小数点后一位,比如三七开,二八开。计算机能做到1%就比人强10倍了。

比如人类下一手棋,觉得有八成把握是好棋,计算机可以做到知道胜率是81%还是82%。假如每一步计算机的胜率比人类高5%,前面20手下完,胜率应该高了一倍不止,基本上人类就不用玩了。

现在对局上的表现符合这个猜测,看起来每一步计算机都没什么特别高的,但下着下着就彻底落后了。





作者: loy_20002000    时间: 2017-1-6 20:55
本帖最后由 loy_20002000 于 2017-1-6 21:00 编辑
穿着裤衩裸奔 发表于 2017-1-6 10:52
大多数人的大局观都是靠死活计算以及打谱,棋局灌出来的,本质上也是个统计模型。计算机现在算法和计算能 ...

围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量化,少一子或多一子不会导致估值函数大起大落,而围棋盘面某个关键点是否有子是差别巨大的。简单累加优势一定是胜势是不一定成立的。

根据《Nature》上DeepMind的那篇文章,Go=策略网络+快速走子网络+估值网络+MCTS(蒙特卡洛树搜索+信心上限算法Upper Confidence Bounds+深度卷积神经网络左右互搏)。这种框架下的AI是肯定有盲点的,人机李世石的4、5局出错就是盲点BUG,第四局的错误我没记错的话DeepMind方面公布是系统误认己方是优势。这个框架有两点很重要,一是局面s估值v(s),二是下一手a价值v(a)的判定,落子选择f(s,a)只要v(s)估计错误或a遗漏了要点就会很麻烦。为了避免a的遗漏或是a自损招法Go在局部也是引入了模式的。

上次对李世石的测试出BUG,过不了多久应该有下一步的测试。期待柯洁或其他超一流的表现,这次不存在轻敌或准备不充分的问题,如果还是大败,人类就是彻底输了。

作者: 穿着裤衩裸奔    时间: 2017-1-6 22:31
loy_20002000 发表于 2017-1-6 20:55
围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量 ...

高手!高手!
作者: 冰蚁    时间: 2017-1-6 22:59
loy_20002000 发表于 2017-1-6 07:55
围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量 ...

目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的。也许是把搜索搞得更广更深?
作者: loy_20002000    时间: 2017-1-7 00:09
本帖最后由 loy_20002000 于 2017-1-7 00:22 编辑
冰蚁 发表于 2017-1-6 22:59
目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的 ...

围棋AI的框架大致是:深度卷积神经网络+蒙特卡洛树搜索。所有人都用类似的方法应该差距不大才对,但Go以外的系统对职业棋手都需要让子才能赢(大致一年前的信息)。Facebook的田博士问过Aja:“我们的平台用80个GPU累积数据,计算力能达到你们的1%吗”Aja含笑不语,他的猜测是到不了1%。DM的硬件计算力肯定世界第一。另外已经公开的算法和资料都很隐晦。其他系统停留在与职业初段抗争,Go(Master)完胜13位世界冠军(大概),这不是硬件能力可以简单解释的,他们或许在方法上取得了突破。

Go出bug的概率较低,上次为什么出bug都是在猜,也许没人猜对,或我没看到官方说法。可能李世石的应招不在或极少出现在训练结构里,导致机器低估那一招的概率,机器判断对手最有利的几个点并且检验的时间比较长,低概率招法占用的资源较少。

DeepMind训练AI玩Atari游戏听说成绩不错,只要是状态(向量空间、局面量化等)+动作的游戏都具有较高通用性。《Super Mario》、飞机类街机游戏、篮球投篮、斯诺克台球等等游戏都是满足的,这类游戏机器完胜人类。不清楚google与暴雪的合作是怎样的,我比较感兴趣的是他们如何处理人类的赌博行为,也就是投机选择。
作者: 大脚丫    时间: 2017-1-8 21:19
冰蚁 发表于 2017-1-6 22:59
目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的 ...

主要还是google没有向中国的职业棋手开放资源,其实人类棋手现在吃亏的地方是在明处,而阿法狗躲在AI的密云里面打冷枪。现在的局面我也是不看好人类棋手的,我是希望中国自己的AI完善以后,职业棋手借助AI训练一段时间或许可以和AI对上一阵。因为现在人类可以说完全不理解AI下出来的棋,以往千百年来积累的知识几乎都没有用了。

还有你说这版阿法狗是从零开始重新训练的,这个有没有正式出处?我觉得google保密得很厉害的,连用了什么规模的硬件也不说的。
作者: 冰蚁    时间: 2017-1-8 21:56
大脚丫 发表于 2017-1-8 08:19
主要还是google没有向中国的职业棋手开放资源,其实人类棋手现在吃亏的地方是在明处,而阿法狗躲在AI的密 ...

上次下完后,我记得黄博士在采访中就提到要从头开始训练,不依靠输入人类棋谱学习来获得升级版的狗。
作者: 大脚丫    时间: 2017-1-23 22:19
大脚丫 发表于 2017-1-3 17:13
以前的套路都是基于人类的局面计算能力的,现在AI超越了人类的计算深度,所以有新的观点不是奇怪的事情。 ...

说这个肉臂点错怎么办,结果还真的有两盘棋点错了!无奈阿法狗天纵英才,错一步没事,照样把对手干趴下。

这个事情是黄博士自己在facebook上面说的,主要还是怕研究棋局的棋手们被误导,具体感兴趣的朋友可以自己去看错的那两步。
作者: 陈王奋起挥黄钺    时间: 2017-2-12 15:20
loy_20002000 发表于 2017-1-4 21:19
上次对李世石故意隐藏实力,让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快 ...

计算机可以找小棋盘找到确定开局最佳点,然后逐步扩大棋盘, 从而迅速找到最佳开局的几个候选点。
作者: loy_20002000    时间: 2017-2-12 15:36
陈王奋起挥黄钺 发表于 2017-2-12 15:20
计算机可以找小棋盘找到确定开局最佳点,然后逐步扩大棋盘, 从而迅速找到最佳开局的几个候选点。 ...

我好好消化消化,有些想不明白。
作者: 陈王奋起挥黄钺    时间: 2017-2-12 19:46
loy_20002000 发表于 2017-2-12 15:36
我好好消化消化,有些想不明白。

对于开局最佳点, 可以用9线11线13线15线17线棋盘来测试,简化计算,慢慢就可以看出趋势性的东西了。
作者: loy_20002000    时间: 2017-2-12 21:44
陈王奋起挥黄钺 发表于 2017-2-12 19:46
对于开局最佳点, 可以用9线11线13线15线17线棋盘来测试,简化计算,慢慢就可以看出趋势性的东西了。 ...

你的意思我懂,就是具体实现有些抓瞎。没思路,怎么说呢,就是脑子有点空白。

你的说法是可行的。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2