人工智能5-0欧洲冠军李世石将捍卫人类尊严

财迷心窍 · 发表于 2016-1-28 12:26:37

常挨揍发表于 2016-1-28 10:52
棋谱，可惜字太小
原文链接
http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...

有SGF的棋谱下载
http://www.computer-go.info/h-c/index.html#2015
@澹泊敬诚
用时是1h，以后30s一步。

澹泊敬诚 · 发表于 2016-1-28 12:32:16

燕庐敕发表于 2016-1-27 22:21
四劫循环加长生如何？

够狠直接死机了

财迷心窍 · 发表于 2016-1-28 12:50:14

本帖最后由财迷心窍于 2016-1-28 12:51 编辑

燕庐敕发表于 2016-1-28 12:06
谷歌真有信心，还是去找柯洁好了。

总要给google点话题性吧。
李世石的水平再下降现在也依然是顶级棋手吧。
如果李世石真输了，柯洁有多大把握能把场子找回来？当然我不认为这次李世石会输

燕庐敕 · 发表于 2016-1-28 13:10:12

财迷心窍发表于 2016-1-28 12:50
总要给google点话题性吧。
李世石的水平再下降现在也依然是顶级棋手吧。
如果李世石真输了，柯洁有多大把 ...

后半盘至少不会赢飞了的再送出去。

财迷心窍 · 发表于 2016-1-28 13:22:36

本帖最后由财迷心窍于 2016-1-28 13:37 编辑

燕庐敕发表于 2016-1-28 13:10
后半盘至少不会赢飞了的再送出去。

这倒是真的

不过也更有话题性，前半盘大优，然后惜败。
墙外各位能上facebook确认一下吗？据说google发消息的同时，扎克伯格说facebook也已经投入这个领域了。
如果发生facebook vs google的竞赛，那就真是没几年功夫了。。。

山远空寒 · 发表于 2016-1-28 13:34:22

希望电脑能争口气，不要让小李赚这100万太轻松。

财迷心窍 · 发表于 2016-1-28 14:05:00

本帖最后由财迷心窍于 2016-1-28 14:06 编辑

google对alphago的棋力判断

燕庐敕 · 发表于 2016-1-28 14:07:33

财迷心窍发表于 2016-1-28 14:05
google对alphago的棋力判断

谷歌里头棋力最高的人判断的？还是横向依据啥判断的？

财迷心窍 · 发表于 2016-1-28 14:39:04

本帖最后由财迷心窍于 2016-1-28 14:41 编辑

知乎上有大牛出现了
首先是facebook抢在google发成果前发了条消息说，我们也在研究围棋AI.

然后这位被扎克伯格点名的田渊栋博士上知乎回答了对google AI的评价
The researcher who works on this, Yuandong Tian, sits about 20 feet from my desk.I love having our AI team right near me so I can learn from what they're working on."

谷歌的文章居然有20个作者！看样子田博士的预算也不会发愁了。

站在AI和围棋的角度，这才是最可怕和最有价值的
谷歌的做法充分利用了大数据+深度学习的优势，而几乎完全没有用到围棋的领域知识

他们确实做得很好，能让4子胜Zen和CrazyStone，把职业二段打成五比零，实力不容质疑。就期待着今年三月他们和李世石的比赛了。

从算法上来说，这篇文章并没有太多新意，主要是通过大量的训练数据，包括以往的棋谱和自我对局，把性能堆出来。他们训练了一个走子的神经网络（这个和我们的办法是一样的，但我们的文章主要在这上面作了改进），又训练了一个可以评估局面的网络（这个我们还没有），然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局(self-play)的结果训练。为了避免过拟合，每局只随机选了其中一个局面，然后让网络预测对局结果（胜或负）。两千万局不是个小数字，大家可以算一下一刻不停地下，15分钟一局需要多久才能下完（大约是570年）。这个规模我说实在没有想到过，谷歌在这方面是很有优势的。最后，他们的default policy也是经过处理的，能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之，谷歌的做法充分利用了大数据+深度学习的优势，而几乎完全没有用到围棋的领域知识，所以若是以后棋力能再往上走，我也不会惊讶。

其实这篇文章在去年11月份就已经投稿，但是因为《自然》杂志严格的审查制度，现在才出来。我们在11月的时候还只有3d的水平，蒙特卡罗树搜索还有各种问题，12月初的时候已经听到了谣言，当时我惊得话都说不出来了，然而就算这样，还是决定一点一点做，抓紧圣诞和新年的时间，把性能提高到5d的水平。我们还差一点拿了一月KGS锦标赛的冠军（Zen和DolBaram都参加了），可惜最后因为程序错误而超时，输了一局赢棋给Zen，得了第三名。谷歌的文章有20个作者，明显是下了血本，前两位都是计算机围棋界的大牛，一作David Silver是计算机围棋和强化学习的顶级专家，整个博士论文就是做的围棋; 二作Aja Huang以前写过多年围棋软件，自己又是AGA 6D的水平。相比之下我们只有两个人（ @朱岩 )，只做了半年，中间还要穿插VQA等其他项目，而且都没有做过围棋的经验，想想有些差距也是不冤了。

现在回想起来，要是他们决定去年10月份战胜了樊麾后马上公开，或者我们再拖一会儿，决定不投ICLR而等到今年的ICML，那我们就被灭得连渣都不剩了（笑）。这回虎口拔牙，能从中拿到一些贡献，为公司增加一些影响力，算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽 :)

Facebook高层也给了我们很大的支持，昨天我们组的老大Yann LeCun发了文章介绍我们的工作，扎克伯格还特地发了一篇文章点到了我的名字，赞扬我们的努力，对此我非常感动。

最后，我们的arXiv更新了[文章见http://arxiv.org/abs/1511.06410]，欢迎大家有空看看。谢谢～

燕庐敕 · 发表于 2016-1-28 15:01:00

财迷心窍发表于 2016-1-28 14:39
知乎上有大牛出现了
首先是facebook抢在google发成果前发了条消息说，我们也在研究围棋AI.

不知道像吴清源这样经常会有脱离战场的天外飞仙式的下法，机器会不会以秀哉的以不变应万变来对付？

小李的下法类似坂田，强烈取地然后治孤。

删除失败 · 发表于 2016-1-28 15:10:40

财迷心窍发表于 2016-1-28 14:05
google对alphago的棋力判断

有点问题。

放在东亚，Fan Hui的实力肯定没有职业水平，现在刚入段的小孩都强得很。业余棋手中也没有九段这个水平，八段也只是名誉称号，业7和职业的低段水平差距很细微。

按此图判断，李世石应稳赢alphago，但两子应该让不动，不过几个围棋AI评价偏高，zen我试过，没有业5。

财迷心窍 · 发表于 2016-1-28 15:54:55

本帖最后由财迷心窍于 2016-1-28 15:56 编辑

燕庐敕发表于 2016-1-28 15:01
不知道像吴清源这样经常会有脱离战场的天外飞仙式的下法，机器会不会以秀哉的以不变应万变来对付？

小李 ...

按照田博士的说法，他的darkforest（看样子也是三体迷）这类新一代的AI（alphago应该也是这类），都是自学习而不是基于搜索的。

以前的围棋程序通常将这些直觉总结成一些规则和公式以辅助搜索，这就要求写程序的人有较高的棋力和总结能力，但就算如此，人力毕竟有时而穷，规则的数目上去了之后，调节各规则之间的权重就成为非常累人的工作，往往耗去了大量的时间之后，还离真正的直觉很远（如果大家有兴趣去看开源围棋软件Pachi或者Fuego的代码，就会发现里面的参数之多出乎想像）。深度卷积网络的出现，让通过大量数据直接学习这种直觉成为可能，从而在这个无法搜索并且无法估值的无解问题上撕开一个口子。

当然，“撕开口子”和“解决问题”之间，还差着十万八千里，现有的深度学习框架需要大量数据进行训练，因此对于一些少见的情形效果不好。像我们训练的这个网络，虽然被KGS上的朋友评论为”感觉上和真人在下“，”大局观非常好“，但碰到征子这种初学者都会的局面时，有时还是无所适从（笑）。另外局部战斗的计算也有很多可以改进的地方。我们当然可以加些简单规则以应付大多数征子和一些局部战斗的情况（要全部覆盖那是很难的），这样棋力当然变强，但却违背了用一个比较干净的模型去解决问题的初衷。历史上无数的例子证明，这种方式在将来能走得更远。

所以可能他们还真未见得怕吴清源，而会更怕小李

财迷心窍 · 发表于 2016-1-28 16:01:30

删除失败发表于 2016-1-28 15:10
有点问题。

放在东亚，Fan Hui的实力肯定没有职业水平，现在刚入段的小孩都强得很。业余棋手中也没有九 ...

关键是按照田博士的说法，这些新一代的围棋AI都是自学习的，也就是说是会自己长棋的。。。
这个真的是AI了。

燕庐敕 · 发表于 2016-1-28 16:01:41

财迷心窍发表于 2016-1-28 15:54
按照田博士的说法，他的darkforest（看样子也是三体迷）这类新一代的AI（alphago应该也是这类），都是自学 ...

小李最善翻盘，鬼手并未超过老曹。坂田鬼手最多。

Radiohead · 发表于 2016-1-28 19:23:04

财迷心窍发表于 2016-1-28 16:01
关键是按照田博士的说法，这些新一代的围棋AI都是自学习的，也就是说是会自己长棋的。。。
这个真的是AI ...

是的，机器可以通过学习提高。所以叫做机器学习嘛。在学习机器学习这门课的时候，写个练习就是下三子棋。然后机器反复学习提高棋力，当然三子棋这个简单了。

删除失败 · 发表于 2016-1-28 19:48:53

常挨揍发表于 2016-1-28 10:52
棋谱，可惜字太小
原文链接
http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...

看了一下棋谱，感觉Fan Hui下得很差，连业5的水平都未必有，也有传言说他的下法受到了google的限制，无法发挥，看来alphago的真实水平还有待观察。小李的100万美刀看来妥妥的了。

冰蚁 · 发表于 2016-1-28 20:24:17

澹泊敬诚发表于 2016-1-27 23:08
比赛用时很关键啊
前面大局和棋感人能有优势收官估计搞不过电脑

大局，棋感的优势会越来越少。

雨楼 · 发表于 2016-1-28 21:53:28

左右互博。无所谓胜负。
直到有一天人工智能有了自己的思想。

mark · 发表于 2016-1-28 22:17:24

这个对手明显只是个试金石，既然敢挑战李世石，说明把握很大。这个AI不会只是第一次找职业棋手来过招。现在清风网这些网站，找几个高段位来搞一搞，轻而易举的事。我如果在这个团队，也会让这个AI挂个网名，天天和职业棋手过招，评估对局的水平。我估计这个AI现在至少能有8D的水平，所以才敢叫板李世石。

仁 · 发表于 2016-1-28 22:44:30

实际上，人工智能才是'人类'的尊严，李世石等代表的只是天才的个体。

		自动登录	找回密码
密码			注册

[娱乐] 人工智能5-0欧洲冠军李世石将捍卫人类尊严

点评

[娱乐] 人工智能5-0欧洲冠军 李世石将捍卫人类尊严

点评

[娱乐] 人工智能5-0欧洲冠军李世石将捍卫人类尊严