holycow 发表于 2016-1-28 10:37
人类尊严这次可能弄个五段就可以捍卫了,估计用不到李世石
燕庐敕 发表于 2016-1-28 10:39
圣牛老弟,你看到这个了吗:
奖金是由Google提供的100万美金
huma 发表于 2016-1-28 10:46
尊严输给钱了
燕庐敕 发表于 2016-1-28 10:56
虎妈,这个叫做,尊严是有代价滴~~~
常挨揍 发表于 2016-1-27 18:52
棋谱,可惜字太小
原文链接
http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...
财迷心窍 发表于 2016-1-28 11:17
5:0欧洲冠军是随便一个中日韩一线棋手都能做到的,但Google越过这个层次直接去找李世石说明其内部的评价 ...
holycow 发表于 2016-1-28 10:37
人类尊严这次可能弄个五段就可以捍卫了,估计用不到李世石
澹泊敬诚 发表于 2016-1-28 12:08
比赛用时很关键啊
前面大局和棋感人能有优势 收官估计搞不过电脑
燕庐敕 发表于 2016-1-28 10:39
圣牛老弟,你看到这个了吗:
奖金是由Google提供的100万美金
zilewang 发表于 2016-1-28 12:13
李世石现在的竞技水平下降的很厉害,已经被90后一代完全超越。不知道欧洲围棋段位赛是否有特殊待遇,围棋 ...
燕庐敕 发表于 2016-1-27 22:11
古力小李这代棋手,下到后半盘没有柯洁他们这些90后的细腻和体力了。
澹泊敬诚 发表于 2016-1-28 12:20
现在拿世界冠军都在20岁以前了
小强春兰杯的时候杀的小李没脾气 结果没多久就被拍在沙滩上了
可不可以搞 ...
齐的隆冬强 发表于 2016-1-28 10:36
cpu和内存的进步
常挨揍 发表于 2016-1-28 10:52
棋谱,可惜字太小
原文链接
http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...
燕庐敕 发表于 2016-1-27 22:21
四劫循环加长生如何?
燕庐敕 发表于 2016-1-28 12:06
谷歌真有信心,还是去找柯洁好了。
财迷心窍 发表于 2016-1-28 12:50
总要给google点话题性吧。
李世石的水平再下降现在也依然是顶级棋手吧。
如果李世石真输了,柯洁有多大把 ...
燕庐敕 发表于 2016-1-28 13:10
后半盘至少不会赢飞了的再送出去。
财迷心窍 发表于 2016-1-28 14:05
google对alphago的棋力判断
他们确实做得很好,能让4子胜Zen和CrazyStone,把职业二段打成五比零,实力不容质疑。就期待着今年三月他们和李世石的比赛了。
从算法上来说,这篇文章并没有太多新意,主要是通过大量的训练数据,包括以往的棋谱和自我对局,把性能堆出来。他们训练了一个走子的神经网络(这个和我们的办法是一样的,但我们的文章主要在这上面作了改进),又训练了一个可以评估局面的网络(这个我们还没有),然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局(self-play)的结果训练。为了避免过拟合,每局只随机选了其中一个局面,然后让网络预测对局结果(胜或负)。两千万局不是个小数字,大家可以算一下一刻不停地下,15分钟一局需要多久才能下完(大约是570年)。这个规模我说实在没有想到过,谷歌在这方面是很有优势的。最后,他们的default policy也是经过处理的,能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之,谷歌的做法充分利用了大数据+深度学习的优势,而几乎完全没有用到围棋的领域知识,所以若是以后棋力能再往上走,我也不会惊讶。
其实这篇文章在去年11月份就已经投稿,但是因为《自然》杂志严格的审查制度,现在才出来。我们在11月的时候还只有3d的水平,蒙特卡罗树搜索还有各种问题,12月初的时候已经听到了谣言,当时我惊得话都说不出来了,然而就算这样,还是决定一点一点做,抓紧圣诞和新年的时间,把性能提高到5d的水平。我们还差一点拿了一月KGS锦标赛的冠军(Zen和DolBaram都参加了),可惜最后因为程序错误而超时,输了一局赢棋给Zen,得了第三名。谷歌的文章有20个作者,明显是下了血本,前两位都是计算机围棋界的大牛,一作David Silver是计算机围棋和强化学习的顶级专家,整个博士论文就是做的围棋; 二作Aja Huang以前写过多年围棋软件,自己又是AGA 6D的水平。相比之下我们只有两个人( @朱岩 ),只做了半年,中间还要穿插VQA等其他项目,而且都没有做过围棋的经验,想想有些差距也是不冤了。
现在回想起来,要是他们决定去年10月份战胜了樊麾后马上公开,或者我们再拖一会儿,决定不投ICLR而等到今年的ICML,那我们就被灭得连渣都不剩了(笑)。这回虎口拔牙,能从中拿到一些贡献,为公司增加一些影响力,算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽 :)
Facebook高层也给了我们很大的支持,昨天我们组的老大Yann LeCun发了文章介绍我们的工作,扎克伯格还特地发了一篇文章点到了我的名字,赞扬我们的努力,对此我非常感动。
最后,我们的arXiv更新了[文章见http://arxiv.org/abs/1511.06410],欢迎大家有空看看。谢谢~
财迷心窍 发表于 2016-1-28 14:39
知乎上有大牛出现了
首先是facebook抢在google发成果前发了条消息说,我们也在研究围棋AI.
财迷心窍 发表于 2016-1-28 14:05
google对alphago的棋力判断
燕庐敕 发表于 2016-1-28 15:01
不知道像吴清源这样经常会有脱离战场的天外飞仙式的下法,机器会不会以秀哉的以不变应万变来对付?
小李 ...
以前的围棋程序通常将这些直觉总结成一些规则和公式以辅助搜索,这就要求写程序的人有较高的棋力和总结能力,但就算如此,人力毕竟有时而穷,规则的数目上去了之后,调节各规则之间的权重就成为非常累人的工作,往往耗去了大量的时间之后,还离真正的直觉很远(如果大家有兴趣去看开源围棋软件Pachi或者Fuego的代码,就会发现里面的参数之多出乎想像)。深度卷积网络的出现,让通过大量数据直接学习这种直觉成为可能,从而在这个无法搜索并且无法估值的无解问题上撕开一个口子。
当然,“撕开口子”和“解决问题”之间,还差着十万八千里,现有的深度学习框架需要大量数据进行训练,因此对于一些少见的情形效果不好。像我们训练的这个网络,虽然被KGS上的朋友评论为”感觉上和真人在下“,”大局观非常好“,但碰到征子这种初学者都会的局面时,有时还是无所适从(笑)。另外局部战斗的计算也有很多可以改进的地方。我们当然可以加些简单规则以应付大多数征子和一些局部战斗的情况(要全部覆盖那是很难的),这样棋力当然变强,但却违背了用一个比较干净的模型去解决问题的初衷。历史上无数的例子证明,这种方式在将来能走得更远。
删除失败 发表于 2016-1-28 15:10
有点问题。
放在东亚,Fan Hui的实力肯定没有职业水平,现在刚入段的小孩都强得很。业余棋手中也没有九 ...
财迷心窍 发表于 2016-1-28 15:54
按照田博士的说法,他的darkforest(看样子也是三体迷)这类新一代的AI(alphago应该也是这类),都是自学 ...
财迷心窍 发表于 2016-1-28 16:01
关键是按照田博士的说法,这些新一代的围棋AI都是自学习的,也就是说是会自己长棋的。。。
这个真的是AI ...
常挨揍 发表于 2016-1-28 10:52
棋谱,可惜字太小
原文链接
http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...
澹泊敬诚 发表于 2016-1-27 23:08
比赛用时很关键啊
前面大局和棋感人能有优势 收官估计搞不过电脑
澹泊敬诚 发表于 2016-1-28 12:32
够狠 直接死机了
冰蚁 发表于 2016-1-28 20:24
大局,棋感的优势会越来越少。
flyrathabu 发表于 2016-1-28 23:09
实际别想太多,当年深蓝就下国际象棋赢了卡斯帕罗夫。国际象棋也不容易的。现在科技发展了,硬件做得更好更 ...
燕庐敕 发表于 2016-1-28 22:50
离开战场却是天外飞仙的手段,看来人是比机器强?
山远空寒 发表于 2016-1-28 13:34
希望电脑能争口气,不要让小李赚这100万太轻松。
燕庐敕 发表于 2016-1-28 15:01
不知道像吴清源这样经常会有脱离战场的天外飞仙式的下法,机器会不会以秀哉的以不变应万变来对付?
小李 ...
zilewang 发表于 2016-1-31 12:27
不知道AI对劫争怎么样?
zilewang 发表于 2016-1-31 12:26
上次古李梦百合十番战,小李轻松收入500万。google这是在送钱。真要验证,还是找一个现身职业四五段棋手 ...
删除失败 发表于 2016-1-28 19:48
看了一下棋谱,感觉Fan Hui下得很差,连业5的水平都未必有,也有传言说他的下法受到了google的限制,无法 ...
欢迎光临 爱吱声 (http://129.226.69.186/bbs/) | Powered by Discuz! X3.2 |