该用户从未签到
常挨揍 发表于 2016-1-28 10:52 棋谱,可惜字太小 原文链接 http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...
使用道具 举报
签到天数: 1690 天
[LV.Master]无
燕庐敕 发表于 2016-1-27 22:21 四劫循环加长生如何?
燕庐敕 发表于 2016-1-28 12:06 谷歌真有信心,还是去找柯洁好了。
签到天数: 1618 天
财迷心窍 发表于 2016-1-28 12:50 总要给google点话题性吧。 李世石的水平再下降现在也依然是顶级棋手吧。 如果李世石真输了,柯洁有多大把 ...
燕庐敕 发表于 2016-1-28 13:10 后半盘至少不会赢飞了的再送出去。
签到天数: 62 天
[LV.6]出窍
财迷心窍 发表于 2016-1-28 14:05 google对alphago的棋力判断
他们确实做得很好,能让4子胜Zen和CrazyStone,把职业二段打成五比零,实力不容质疑。就期待着今年三月他们和李世石的比赛了。 从算法上来说,这篇文章并没有太多新意,主要是通过大量的训练数据,包括以往的棋谱和自我对局,把性能堆出来。他们训练了一个走子的神经网络(这个和我们的办法是一样的,但我们的文章主要在这上面作了改进),又训练了一个可以评估局面的网络(这个我们还没有),然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局(self-play)的结果训练。为了避免过拟合,每局只随机选了其中一个局面,然后让网络预测对局结果(胜或负)。两千万局不是个小数字,大家可以算一下一刻不停地下,15分钟一局需要多久才能下完(大约是570年)。这个规模我说实在没有想到过,谷歌在这方面是很有优势的。最后,他们的default policy也是经过处理的,能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之,谷歌的做法充分利用了大数据+深度学习的优势,而几乎完全没有用到围棋的领域知识,所以若是以后棋力能再往上走,我也不会惊讶。 其实这篇文章在去年11月份就已经投稿,但是因为《自然》杂志严格的审查制度,现在才出来。我们在11月的时候还只有3d的水平,蒙特卡罗树搜索还有各种问题,12月初的时候已经听到了谣言,当时我惊得话都说不出来了,然而就算这样,还是决定一点一点做,抓紧圣诞和新年的时间,把性能提高到5d的水平。我们还差一点拿了一月KGS锦标赛的冠军(Zen和DolBaram都参加了),可惜最后因为程序错误而超时,输了一局赢棋给Zen,得了第三名。谷歌的文章有20个作者,明显是下了血本,前两位都是计算机围棋界的大牛,一作David Silver是计算机围棋和强化学习的顶级专家,整个博士论文就是做的围棋; 二作Aja Huang以前写过多年围棋软件,自己又是AGA 6D的水平。相比之下我们只有两个人( @朱岩 ),只做了半年,中间还要穿插VQA等其他项目,而且都没有做过围棋的经验,想想有些差距也是不冤了。 现在回想起来,要是他们决定去年10月份战胜了樊麾后马上公开,或者我们再拖一会儿,决定不投ICLR而等到今年的ICML,那我们就被灭得连渣都不剩了(笑)。这回虎口拔牙,能从中拿到一些贡献,为公司增加一些影响力,算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽 :) Facebook高层也给了我们很大的支持,昨天我们组的老大Yann LeCun发了文章介绍我们的工作,扎克伯格还特地发了一篇文章点到了我的名字,赞扬我们的努力,对此我非常感动。 最后,我们的arXiv更新了[文章见http://arxiv.org/abs/1511.06410],欢迎大家有空看看。谢谢~
财迷心窍 发表于 2016-1-28 14:39 知乎上有大牛出现了 首先是facebook抢在google发成果前发了条消息说,我们也在研究围棋AI.
签到天数: 68 天
燕庐敕 发表于 2016-1-28 15:01 不知道像吴清源这样经常会有脱离战场的天外飞仙式的下法,机器会不会以秀哉的以不变应万变来对付? 小李 ...
以前的围棋程序通常将这些直觉总结成一些规则和公式以辅助搜索,这就要求写程序的人有较高的棋力和总结能力,但就算如此,人力毕竟有时而穷,规则的数目上去了之后,调节各规则之间的权重就成为非常累人的工作,往往耗去了大量的时间之后,还离真正的直觉很远(如果大家有兴趣去看开源围棋软件Pachi或者Fuego的代码,就会发现里面的参数之多出乎想像)。深度卷积网络的出现,让通过大量数据直接学习这种直觉成为可能,从而在这个无法搜索并且无法估值的无解问题上撕开一个口子。
当然,“撕开口子”和“解决问题”之间,还差着十万八千里,现有的深度学习框架需要大量数据进行训练,因此对于一些少见的情形效果不好。像我们训练的这个网络,虽然被KGS上的朋友评论为”感觉上和真人在下“,”大局观非常好“,但碰到征子这种初学者都会的局面时,有时还是无所适从(笑)。另外局部战斗的计算也有很多可以改进的地方。我们当然可以加些简单规则以应付大多数征子和一些局部战斗的情况(要全部覆盖那是很难的),这样棋力当然变强,但却违背了用一个比较干净的模型去解决问题的初衷。历史上无数的例子证明,这种方式在将来能走得更远。
删除失败 发表于 2016-1-28 15:10 有点问题。 放在东亚,Fan Hui的实力肯定没有职业水平,现在刚入段的小孩都强得很。业余棋手中也没有九 ...
财迷心窍 发表于 2016-1-28 15:54 按照田博士的说法,他的darkforest(看样子也是三体迷)这类新一代的AI(alphago应该也是这类),都是自学 ...
签到天数: 108 天
财迷心窍 发表于 2016-1-28 16:01 关键是按照田博士的说法,这些新一代的围棋AI都是自学习的,也就是说是会自己长棋的。。。 这个真的是AI ...
签到天数: 1277 天
[LV.10]大乘
澹泊敬诚 发表于 2016-1-27 23:08 比赛用时很关键啊 前面大局和棋感人能有优势 收官估计搞不过电脑
签到天数: 71 天
签到天数: 141 天
[LV.7]分神
手机版|小黑屋|Archiver|网站错误报告|爱吱声
GMT+8, 2024-11-5 19:29 , Processed in 0.046288 second(s), 20 queries , Gzip On.
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.