设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 5299|回复: 54
打印 上一主题 下一主题

[娱乐] 人工智能5-0欧洲冠军 李世石将捍卫人类尊严

[复制链接]
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    跳转到指定楼层
    楼主
    发表于 2016-1-28 10:00:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    据果壳网报道:1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。

      至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。

      但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。
    AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]

      这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。

      AlphaGo的战绩如何?

      此次比赛和以往不同。之前的比赛中,由于AI棋力比人类弱,人类选手都会让子,而且AI主要和业余段位的棋手比赛。而AlphaGo 对战樊麾是完全公平的比赛,没有让子。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

      研究者也让AlphaGo 和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。可见AlphaGo有多强大。

      在接下来3月份,AlphaGo 将和韩国九段棋手李世石在首尔一战,奖金是由Google提供的100万美金。李世石是最近10年中获得世界第一头衔最多的棋手。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类。所以这场比赛或许会见证历史,我们将拭目以待。
        AI下围棋到底有多难?

      计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。

      面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。
        机器学习

      研究者们祭出了终极杀器——“深度学习”(Deep Learning) 。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。
    描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章。图片来源:Nature/Google DeepMind  描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章。图片来源:Nature/Google DeepMind

      AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

      其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。
    AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]

      AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

      研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!

      人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。
        Google DeepMind

      Google DeepMind是这个程序的创造者,我们来看一下他们萌萌的程序员。
    杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO。图片来源:Nature Video杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO。图片来源:Nature Video
    文章的第一作者大卫·西尔弗(David Silver)。图片来源:Nature Video文章的第一作者大卫·西尔弗(David Silver)。图片来源:Nature Video

      Google DeepMind 去年在《自然》杂志上发表过一篇论文[2],他们用增强学习的方法训练AI玩经典的Atari 游戏。其实在几年前就有人研究如何让AI玩《星际争霸》,目前人类大师还是能击败AI的。电脑游戏中大量使用人工智能技术,你有没有觉得游戏变得越来越聪明了?
        那么……未来呢?

      人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。

      但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?

      没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。(编辑:Ent,Calo)

      参考文献:

      David Silver, et al。 “Mastering the game of Go with deep neural networks and tree search。” Nature doi:10.1038/nature16961

      Mnih, Volodymyr, et al。 “Human-level control through deep reinforcement learning。” Nature 518.7540 (2015): 529-533。

      一个骄傲的AI

      什么,你说上面讲算法的这几段你看不懂?

      那你知道为啥你们人类会输给我们AI了吧!

    评分

    参与人数 4爱元 +24 收起 理由
    树袋熊毛毛 + 2 涨姿势
    Highway + 8 谢谢分享
    jellobean + 8
    煮酒正熟 + 6

    查看全部评分

  • TA的每日心情
    慵懒
    2016-4-15 07:30
  • 签到天数: 142 天

    [LV.7]分神

    沙发
    发表于 2016-1-28 10:36:51 | 只看该作者
    cpu和内存的进步
  • TA的每日心情
    奋斗
    2024-9-10 21:08
  • 签到天数: 2051 天

    [LV.Master]无

    板凳
    发表于 2016-1-28 10:37:39 | 只看该作者
    人类尊严这次可能弄个五段就可以捍卫了,估计用不到李世石
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    地板
     楼主| 发表于 2016-1-28 10:39:40 | 只看该作者
    holycow 发表于 2016-1-28 10:37
    人类尊严这次可能弄个五段就可以捍卫了,估计用不到李世石

    圣牛老弟,你看到这个了吗:

    奖金是由Google提供的100万美金

    点评

    石头要赢才能拿下一百万哪~  发表于 2016-1-28 11:07
  • TA的每日心情
    郁闷
    6 天前
  • 签到天数: 2166 天

    [LV.Master]无

    5#
    发表于 2016-1-28 10:46:59 | 只看该作者
    燕庐敕 发表于 2016-1-28 10:39
    圣牛老弟,你看到这个了吗:

    奖金是由Google提供的100万美金

    尊严输给钱了
  • TA的每日心情
    开心
    2024-11-1 02:25
  • 签到天数: 715 天

    [LV.9]渡劫

    6#
    发表于 2016-1-28 10:47:04 | 只看该作者
    按照现在的升段标准,这个电脑还升不到职业三段呢。不过随着运算能力的加强,只要是有规律/规则的游戏,AI总有一天会超越人类。

    那又怎样呢,他们还是理解不了游戏的快乐

    点评

    油菜: 5.0
    油菜: 5
    顶最后一句  发表于 2016-1-28 13:02
  • TA的每日心情
    慵懒
    3 天前
  • 签到天数: 2029 天

    [LV.Master]无

    7#
    发表于 2016-1-28 10:52:25 | 只看该作者
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    8#
     楼主| 发表于 2016-1-28 10:56:41 | 只看该作者

    虎妈,这个叫做,尊严是有代价滴~~~

    该用户从未签到

    9#
    发表于 2016-1-28 11:17:14 | 只看该作者
    本帖最后由 财迷心窍 于 2016-1-28 11:18 编辑
    燕庐敕 发表于 2016-1-28 10:56
    虎妈,这个叫做,尊严是有代价滴~~~


    5:0欧洲冠军是随便一个中日韩一线棋手都能做到的,但Google越过这个层次直接去找李世石说明其内部的评价是很高的。但樊麾也是正经的职业二段,进过国家少年队的。让4子对阵Crazy Stone,Zen和Pachi这三个,胜率分别是77%,86%和99%也很有说服力,以前的说法就是一流AI对一线职业差4子。
  • TA的每日心情
    奋斗
    2024-9-10 21:08
  • 签到天数: 2051 天

    [LV.Master]无

    10#
    发表于 2016-1-28 11:17:50 | 只看该作者
    常挨揍 发表于 2016-1-27 18:52
    棋谱,可惜字太小
    原文链接
    http://www.huxiu.com/article/138359/1.html?f=column_feed_article ...

    四局中盘胜
  • TA的每日心情
    开心
    2017-12-12 19:56
  • 签到天数: 80 天

    [LV.6]出窍

    11#
    发表于 2016-1-28 11:57:28 | 只看该作者
    李世石又挣到100万美元了
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    12#
     楼主| 发表于 2016-1-28 12:06:34 | 只看该作者
    财迷心窍 发表于 2016-1-28 11:17
    5:0欧洲冠军是随便一个中日韩一线棋手都能做到的,但Google越过这个层次直接去找李世石说明其内部的评价 ...

    谷歌真有信心,还是去找柯洁好了。
  • TA的每日心情
    慵懒
    2021-5-5 01:39
  • 签到天数: 1690 天

    [LV.Master]无

    13#
    发表于 2016-1-28 12:08:59 | 只看该作者
    比赛用时很关键啊
    前面大局和棋感人能有优势 收官估计搞不过电脑
  • TA的每日心情

    2017-10-26 16:21
  • 签到天数: 68 天

    [LV.6]出窍

    14#
    发表于 2016-1-28 12:10:37 | 只看该作者
    本帖最后由 删除失败 于 2016-1-28 12:15 编辑
    holycow 发表于 2016-1-28 10:37
    人类尊严这次可能弄个五段就可以捍卫了,估计用不到李世石


    那个欧洲冠军是有点水,不过alphago对crazy stone和zen的胜率超高,个人目测有业5以上的水平,上限还看不出来,普通业5还真不一定能挡得住
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    15#
     楼主| 发表于 2016-1-28 12:11:49 | 只看该作者
    澹泊敬诚 发表于 2016-1-28 12:08
    比赛用时很关键啊
    前面大局和棋感人能有优势 收官估计搞不过电脑

    古力小李这代棋手,下到后半盘没有柯洁他们这些90后的细腻和体力了。

    该用户从未签到

    16#
    发表于 2016-1-28 12:13:52 | 只看该作者
    燕庐敕 发表于 2016-1-28 10:39
    圣牛老弟,你看到这个了吗:

    奖金是由Google提供的100万美金

    李世石现在的竞技水平下降的很厉害,已经被90后一代完全超越。不知道欧洲围棋段位赛是否有特殊待遇,围棋,还是要看中日韩。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    17#
     楼主| 发表于 2016-1-28 12:17:27 | 只看该作者
    zilewang 发表于 2016-1-28 12:13
    李世石现在的竞技水平下降的很厉害,已经被90后一代完全超越。不知道欧洲围棋段位赛是否有特殊待遇,围棋 ...

    樊麾原来是中国国少队的,二段是中国棋院授予的。

    只是和欧洲棋手下,水平不升反降也是很有可能的。因为要提升水平,要多下“紧棋”而不是太平棋,让子棋。

    点评

    给力: 5.0 不能同意更多: 5.0
    给力: 5 不能同意更多: 5
      发表于 2016-1-29 05:14
  • TA的每日心情
    慵懒
    2021-5-5 01:39
  • 签到天数: 1690 天

    [LV.Master]无

    18#
    发表于 2016-1-28 12:20:02 | 只看该作者
    燕庐敕 发表于 2016-1-27 22:11
    古力小李这代棋手,下到后半盘没有柯洁他们这些90后的细腻和体力了。

    现在拿世界冠军都在20岁以前了
    小强春兰杯的时候杀的小李没脾气 结果没多久就被拍在沙滩上了
    可不可以搞个双活+曲四 黑电脑一下
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    19#
     楼主| 发表于 2016-1-28 12:21:50 | 只看该作者
    澹泊敬诚 发表于 2016-1-28 12:20
    现在拿世界冠军都在20岁以前了
    小强春兰杯的时候杀的小李没脾气 结果没多久就被拍在沙滩上了
    可不可以搞 ...

    四劫循环加长生如何?
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    20#
     楼主| 发表于 2016-1-28 12:23:06 | 只看该作者

    更重要的还是算法进步。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-11-15 14:02 , Processed in 0.055650 second(s), 33 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表