击败柯洁的是采用了谷歌TPU的单机版AlphaGo

发布时间:2017-05-25 00:00
作者:Ameya360
来源:网络整理
阅读量:1231

  AlphaGo采用了十颗TPU在云上运行,跟去年相比,本次对弈的新版AlphaGo计算量小了十倍,自我对弈能力更强,运行起来更简单,更好,功耗也更小。

  23日起跑的“中国乌镇围棋峰会”,由柯洁对战AlphaGo掀开序幕。 历时四个多小时的比赛,最终执黑棋先行的柯洁以1/4子之差落败,由AlphaGo取得第一胜。 赛后发布会上,柯洁和AlphaGo创始人、DeepMind首席执行官哈萨比斯(Demis Hassabis)以及DeepMind 强化学习团队首席程序员David Silver出席并回答了提问。

  赛后柯洁的心情看起来还不错,言辞也十分谦虚。他先是称赞了AlphaGo强大的实力,又坦言棋手们可以从中学到很多东西,AlphaGo下的很精彩,自己尽了全力:“它下的太好了,很值得棋手学习和探讨。我们需要开拓自己的思维,不能停留在原地了。” 柯洁承认,虽然自己对比赛仍然充满自信,但还完全没有摸到AlphaGo的弱点,甚至自嘲“只能等AlphaGo自己出bug”了。不过有意思的是,DeepMind创始人哈萨比斯在现场表示,不仅是DeepMind,甚至连AlphaGo自己也不知道自己有哪些bug……

  哈萨比斯称:“AlphaGo采用了十颗TPU(Tensor Processing Units)在云上运行,跟去年相比,本次对弈的新版AlphaGo计算量小了十倍,自我对弈能力更强,运行起来更简单,更好,功耗也更小。”

  DeepMind方面表示,本次与柯洁对弈的AlphaGo乃是单机版,与过去跟李世石对战时不同,当初是分布式版本。 这一次AlphaGo拥有更强大的算法,运算起来更简单也更好。 单机版的速度更快,运算结果也更好,采用了TPU,并架设在Google Cloud之上。 而根据DeepMindCEO哈萨比斯的补充,这一次的AlphaGo计算能力少于过去(对战李世石的)1/10。

  换句话说,就是“AlphaGo已经是自己的导师”,甚至于它已经不满足于只是单纯取得胜利,而是控制胜利的概率以及输赢的差距。这个说法已经得到了DeepMind工程师的现场验证:“我们的确在研究如何通过多线路决策来扩大胜率,甚至是去控制胜率,这是我们的一个探索方向。”

  根据2016年3月份,当初替AlphaGo落棋的黄世杰博士表示,与李世石对战的AlphaGo是分布式版本,与当时单机版本AlphaGo对战的话,胜率大约是70%。

  哈萨比斯表示,我们在科学杂志《自然》发表了论文,这周之后我们会公布更多细节和计划,众所周知目前也有很多强大人工智能软件,我们也会在今后公开AlphaGo更多技术细节,使其他实验室或团队能够建造自己的AlphaGo。

  关于谷歌第二代TPU

  谷歌前不久刚刚推出第二代TPU(相关阅读),对于标榜可发挥高达180TFLOPS的第二代TPU (Tensor Processing Unit),Google说明此项处理器依然是针对开放学习框架TensorFlow加速为主,因此无法像NVIDIA提出Tesla V100等GPU加速模式可额外支持Caffe、Cognitive Toolkit等学习框架。

  相比第一代TPU仅能针对逻辑推演作加速,Google此次宣布推出的第二代TPU不但大幅提升运算效能,更增加对应深度学习应用加速设计,配合越来越多人使用的TensorFlow学习框架,将使TPU应用领域变得更加多元,甚至直接挑战NVIDIA以GPU加速的深度学习应用模式。

  不过,在Google I/O 2017期间进一步向Google询问,确认第二代TPU设计依然是以针对开放学习框架TensorFlow加速为主,本身并不像NVIDIA Tesla V100等藉由GPU加速模式可额外支持Caffe、Cognitive Toolkit等学习框架,因此在实际布署应用弹性可能相对受限。 只是从TPU大幅去除非必要组件,仅针对深度学习、逻辑推演加速功能优化,预期仍将使NVIDIA面临不少竞争压力。

(备注:文章来源于网络,信息仅供参考,不代表本网站观点,如有侵权请联系删除!)

在线留言询价

相关阅读
人机大战第二季第一局:柯洁惜败,AlphaGo仅胜4/1子
  去年,AlphaGo以4比1完胜李世石,人工智能展示出和人类顶级智者不是同一个维度的学习和计算能力。在经过一年的沉寂,AlphaGo使用“Master”代号大师的ID横扫全球围棋冠军,创造不可思议的60场连胜纪录,震惊中韩围坛,让棋圣聂卫平拜服。作为近年来中国围棋界诞生的天才巨子——柯洁并不认为AlphaGo不可战胜,在半年前,正式向AlphaGo发起挑战。在5月23日,人机大战第二季第一局在浙江桐乡打响,经过猜先柯洁执黑先行。  现在,第一局比赛结束,最终成绩:围棋人工智能AlphaGo执白,仅以1/4子战胜目前等级分排名世界第一的中国棋手柯洁,暂时1比0领先。  人机大战前夜:发生的两个小插曲  在柯洁与AlphaGo人机大战开赛前夜,发生了两个小插曲。一个是明知不可为而为之,一个是明知不可为而不为。  5月22日,柯洁更新长微博,称这是“无论输赢,这都将是我与人工智能最后的三盘对局”,“不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战”。  决战前夕,感慨万千。  在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:  无论输赢,这都将是我与人工智能最后的三盘对局  很多人可能会问为什么?  其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了。我相信未来是属于人工智能的。  可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言。它的热情——也只不过是运转速度过快导致CPU发热罢了。  我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这最后一次。  拼尽全力后,无论结果。管他口中是是非非,来一首《沧海一声笑》。岂不美哉、快意?我淡然笑到。  不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。  此前,AlphaGo世纪大战李世石引发中国科技界极大关注,搜狗CEO周小川也因直播报道点评5场系列赛走红网络。这一次,备受全球瞩目的人机大战第二季比赛,作为主办方,本可以激发国内人工智能产业热情,却无奈被泼了一盆冷水。  有互联网业者爆料称,柯洁迎战alphago,三番棋决胜,这是围棋界翘首以待的一件大事,也是媒体界非常关注的一件事,但就在各大主流媒体做好全部准备,推出全明星阵容来直播报道的时候,某有关部门却紧急喊停,几大直播平台和主流媒体均被要求取消直播,后经过几轮磋商,相关部门终于还是达成妥协:报道只允许从围棋角度谈及,不允许展开讨论信息技术层面,不允许信息技术专家参与。  所以,在今年的世纪决战上,屏幕前只有围棋一方的国家级选手们的热烈讨论,而另一方的人工智能技术资深专家的观点被埋。  人机大战第一局:柯洁仅以1/4子小负  本局柯洁开局就采用了“以其人之道还治其人之身”的策略,连走了两个三-三。开局第3手占了个三-三,第7手又点了个三-三。  可是本局白6已经在左边守角,黑7马上点三-三,很容易让白方形成互相呼应的外势。白22打吃,如果黑3不是在三-三而是在星位,则黑方征子有利,白22不能打吃。  白26打入后,世界冠军罗洗河认为黑27拆二过分,会遭到白棋的反击。果然,AlphaGo的白30反击,但白32有避战嫌疑,罗洗河认为在35位扳头更为严厉。黑39粘出乎  罗洗河意料,他认为二路小尖是正常下法,实战柯洁就是想挑起战斗,但是至黑47角上被吃,多数棋手认为白棋得利。  黑55顽强打入,柯洁意识到形势不利,早早放出非常手段。至黑65虽然活了角,但白方外势雄厚,白68夹击后黑方苦战。黑69再次下出非常着法,柯洁拼劲儿十足。黑83断吃一子,黑棋大龙得以治孤,但是全局来看,依然白方形势乐观。  白84在高位打入很特别,AlphaGo轻松破掉了柯洁的右上角。黑97是天马行空的一着,但罗洗河认为还是平凡的拆边更好。白98打入,黑99进攻,这也许是柯洁下97时想要的结果,但白棋治孤很轻松,黑方的攻击没什么实效,至150手,将在相谈棋出场的某位世界冠军认为,再过半小时柯洁可能就要认输了。  官子阶段,AlphaGo一如既往拣厚实着法下,虽然不一定是目数最多的,却是最稳妥的,电脑在这方面的胜率判断比人类强太多。柯洁在已知败局已定的情况下,坚持  收完了官子,可能想尽可能多的了解AlphaGo的特点。  至289手终局,柯洁以1/4子小负。  负责解说罗洗河认为黑97是明显的败着,如果改为平凡的拆边还有希望。纵观全局,柯洁着法强硬,虽然几处都达到了战略目的,但全局依然不乐观;AlphaGo全局着法自然,虽然没下出什么特别巧妙的棋,但大局始终领先。  中国围棋队总教则对柯洁很有信心,“我认为这个比赛也不是没有看头,虽然非常困难,但是柯洁争取一胜还是有机会的。”  对于这件事,创新工场李开复评价道,此次对决人类胜率几乎为零。  战罢:AlphaGo和柯洁对弈是否有意义?  这个问题的答案是肯定的,但并不是外界理解的“这对Google来说是一种宣传行为”。  石博盟解释说,AlphaGo在围棋方面已经做得很好了,但今天的结果是DeepMind的人工智能科学家和世界各国的围棋顶尖选手共同探索的结果。在这个过程中,其实并不是人类在与人工智能对战,而是科学家和围棋选手在共同探索。  科学家探索的是人工智能,而围棋选手探索的是围棋艺术。AlphaGo的每一次升级,都意味着DeepMind的人工智能科学家对“如何在有限信息下做出更优选择”这一问题有了更深刻的认识,而这一问题正是让人工智能理解人类、产生思维的关键。  在获取棋局信息后,AlphaGo 会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。20170523-AI-6  对棋手而言,柯洁也谈到,与人工智能的多次对弈是十分有收获的。在AlphaGo胜过李世石后,中国围棋队的成员多次复盘了所有比赛,从中发现了很多新的思路。  在以往的围棋比赛过程中,总有一些“套路”是不会被打破的,这些套路曾被奉为人类经验知识的圣殿,是不可更改的。但AlphaGo正是通过突破这些规矩,达到了新的高峰,这对人类本身来说也是一种启发。  对了,这次比赛之所以选在浙江的乌镇,是因为浙江自古围棋氛围就很浓厚。浙江的烂柯山,就是传说中人类围观仙人下棋,回家后却发现时间已过百年的地方。所以从某种程度上说,你看的其实并不是围棋比赛,而是一次第三类接触。
2017-05-24 00:00 阅读量:1857
  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
TL431ACLPR Texas Instruments
CDZVT2R20B ROHM Semiconductor
RB751G-40T2R ROHM Semiconductor
BD71847AMWV-E2 ROHM Semiconductor
MC33074DR2G onsemi
型号 品牌 抢购
IPZ40N04S5L4R8ATMA1 Infineon Technologies
STM32F429IGT6 STMicroelectronics
BU33JA2MNVX-CTL ROHM Semiconductor
BP3621 ROHM Semiconductor
ESR03EZPJ151 ROHM Semiconductor
TPS63050YFFR Texas Instruments
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
相关百科
关于我们
AMEYA360微信服务号 AMEYA360微信服务号
AMEYA360商城(www.ameya360.com)上线于2011年,现 有超过3500家优质供应商,收录600万种产品型号数据,100 多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+ 连接器等多个领域,平台主营业务涵盖电子元器件现货销售、 BOM配单及提供产品配套资料等,为广大客户提供一站式购 销服务。