AlphaGo团队下一个“野心”:智能识别肾病患者

10.03.2016  11:34

  昨日,李世石(右一)与“阿尔法围棋”创始人德米什·哈萨比斯(右二)在首场比赛结束后出席新闻发布会。 /新华社

  “人机大战”首局李世石认输,“它下了非人类的一手

  AlphaGo团队的下一个“野心”:智能识别肾病患者

  这是一场会被载入全人类史册的围棋比赛。

  2016年3月9日下午3点半,由谷歌公司开发的围棋程序AlphaGo (“阿尔法狗”),打败围棋世界冠军李世石,在五番棋比赛中拔得头筹。"阿尔法围棋’,比想象中厉害。”韩国棋手李世石在首局告负后说道。

   顶尖棋手预测几乎一边倒

  一个多月前,AlphaGo在研发阶段极端保密的情况下横空出世,宣布其在2015年10月以5:0比分横扫人类围棋职业二段选手樊麾。

  这个消息震惊人类社会。此前,即便是最乐观的估计,也认为电脑围棋程序要战胜人类职业选手,至少还需要十年左右的时间。

  “都说AlphaGO走棋像人,但在大局观和棋子的价值判断上,它的能力已经超过人类最顶尖的选手。”李世石投子认输后不久,傅奇轩对晨报记者评论到。

  傅奇轩是上海一个围棋爱好者社区App的创始人。昨天下午,傅奇轩组织了多位上海知名的年轻职业棋手来到咖啡馆,一起观摩这场人机大战。与前辈相比,这些年轻人对计算机算法的威力更显敬畏。赛前,无论是傅奇轩还是当天在咖啡馆评棋的职业三段葛凡帆,在面对记者抛出的“谁会赢”这个问题时,回答都显得保守:胜负五五开。

  相比之下,中国的顶尖选手,无论是现役的还是传奇国手,赛前几乎都信誓旦旦地认为:李世石的胜率是百分之百。比赛结果让国手们大跌眼镜,同样来自韩国的围棋好手金成龙,面对采访的镜头没了脾气,一再扶额长叹。

  然而,围棋只是负责研发Al-phaGo的DeepMind团队一个小小的技术展示。在他们的官网上,写满的是野心:DeepMind下一步要做的,是通过计算机帮助医生判断如何更科学地治疗人类疾病。

  DeepMind似乎要将人类提前带进一个未知的未来世界。

  “人工智能和人类对弈,基本没什么机会。AlphaGo对抗李世石的结果是,100%是李世石赢得围棋胜利。”这是聂卫平赛前的判断,这句话几乎能代表所有中国职业围棋选手。

  只有中国围棋队的教练俞斌,捎来了“晴空万里下,天边的一朵乌云”。赛前,他曾面色忧虑地对别人说,从他“搞来的谷歌内部消息表示,李世石胜出的可能性为零”。相较之下,DeepMind创始人兼谷歌副总裁戴密斯哈萨比斯,则稍显官样地说:对3月9日举行的人机大战充满自信。

   不知道白棋怎么就赢了

  然而,人机大战的第一回合,其过程和结果并非像赛前两边预测得那么极端——双方在较量3个半小时后,李世石186手认输,AlphaGo 获胜。这个结果让“人族”一片惊呼,多位参与解说或观战的围棋国手都表示震惊。根据赛程,双方还分别将在3月10日、12日、13日、15日的北京时间12点进行剩余4场比赛。

  按照规则,比赛用时每方2小时,1分钟读秒3次。比赛采用中国规则,黑贴3又3/4子(黑贴7目半)。采用中国规则是因AlphaGO以中国规则为基础开发。

  值得一提的是盘中两个细节。

  首先是李世石下的第七手,这被评棋者认为是“新手”,此前未曾如此下过。他们猜测,李世石的这手“怪招”目的在于扰乱AlphaGo的思维,把局面搞复杂,让对手“看不懂”。然而事实证明,AlphaGo根本不吃这一套,依然稳健地按照自己的判断出招。其次,李世石在棋盘左下角相当舒服地下成了“双飞燕”,而这被评棋者认为是不可想象的。

  “如果是人类顶级选手,恐怕绝不会允许李世石如此轻松地下成‘双飞燕’。”职业三段葛凡帆对晨报记者称,“可事后来看,AlphaGo 放弃局部抵抗,从而赢得大局面上的优势,反而是正确的。

  以上两个细节,被傅奇轩总结为AlphaGo具有超人的大局观和价值判断能力,它不纠结于局部,有些被人类认为理所应当争取的地方,它会放弃,而是选择更实惠、稳健的下法。

  事实证明,这种下法不但让李世石不适应,更让评棋者一度“没了方向”。中盘阶段,在中国各大视频直播平台参与评棋的好手,都一致认为李世石盘面占优,然而风向突然变了,当他们开始点目(精算局面的胜负)时才发现,李世石的优势已经化为乌有。

  “可以说,AlphaGo是在不知不觉间战胜李世石的,有几手棋虽然当时看显得很无理,但复盘后一看,AlphaGo选择是在目数上最实惠的下法,它不会在人类认为理所应当进行对抗的地方与李世石对抗,我们被这种下法深深震撼了。”葛凡帆如是评论。

  赛后李世石说:“我对‘阿尔法围棋’的表现感到吃惊。事实上我一直认为不会输。但‘阿尔法围棋’下得那么完美,真没想到。我认为因为序盘布局的失败,黑棋一直处境艰难。还有,我今天有两个方面很吃惊:第一个是序盘布局能力比想象厉害;第二个是它会下胜负手。它算法能力比较强,实战中它下了人类想不到的一手,让我大吃一惊。

  也有旁观棋手认为,局面占优时,李世石的心态明显发生了变化,右下角黑棋下得太保守,白棋左右逢源,角部做活,大龙也及时补棋,黑棋一无所得,此前的优势消失殆尽。不过几位现场观战的棋手表示,电脑这种逆境下的回击手法着实让人吃惊,几乎招招都是“最佳应对”。

  对于第一盘棋的结果和过程,全程观看的中国棋手柯洁表示,心情有些复杂,他原本认为李世石可以5比0取胜,但看完今天的比赛,觉得胜负已难料。因为电脑在后半段虽然有小失误,但计算稳定,李世石后半段失误太多。“李世石前半盘积攒的优势,不足以在后面挥霍。”柯洁表示,自己现在更倾向于AlphaGo5比0击败李世石。

  上海围棋队主教练刘世振则表示,从这盘棋看,电脑与去年10月份相比有了巨大进步,至于后面的比赛胜负,真的很难预料。

   解决智能”挑战“图灵

  DeepMind官网首页上,两个斗大的单词占据页面中心位置:解决智能(Solve  Intelligence)。

  稍微懂得计算机理论的人,也许都会被这两个单词组成的短语深深迷住——因为AlphaGo的横空出世,使得由DeepMind研发的计算机算法,几乎通过了图灵测试。

  图灵测试,是整整66年前由计算机科学的先驱阿兰·图灵所提出的理论。图灵说,让一个人类坐在被幕布拦住的电脑前,而由电脑回答由人类提出的问题,如果电脑的答案让人类认为是由另一个人类回答的,那这台电脑就通过了图灵测试,从而可以被认为是具有智能的。

  66年来,计算机领域的专家多有试图让自己研发的计算机算法通过图灵测试的野心。而AlphaGo 在去年对弈樊麾和昨日对弈李世石时所展现的能力,已让人看不出这是电脑在下棋。

  “几乎就是一个真人在下棋,下得还很‘正’,有点复古几十年前流行的围棋棋局的味道。”葛凡帆对晨报评论说,“但AlphaGo没有情绪波动,大局的形势判断又很准,这又是人类顶尖棋手所难以达到的。

  “AlphaGo有点像巅峰时期的‘石佛’李昌镐,下棋时心如止水,情绪波动极少;又有点像邱鑫,布局实在、稳当,但他实战时往往畏惧复杂局面,AlphaGo恰恰不怕李世石把盘面‘搅浑’,复杂的局面也能展现强大的控制力。”傅奇轩说。

  DeepMind为AlphaGo设计的计算机算法,被称为“具备深度神经网络的先进搜索树算法”,其特点是,不像此前的围棋程序试图通过穷举法计算下完每一步之后局面的变化(而依照现在的计算机能力,是无法完美实现的)来作出取舍,而是从每一步落子后,从理论上存在的平均200种选择可能,缩小到三四种得分最高的选择,接着判断局面是否处于优势,优势多大。也就是说,这个算法不会“死算”,而是会智能地选择需要计算的局面,这极大地减少了计算量,提高了效率。

  更可怕的是,这个算法还有自我学习能力。

  DeepMind官网的一篇文章介绍说,AlphaGo学习了3000万步人类实战的围棋下法,学习完毕后,甚至可以“左右互博”,自己跟自己下棋,在下了几千盘棋局后,AlphaGo能从这些棋局中学习新的围棋策略,这个过程被Deep-Mind称为“强化学习”。

  另外,AlphaGo与樊麾和李世石的实战棋谱,也是它自己学习的绝佳“教材”,在与樊麾对弈后至昨日,AlphaGo在5个多月中,棋力又能明显增长。

  “这或许也是中国顶尖棋手不太理解的地方,他们分析了Alpha-Go和樊麾对战的棋谱,认为电脑有着各种不足,但没考虑到它还能自己学习,在与樊麾和李世石对战期间,AlphaGo的棋力增长不少,进步之快让人震惊。”傅奇轩说

   围棋“仅仅是开始

  来自中国著名选手古力的感慨,更值得仔细玩味。

  他说:“谷歌公司的研发团队并没有围棋高手,我纳闷他们怎么做出这么厉害的围棋电脑……

  “看到这句话,只能说围棋好手真的不懂计算机科学。”在傅奇轩组织观赛的咖啡馆内,一位供职于某IT企业、要求匿名的围棋爱好者表示:“DeepMind的计算机算法实质上是在模拟人类的思维方式,而不仅仅在于研究如何下棋。

  这位爱好者乐观地认为,经过此役,计算机全面战胜人类围棋选手的时代,已近在眼前。而这背后,是人类文明可能会进入新的时代。

  这句看似只有在科幻片里才会出现的台词,也许正是AlphaGo战胜李世石所释放的终极信息:昭示了人类即将迈入依靠计算机,去解决思考而非纯计算问题的未来世界。

  证据便是DeepMind官网所披露的一个野心勃勃的新项目:DeepMind Health,它借助跟Al-phaGo类似的计算机算法,试图帮助医生识别最具风险的肾病患者。

  DeepMind Health 目前推出了一个名为 Streams 的手机App,它能帮助医生在几秒钟内,就能查看存在急性肾脏损伤风险的病人的验血结果,并优化对病人的治疗方案。

  “这种直接发出提示,并对病人优先级进行排序的系统前所未有。”参与测试这个项目的英国皇家自由医院医生感慨说。

  这仅仅是开始。MindDeep宣称,他们开发人工智能的目的,就是为了解决人类社会面临的最棘手的问题,使得世界变得更好。

  围棋人机大战首盘结果让很多人大吃一惊,也让很多赛前一直看好李世石的专业棋手措施不及。不过,面对这个结果,一直从事围棋人工智能研究的专家和学者却显得更为平静,他们显然已经做好了迎接这一天的准备,尽管这一天的到来快得超出了大多数人的想象。

  一年多之前,来自北京邮电大学的人工智能专家刘知青教授和围棋学者胡廷楣就开始着手联合撰写一本关于围棋人工智能的书,而当谷歌人工智能AlphaGo横空出世般出现在职业棋手面前时,这本书也进入了赴印阶段——对于人工智能击败人类那一天,书里实际上已经有了预言。