计算机能够“识别”坏人的脸? 离应用还有很远

30.11.2016  14:40

  

  实验结果表明,普通人都长得更为相似

  

   [晨报对话]

  是否有商业前景,未在考虑中

  问:该研究采用的技术是“机器学习”,是否就是“人工智能”?

  武筱林:“机器学习”可以归于“人工智能”的范畴,但不能等同于“人工智能”。“机器学习”可以通俗地理解为一种计算机算法程序,该程序对特殊任务具有学习能力,可以区别出事物间的特征差异。

  问:这项研究有挑战性吗?

  武筱林:这项研究的独创性在于,使用有监督的机器学习,基于人的面部图像特征,来推断犯罪性的概率。其实,一年前我们就获得了初步的结论。但是当时我们没有急于公开我们的研究成果,因为我们对研究的结果,还不能十分确信。因此,后续我们又进行了反复的验证试验,都证明了最初结论的可靠性。所以,我们才在这个月公开了我们的研究成果。

  问:这项研究所采集的人脸图像的样本量为1856张,这些样本量可以支撑结论的可靠性吗?

  武筱林:这些脸部图像都是供公开途径获取的。受限于一定的条件,我们只采集了1856个人脸图像样本。当然,样本量越大,越有利于结论的可靠性。不过,我们认为,基于目前的样本量,所得到的结论也是可靠的。

  问:这项研究有商业前景吗?

  武筱林:我们的这项研究,是出于科学家求真的使命而从事的一项纯粹的学术研究,是否有商业前景,未在我们的考虑之中。

  问:能否被应用到执法部门?

  武筱林:该项技术能否应用于执法部门,我们不做预测,因为这将涉及到技术以外的诸如社会学、法律、伦理道德等诸多复杂的因素。

  某月某日,某区域发生一起命案,警方迅速采取行动,最终锁定三名犯罪嫌疑人A、B、C,三人面部照片也被找到。随后照片被输入电脑,经电脑分析计算,A就是凶手,因为他长着一张“罪犯的脸”。未来,这样的情况可能不会是梦想。上海交大两名学者的论文也证明了这种可能的存在。

  近日,上海交大电子信息与电气工程学院教授武筱林和他的博士生张熙做了“基于面部图像的犯罪性概率自动推断(Auto-mated Inference on Crimi-nality using Face Images)”的研究,证明罪犯的面部确实异于普通人。

  仅凭一个人的长相真的能够“认出罪犯”吗?这样的断案靠谱吗?上海交大两学者的研究成果一经公布,就被浓缩简化成“计算机能够看脸定罪”,在全世界都引起一片质疑和讨论。

   技术初衷是为了证伪

  武筱林教授是计算机图像处理方面的顶级专家,2003年至今他一直是加拿大麦克马斯特大学电子与计算机工程系教授、加拿大NSERC-DALSA数字影院项目首席科学家。武筱林还是国际电气与电子工程师协会院士(IEEE Fellow),国际图像处理界顶级学术刊物IEEE Trans-action on Image Processing 副主编。

  就是这样一位图像处理方面的权威,在最开始的时候也是认为:仅靠人的面部图像就能断定罪犯是不靠谱的。那是2011年的事情,当时康奈尔大学的心理学研究团队做过一项研究,将普通人的面部照片和犯罪者的面部照片混在一起,让人观看。实验的结论是参加实验者可以辨识到普通人与犯罪者的面部图像差异特征,并据此来推断和区分所给定的面部图像是普通人还是犯罪者。

  “这可能吗?”对康奈尔大学的这项研究结果,武筱林不敢确信。“于是我们想通过我们的方式和手段进行证伪。”武筱林试图对康奈尔大学的研究结论进行证伪的手段和方法,就是他本人擅长的计算机图像处理技术。

   证明罪犯面部异于普通人

  两年前,武筱林带着他的博士生张熙开始了这项研究。

  他们首先建立了一个人脸图像数据库,包含有1856张中国成年男子的面部图片,其中近一半是罪犯。武筱林介绍,这些罪犯的图片都是从公安部门网站上找到的,其中有一部分是通缉逃犯。

  这些被挑选的图片有特定的标准:中国男性,18到55岁之间,没有胡须,伤疤以及别的标记。

  武筱林和张熙根据这些资料建立了数据集,再把它分为两个子数据集:犯罪者、非犯罪者。其中非犯罪者包含1126张普通人的照片,犯罪者包含730张犯罪者(包括330张被通缉逃犯)的照片。

  接下来,他们建立了四个不同的分类器(逻辑回归,KNN,SVM,CNN),以民族、性别、年龄和面部表情作为控制要素,让计算机区分犯罪者和非犯罪者。

  实验结果表明,四个不同的机器学习分类器取得了较为一致的结果,罪犯与普通人在面部结构上确实存在一定差异。

  他们还发现,犯罪分子与犯罪分子之间在面部的差异是要大于普通人与普通人之间的。换句话说,普通人都长得更为相似,而犯罪分子各有各的不同。

   网络断章取义让人难接受

  原本是想对康奈尔大学的相关研究进行证伪,结果却被证实了。

  关于这个研究发现的论文随后被写了出来,但目前还没有正式发表。武筱林说:“我们用英文撰写的论文上载到了arXiv.org 网站,外界就是通过这个网站,了解到我们的研究。

  arXiv.org网站是一家在学术界知名的论文预收录网站,研究者为了防止自己的idea在论文正式刊发前被别人“借鉴”,会将预稿上传到arvix作为预收录,上传时间戳可以证明论文原创性。

  武筱林团队的研究成果一经公开,就受到了学界的关注。

  武筱林介绍说,麻省理工大学的MIT Technology Re-view新近介绍了这项学术研究,并对研究结论持肯定态度。哈佛和剑桥的一些研究者,也在近期通过邮件的方式,与武筱林取得联系,进行学术的交流探讨。

  但武筱林略感意外的是,社会上对该项研究成果的关注,超出了学界。“居然连英国的一家大众通俗化报纸也对我们的论文给予了报道,不过他们曲解了论文的本意。”武筱林团队的这项研究论文题目为“基于面部图像的犯罪性概率自动推断(Auto-mated Inference on Crimi-nality using Face Im-ages)”。严谨而规范的表述,对于圈外人而言,不仅读来拗口,理解起来也有些费力。因此,有网站在报道该项研究成果时,取了诸如“计算机可读脸定罪”之类的标题。

  “完整读过我们的论文原文吗?”武筱林对于网络上的有些报道,十分不满,认为是在断章取义,哗众取宠,博眼球。尽管研究结论乍一听有一定的趣味性,但科学研究毕竟是严肃的事情。武筱林介绍说,包括互联网上不负责任的报道,都没有与他们取得联系。

  这种做法,对于一名严谨的专家学者来说,显然是很难接受的。

   该技术离应用还有很远

  单单“计算机看脸定罪”的字面意思,的确足以令很多人产生浮想联翩的技术畅想,比如,未来是不是可以研制出一种基于该技术的仪器设备,作为执法部门的辅助工具?或者在机场、车站、重要会议场所等安检要求较高的区域,利用该技术筛选锁定关键人员,给予重点关注?由此,又延伸出更多的话题,比如该项技术的可靠性,以及是否涉及歧视等。

  但对于“计算机看脸定罪”这样表述,武筱林不认可这是题目论文主旨的准确表述。甚至他也不愿意对该研究成果进行所谓的“技术应用畅想”。武筱林向晨报记者表示,他们所从事的是纯粹的学术研究。

  回到武筱林团队的论文,既然通过有监督的机器学习,发现了犯罪者与普通人的面部结构存在差异,那么这些差异反过来是否可以作为计算机甄别普通人和犯罪者的依据呢?武筱林团队的实验证明,是可以的。“我们使用的分类器,最好的表现是识别准确率达到89%。

  既然这样,为什么对将该项研究解读为“计算机能看脸定罪”,武筱林却不认可呢?

  武筱林解释说,即便单纯从技术角度而言,在实验条件下所得到的结果,与该技术能否付之于实践应用,中间还有相当的距离。比如,该项研究所采用的人脸面部图像,有很多限定条件,比如年龄、性别,以及不能有胡须及疤痕等。再比如,在“训练”计算机学习、赋予它人工智能时,普通人和犯罪者的人脸图像基本上是按照1∶1的比例,“”给分类器的,计算机则是基于这个比例的样本量,获得了相应的学习能力,从而较为准确地对普通人及犯罪者加以辨识。而现实生活中,普通人和犯罪者的比例显然不是这样的。

  中山大学人机互联实验室主任翟振明在接受晨报电话采访时表示,对于人工智能而言,要完成难度高的任务,机器必须要进行“深度学习”,而深度机器学习,有赖于大样本量的数据库。