上海交大计算机系青年教师在ACM信息检索会议上发表满分论文[图]

02.06.2017  20:52

SIGIR 2017将于8月7日—11日在日本东京举行,是信息检索领域的顶级学术会议。上海交通大学电子信息与电气工程学院计算机系特别副研究员张伟楠作为通讯作者提交的论文以三个strong accept的满分录取,高居362篇论文之首。国内领先的人工智能媒体“新智元”在5月31日对该篇论文发表了长篇报道。 

该论文的题目是《IRGAN:大一统信息检索模型的博弈竞争》(IRGAN: A Minimax Game for Unifying Generative and Discriminative Information Retrieval Models)。第一作者是伦敦大学学院(UCL)长期做信息检索(IR)方面基础研究的汪军教授。通讯作者是上海交大计算机系的特别副研究员张伟楠,他主持了全部实验工作。  

这篇论文从提出设想到展开实验,直至团队迭代完成论文撰写,都是中英双方团队通力协作的结果。上海交大电院计算机系APEX数据与知识管理实验室在该研究项目起到了关键作用。  

在现代信息检索领域一直是两大学派之争的局面。一方面,经典思维流派是假设在文档和信息需求(由查询可知)之间存在着一个独立的随机生成过程。另一方面,现代思维流派则充分利用机器学习的优势,将文档和搜索词联合考虑为特征,并从大量训练数据中预测其相关性或排序顺序标签。  

这篇IRGAN的论文首次提出将两方面流派的数据模型通过一种对抗训练的方式统一在一起,使得两方面的模型能够相互提高,最终使得检索到的文档更加精准。文章的实验分别在网络搜索、推荐系统以及问答系统三个应用场景中实现并验证了结果的有效性。  

在和上海交大团队有着密切科研合作的英国伦敦大学学院汪军教授表示,现在做计算机的研究再也不可以单兵作战了,需要一个强大的团队做支撑,工程和数学都要擅长,上海交大团队是十分优秀并且令人佩服的。上海交大致远工科的于澜涛同学(大三)和电院计算机系的龚禹同学(研三)之前都已发表过人工智能顶级的AAAI论文。这些科研经验让他们在快速迭代的实验中做出更敏锐的判断。正是因为他们的勤恳,这次项目中繁重的实验工作才能在4周内全部完成。  

张伟楠表示,与澜涛、龚禹同学朝夕相处,快速迭代实验开发以及论文的撰写。大家工作都十分努力,并且保持思维敏捷。SIGIR的截稿期日在1月25日,两天后就是大年除夕。在拼到最后几天的时候,校园里早已是人去楼空,同学们开始有些急躁,于是他们在交大三食堂边的校园时光咖啡厅喝下午茶,忙里偷闲地把心静下来,并给大家鼓劲。  

在2017年4月的一天,IRGAN论文以三个strong accept的满分录取,高居362篇论文之首。张伟楠表示:“论文以如此好的成绩被大会接收,那一刻我和其他老师们、同学们获得了最大程度的喜悦。我们的新观点被学界接收,我们的付出获得了回报,这是一名研究者最大的乐趣。”  

论文链接 https://arxiv.org/abs/1705.10513

张伟楠,上海交通大学电院计算机系特别副研究员,John Hopcroft Center助理教授。  

相关阅读 :【SIGIR2017满分论文】IRGAN:大一统信息检索模型的博弈竞争