[上海热线]上海交大智能语音技术新突破 人机交流将无障碍

21.05.2015  14:51

  2015年,风靡全球的科幻动画片《超能陆战队》,萌萌的“大白”机器人的沟通毫无障碍,既诙谐又温情。而最近,两部接连上映的好莱坞科幻大片《超能查派》与《复仇者联盟2》,核心角色都是高科技的人工智能生命体…… 

  随着科技发展,曾是科幻小说与影视作品中常见元素的人工智能,也逐渐走入我们的真实生活。虽然对着手机用语音进行文字的输入已经成为现实,但这只是特定条件下的“语音识别”。而人类的交互则是自由而任性的,不管时间地点,语言丰富多元,语义复杂多变。单纯的“一根筋”式的语音识别,根本不能满足自由的人机口语沟通的需求。 

  5月18至20日,在上海交通大学举办的中德“有反馈的计算机辅助方法在二语习得及语音训练中的应用”双边研讨会上,国内外高校、研究机构及业界的专家学者,共同探讨了智能语音技术的最新进展及其在计算机辅助口语训练方面的潜在应用。 

  记者了解到,上海交通大学-思必驰智能语音技术已经联合实验室进行了一系列移动互联网大数据时代的产学研联合项目,研发的认知型人机对话系统技术,将机械式的语音识别推广到智能人机对话,使得人们在车载、家居等各种真实的复杂场景中,可以顺畅自由的使用语音,随时随地与能够理解自然语言的智能交互机器人进行对话交流,完成任务。 

  一直以来,让机器能够具有人性化的语音交互能力都是人工智能研究中的重难点。上海交大电子信息与电气工程学院计算机系“东方学者”特聘教授俞凯认为,认知型的智能语音技术是更高层面的人工智能,与传统语音识别和合成相比,它融入了自适应、理解纠错、智能反馈的认知技术。这会使得机器可以适应更多的环境和口音,具有进化调整的能力,从“能听会说”变成“会听能做”:即听得懂说的,懂得听什么,听不清楚了能问,搞错了能纠正,最终能成功完成用户的任务。 

  俞凯谈到,虽然近年蓬勃发展的深度学习技术极大地促进了语音识别的识别率提升,但仍无法达不到百分之百的准确。尤其是在复杂环境和自由使用的时候,更显得差强人意。而上海交大智能语音实验室研发的语音识别自适应技术,采用了软硬件结合的抗噪技术、结构化深度学习技术、环境和说话人的自动检测及模型自适应调整技术,可以随着说话人口音和噪声环境的变化,自动选择最合适的模型进行识别,显著提升准确率。 

  此外,自适应技术使得机器有了自动学习能力,随着在特定环境和说话人数据的积累,说得越多,学得越多,识别越精准。 

  有了新技术,也许在未来,练好口语也不会变的那么难。据介绍,语音技术可以在课堂教学、口语考试及家庭学习中一显身手,为第二语言的口语学习提供技术支持。俞凯表示,语音评测技术的运用能极大缓解教学资源的短缺,让所有的孩子都能有机会学习到纯正的外语。他相信,在不久的未来,智能语音评测技术有望成为语言类教学产品的标配。 

  据悉,上海交通大学-思必驰智能语音实验室成立于2012年,由思必驰信息科技有限公司与上海交大联合成立,实验室负责人是毕业于剑桥大学的语音博士俞凯。俞凯带领团队长期坚持不懈地研究人工智能在人机交互中的应用,涉及语音识别、合成、理解、对话、声纹、口语评估等智能语音交互技术的各个领域。目前,实验室在智能语音技术方面,取得了一系列在国内外领先的技术成果。 

  目前,在真实工程系统上,上海交大与思必驰信息技术有限公司合作,已经率先发布了人性化的智能语音交互技术平台:对话工场。在此平台下,以产学研一体化的模式,正在快速完成人性化的智能语音交互技术从学术研究到商业运作的转变,进入民用市场,打造以用户为中心的“语音机器人”,引领人机口语交互的“人工智能”潮流。 

来源:上海热线 2015.05.21 

原文: 上海交大智能语音技术新突破 人机交流将无障碍