[文汇报]从“能听会说”到“会听能做”

28.05.2015  01:29

人机交互如何从“能听会说”变成“会听能做”?上海交通大学-思必驰智能语音技术联合实验室实施了一系列移动互联网大数据时代的产学研联合项目,研发的认知型人机对话系统技术,将机械式的语音识别推广到智能人机对话,使人们在车载、家居等各种真实的复杂场景中,可以顺畅自由地使用语音,随时随地与能够理解自然语言的智能交互机器人进行对话交流,完成任务。  

实验室负责人俞凯教授介绍说,有别于传统的语音识别,这种认识型人机对话系统是一个人性化的“语音机器人”,它融入了自适应、理解纠错、智能反馈的认知技术。这使机器可以适应更多的环境和口音,具有进化调整的能力。例如,驾驶汽车时打开车窗或者播放音乐、在家里隔着茶几对电视发布语音指令、说话带着方言口音等,都会严重影响通用语音识别的正确率。俞凯采用软硬件结合的抗噪技术、结构化深度学习技术、环境和说话人的自动检测及模型自适应调整技术,可以随着说话人口音和噪声环境的变化,自动选择最合适的模型进行识别,显著提升准确率。此外,自适应技术使机器有了自动学习能力,随着在特定环境和说话人数据的积累,说得越多,学得越多,识别越精准。  

来源:文汇报 2015.05.27第10版 科教卫    

原文: 从“能听会说”到“会听能做