[新民网]沪科学家打造智能语音机器人 "大白"可与人无障碍沟通[图]
图说:俞凯演示和“机器人”对话
随着科幻动画片《超能陆战队》的热映,萌萌的机器人“大白”成了不少人的最爱。尽管是机器人,但“大白”与人的沟通却毫无障碍,既诙谐又温情。那么,这样的“大白”究竟会不会存在于现实中呢?
“‘人工智能’离不开语音交互,这种交互不是传统语音识别,而是具有适应和思考能力的人机口语对话系统。”今天(20日),上海交大电子信息与电气工程学院计算机系“东方学者”特聘教授俞凯向新民晚报新民网记者透露,其团队研发的“语音机器人”就是一个可以随时随地理解自然语言、会听会问会纠错的智能人机对话系统;而不久的将来,这个机器人有望率先在车载导航、智能家居领域里大展拳脚。
变“一根筋”识别为智慧型交互
事实上,对于很多人来说,对着手机用语音进行文字的输入已经成为现实。然而,这样的语音输入并不能对“大白”这样的人工智能带来帮助。
“语音交互承担着人与设备之间的沟通桥梁作用。现有的语音文字输入,只是特定条件下的‘语音 识别’,是解决特定环境下语音到文字的转换。”俞凯告诉新民晚报新民网记者,与此相对,人类的交互是自由而任性的,不管时间地点、语言丰富多元,语意也是复杂多变的,“所以,‘一根筋’式的语音识别,根本不能满足自由的人机口语沟通需求。”
也因此,俞凯所在的上海交通大学-思必驰智能语音联合实验室将研究的重点放在了模拟人脑全套认知功能、解决完整的口语人机交互问题上,并研发出了认知型人机对话系统技术。
“我们的认知型智能语音技术,融入了自适应、理解纠错、智能反馈等,机器因此可以适应更多的环境和口音,还具有进化调整的能力。”俞凯说,这种能力使得机器人从单纯的“能听会说”变成“会听能做”,“即听得懂说的、懂得听什么,听不清楚了能问,搞错了能纠正,最终能成功完成用户的任务。”
此外,这种智能人机对话系统还具有自适应技术,“这使得机器有了自动学习的能力,随着在特定环境和说话人数据的积累,说得越多,学得越多,识别越精确。”
车载“大白”或率先成出行小助手
拿起一个安装了智能人机对话系统的手机,俞凯当场给新民晚报新民网记者演示了这个“语音机器人”的神奇之处:
打开手机中的语音输入板,俞凯开始用较快的语速随意说话,语句中既包括日常交流的用词,也不乏“床前明月光,疑似地上霜”这样的古诗词;而就在俞凯说话的同一时刻,“接收”到他语句的“语 音机器人”开始快速的在输入板上显示出对应的文字,时差不超过2秒,准确率也颇高,“和传统的语音文字输入不同,用这个系统输入文字,不需要刻意去放慢语速、加重声音,它会随着说话人口音和噪 声环境的变化,自动选择最合适的模型进行识别。”
随后,俞凯又演示了使用“语音机器人”拨打电话的功能。“之前微博上有个用车载系统拨打电话,却一直出错的‘纠正哥’很火。由于操着方言说出一长串电话号码,他要拨打的电话总是无法被识别。”而当“语音机器人”遇到这个问题是,解决方案却变得十分简单:一旦发现机器人识别的电话号码出错了,你就可以像和人说话一样随时打断它,然后纠正其错误之处,直到最终拨打出正确号码为止。
“在不久的将来,这个‘语音机器人’就可能率先出现在车载系统、智能家居领域。”如果车上安装了这样的车载“大白”,俞凯给新民晚报新民网记者勾勒了这样的“聊天”画面:
“上车后你可以语音‘唤醒’机器人,然后告诉它,‘我要去徐汇区’。”俞凯说,此时,智能的车载“大白”就会问你,“去徐汇区哪里?”你可以继续将详细地址告诉它;而在车辆行进过程中,“大白”还会不断更新行驶导航信息,并通过语音征求你的意见,“比如去哪个停车场停车、从建筑物哪个门进入”,直到将你顺利送达目的地。
图说:语音机器人自动识别出的文字
图说:机器人人机互动界面。
来源:新民网2015.05.20
原文: 沪科学家打造智能语音机器人 "大白"可与人无障碍沟通