【IT168 专稿】8月31日,由工业和信息化部软件与集成电路促进中心(CSIP)联合相关单位共同主办的“基于安全可控硬件产品云计算解决方案推介会”在北京国家会议中心成功举办。本次大会旨在推动促进基于安全可控关键软硬件集成应用的优秀云计算示范项目推广,评选并授牌了11个基于安全可控软硬件产品的云计算解决方案。
作为移动互联网时代最重要的人机交互技术之一,语音云在本次评选中吸引了众人的眼球,由安徽科大讯飞信息科技股份有限公司主导的讯飞语音云解决方案成为获奖项目之一。IT168记者采访到了安徽科大讯飞信息科技股份有限公司副总裁——江涛,就语音云的相关内容进行交流。
智能语音技术
智能语音技术,通俗的说,就是使信息时代的各种信息机器像人一样“能听会说”的技术,包括语音合成、语音识别和语音评测等。
语音合成技术可以将任意的文字信息转化为自然流畅的语音,相当于给机器装上了人工嘴巴;
语音识别技术可以将语音中内容、说话人、语种等信息识别出来,相当于给机器装上了人工耳朵;
语音评测技术可以进行发音标准评价和错误反馈指导,相当于把机器变成语音评测老师;
语音云——移动互联网时代最重要的人机交互技术之一
我们已经进入了移动互联网时代,以手机为代表的移动互联网终端普遍存在输入不方便的问题,语音输入在便捷性方面的优势极大的凸显出来;另外,无线带宽的提升和云计算技术体系的成熟,手机上的复杂运算可以交给后台,这样可以通过迭代优化的模式不断训练语言模型、声学模型,语音识别的准确率能够持续提升。移动互联网时代的到来,也是语音技术应用春天的到来。也正是看到了机会,科大讯飞去年四季度正式发布了为移动互联网终端提供能听会说能力的“讯飞语音云”。
配合语音云的发布,讯飞还发布了语音云的示范应用——语音输入法, 实际测试中,普通人电脑标准键盘上输入速度是每分钟50~80个字,而在iPhone等触屏类型的智能手机上只能达到15~20个字,而语音输入每分钟可以达到200字以上。未来随着语音识别准确率的持续提升,语音交互和语音输入必将成为手机等移动终端最重要的人机交互界面之一。
语音云的挑战——用户习惯
在谈到语音云发展中的挑战时,江涛指出,语音技术在移动互联网时代的火热程度引起了许多巨头的重视,苹果、微软、谷歌都投入并陆续推出自己的语音交互能力平台,基于智能语音交互的应用日益丰富,但是目前国内用户使用语音进行交互的习惯还不是很成熟,市场的教育需要一个较长的过程,需要产业链合作伙伴在各个环节的互相配合。这就需要政府搭建这样的产业平台,让产业链上相关的合作伙伴起来,包括手机等终端厂商、技术厂商、应用厂商等,共同培育语音交互的市场。