首页>>厂商>>语音识别与合成>>科大讯飞

科大讯飞车载导航语音合成系统探析

2009/09/30

  从全球汽车产业发展状况来看,智能语音技术在车载导航中的应用是一种新的、必然的趋势。传统的车载导航产品,是用眼睛看的方式获取相关信息,对汽车驾驶者而言存在一定的安全隐患。智能语音技术在车载导航中的应用,变看为听,极大提升了汽车驾驶的舒适性与安全性。

  目前,国内车载导航制造厂商就语音技术在车载导航中的应用已经达成了广泛的共识,都在积极寻求智能语音技术提供商。那么,各车载导航制造厂商如何才能选购一款符合消费者使用需求的优质语音合成系统?基于对语音合成技术的开发应用研究以及与车载导航厂商的合作经验,作为国内最大智能语音技术提供商的科大讯飞建议:车载导航厂商选购语音合成系统,可从以下4个方面进行考量。

  地名、路名的准确播报

  在实时的导航过程中,需要播报大量动态的地名和路名,传统的真人录音无法实现对如此海量数据的处理,导航设备的资源存储空间有限,也无法容纳大量的声音文件。随着全国城市建设的提速,每过一段时间,就会有新的导航地图发布、使用。如此的更新速度,也是传统真人录音手段望尘莫及的。而利用语音合成技术可轻松解决这一难题,将海量、动态的信息实时转化为语音播报给用户。

  中国地大物博、文化丰富,存在太多生僻地名、路名,有时普通大众也不知道如何发音。生僻字、多音多义字大量存在,这就要求导航产品所选用的语音系统能够实现地名、路名的准确播报,充分保证语音播报的质量和正确率。不恰当或者错误的路名播报会误导用户行车方向以及浪费旅途时间,会给用户带来巨大的困扰甚至安全问题,直接影响到用户对车载导航产品的使用感受和信任度。

  具备“语随文变”的优质语音合成效果

  语音服务不仅实现了便捷化、人性化的操作,更重要的是保证了驾驶者的安全。如何让驾驶者无需繁杂操作就可以第一时间了解所需信息,清晰、流畅、自然准确的语音合成效果显得至关重要。

  导航过程中,语音合成系统应具备文本的自然播报以及强大的智能处理能力,真正实现语随文变。部分导航文本具有特殊性,播报时需要考虑它们在日常导航里的通用称谓,例如G101——幺零幺国道;S309——三零九省道等等。汉语的词语、成语和一般语境中有不少多音字,这就需要语音导航根据上下文和语境判断这些多音字的读音,同时还考虑到人名、地名等一些特殊情况。

  另外,语音合成系统还必须根据上下文和语境正确判断一些常见标点符号、特殊符号的合成效果,如 “$0.50”与“敖东/北大街”,应合成为“零点五零美元”、“敖东*北大街”。

  与硬件设备的融合

  语音合成系统能否与导航设备完美融合一直是车载导航制造厂商考察智能语音技术合作伙伴的关键。优秀的语音合成系统应该具备强大的兼容性,实现内核与平台无关,任何平台只需简单配置、编译,即可完成移植。

  此外,嵌入式环境下资源空间非常宝贵,语音合成系统应该在系统架构、代码实现、资源结构等方面进行大量的优化工作,降低运算资源和存储资源的需求。即使是一些低端的平台,也能够从容运行。同时,语音合成系统应该提供不同的输出采样率,满足各种播音设备,真正适应不同的平台需求。

  娱乐化需求设计

  长途的行驶过程中,同一种语音播报会让用户感到单调。如果语音技术提供商能够提供不同发音人、方言发音以及定制特殊发音人等个性化需求设计,将会使驾驶旅途变得更轻松愉快。

  娱乐化需求设计表现在一些人性化的设计上,如支持菜单播报、开机问候语、语音提醒等功能。不论是固定文本还是动态文本,如“下班先去玩具店给儿子买礼物”,既能省去真人录音的工作及其占用的宝贵空间,又能解决真人发音无法应对处理的动态文本问题。

  未来,语音合成系统将成为车载内信息获取、互动娱乐、程序操控的重要工具,这就需要语音技术提供商重点考虑语音车载导航的更广泛的需求设计。

CTI论坛编辑



相关链接:
讯飞畅言语音教具系统荣获“创新软件产品” 2009-09-08
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
“会说话”的显示屏提升居民小区信息服务水平 2009-09-07
讯飞语音助力太平人寿客服中心 2009-08-28
讯飞语音助力CDMA手机竞争终端市场 2009-08-14