首页>>厂商>>语音识别与合成>>科大讯飞

科大讯飞语音技术在导航行业应用方案

2009/03/30

前言      语音合成(Text To Speech),简称TTS技术,它涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。解决的主要问题就是如何将文本状态的文字信息转化为可听的声音信息。使以往只能用眼睛看的文字信息,也可以用耳朵来听。通俗地说,就是让机器开口说话的技术。

  语音识别(Speech Recognition),简称SR技术,语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

  如今,车载导航产品已经逐步从早期的车载GPS设备,向集成电子地图、路径智能规划、实时信息服务于一体的综合化个人信息设备的方向演进。车载导航产品的智能化、人性化已经变为一个重要的发展趋势,语音与车载导航产品的各种应用和功能相结合,将能很好的提升车载导航系统的可操作性,极大的提高车载导航系统的智能化程度,给车载导航产品带来更为人性化的表现。

  车载导航产品中的语音应用主要是针对车载导航产品屏幕小和经常处于驾驶状态的特点,将原本需要使用手操作按键的使用方法利用最自然最习惯的说话方式代替;把各种传统上需要同用户交互的信息(道路信息,驾驶导航信息,POI信息,实时路况等)转化为语音,使用户通过语音这种人类自然的交流方式获取这些信息,从而达到解放用户的双手和眼睛、提高驾驶安全性的作用。
  1. 在与原有车载导航功能相结合,增加语音功能时,尽量保持车载导航产品上原有的用户界面不变,减少开发工作量。采用附加应用层界面的方式添加语音合成和语音识别功能。

  2. 对原有车载导航产品的硬件设计和模具做尽量少的修改要求,尽量不增加硬件成本。

  3. 所有用户语音应用的内容都可以进行设置,让用户选择是打开还是关闭。

功能描述

  本方案分析了车载导航产品中原有的功能与语音合成技术和语音识别技术的各种可能结合点,总结出以下一些语音应用功能点,以图表方式简列如下:

 

  POI包含的类别比较多,包括:景点,加油站,餐馆,住宿,商场,娱乐设施,政府机关,教育文化,金融,医疗等。下面以POI中的加油站和餐馆为例介绍:      功能描述

  当用户需要查询附近的加油站时,用户可以在按下识别键并听到识别系统启动的提醒声音后,用语音方式给出“附近加油站”命令即可查询附近加油站。在使用查询功能得到以距离从小到大排序的查询结果列表后,可以通过简单的按键选择列表,光标默认处于距离最近的那个结果上,系统默认会播报出来。当光标移到某个结果上时,系统自动读出该加油站的名称和距离等信息,供用户选择。当用户选择了某个结果,我们可以再次利用语音命令方式将其设为导航的目的地或者途经地。

  设计目的

  传统的POI查询一般使用多层界面,需要用户进行多次点击和选择操作才可以得到查询结果列表。而本功能利用语音识别来减少操作步骤,提高操作效率。

  典型使用场合

  1.驾驶和行程计划过程:在驾驶车辆前,用户一般会检查车内还有多少油,如果剩油不多,用户此时就需要找到一个最近的加油站去加满油,此时便需要使用该功能。

  2. 驾驶过程中:在驾驶车辆的时候,当用户发现油量不足,而驾车过程中操作车载导航产品不便,同时也有危险性。通过该功能不用大量复杂的手动操作就能将查询结果中用户选择的加油站设为导航的目的地或者途经地,给用户带来安全,快捷的享受。      功能描述

  当用户需要查询附近的餐馆时,用户可以在按下识别键并听到识别系统启动的提醒声音后,用语音方式给出“附近餐馆”命令即可查询附近餐馆。在使用查询功能得到以距离从小到大排序的查询结果列表后,可以通过简单的按键选择列表,光标默认处于距离最近的那个结果上,系统默认会播报出来。当光标移到某个结果上时,系统自动读出该餐馆的名称和距离等相关信息,供用户选择。当用户选择了某个结果,我们可以再次利用语音命令方式将其设为导航的目的地或者途经地。

  设计目的

  传统的POI查询一般使用多层界面,需要用户进行多次点击和选择操作才可以得到查询结果列表。而本功能利用语音识别来减少操作步骤,提高操作效率。

  典型使用场合

  驾驶和行程计划过程和驾驶过程中。      功能描述

  用户在需要了解当前位置时,只需按下识别键并在听到识别系统启动的提醒声音后,说出“当前位置”,系统在识别该命令后便可以用语音播报方式读出当前的位置信息。

  设计目的

  当用户在陌生的城市/地区或者在行驶过程中,往往会有知道当前位置的需求,车载导航产品上GPS定位系统的普及为该功能提供了信息来源。通过语音命令方式而不是传统的多次点击和菜单选择,该功能可以更好的满足用户知道当前位置的需求。

  典型使用场合

  用户陌生的城市/地区和驾驶过程中。

  应用设计场景说明

  应该添加一个设置项,让用户选择地名播报时是否把地名和经度纬度信息一起播报出来。   功能描述

  当用户要开始导航过程时,只需按下识别键并在听到识别系统启动的提醒声音后,说出“导航到<我的地标>”或“回家”或“回公司”,系统在识别该命令后,便会将对应的地名作为导航的目的地。(<我的地标>表示地标文件夹中所包含的文件的名字,例如“科大讯飞”“市政府”“黄山路”,其中的地标文件用户可以自由添加,也可以自由命名。)

  设计目的

  当用户需要开始导航时,因为大多数用户的大多数导航过程总是在少数几个已知地点之间的,所以可以将那几个地点标记为地标,通过目的地快捷设定便可以很方便的设置导航目的地,开始导航过程。这样做可以极大的减少用户的重复输入和操作。

  典型使用场合

  用户长期居住的环境中。      功能描述

  这个功能是配合“目的地快捷选择”的一个功能,也就是说首先要使用“保存地标”功能保存过的地标才可以在“目的地快捷选择”功能中通过“导航到<×××>”指令来将其设为目的地使用。(“×××”表示已保存的地标的名称)。

  1. 当用户处于无GPS连接的状态时,用户可以进入地图模式,先在地图上先找到自己可能会频繁前往的一个地点,然后用光标选中该地点,用户在按下识别键并在听到识别系统启动的提醒声音后,说出“保存地标”,然后该地点就会被保存为一个地标,该地标的名称可以自定义更改。如果用户有多个地点需要保存,则重复以上步骤。

  2. 当用户处于GPS正常连接状态下时,当用户驾驶到一个他认为他以后可能会经常去的一个地方附近,他想把该地点保存为地标。用户在按下识别键并在听到识别系统启动的提醒声音后,说出“保存地标”,然后该地点就会被保存为一个地标,该地标的名称可以自定义更改。如果用户有多个地点需要保存,则重复以上步骤。

  设计目的

  该功能可以记忆用户经常会到的地点,保存其地点信息作为地标,而一旦要将某个已保存的地点作为目的地,便可以使用“目的地快捷选择”功能将其设为目的地。这样便达到了减少用户重复输入常用地点名称,减少机器地点搜索次数,节省用户的精力和时间等目的。

  典型使用场合

  普通状态下和驾驶过程中。

  应用设计场景说明

  应该添加一个设置项,让用户选择默认情况下保存的地标的命名规则,例如(1)附近道路(2)附近城镇。      功能描述

  用户在按下识别键并在听到识别系统启动的提醒声音后,说出“结束导航”,系统在识别该命令后,自动结束现有导航。用户可以再次利用“目的地快捷选择”等功能再次开始导航。

  设计目的

  该功能的设计目的是在驾驶导航过程中,某些情况下目的地发生了改变,此时便需要结束原导航然后开始新导航过程。

  典型使用场合

  驾驶过程中。

系统设置

  在某些场合下,用户不方便使用语音播报等功能。因此,系统设置菜单中,需要增加一些针对语音功能的设置选项,让用户可以选择是否打开或者关闭某些不需要的语音功能。

  纯语音合成菜单设置


车载导航产品语音应用展望      随着讯飞嵌入式语音识别技术的不断发展,将来可以实现更多与导航实际应用结合更为紧密的功能,例如“POI语音模糊查询”,“交叉路口语音模糊查询”等。     随着车载导航产品与其他通信网络的互联互通,以及城市级信息中心的建设,语音技术可以广泛的应用在实时新闻播报,实时路况播报等功能之中。

科大讯飞



相关链接:
讯飞畅言语音教具系统荣获“创新软件产品” 2009-09-08
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
“会说话”的显示屏提升居民小区信息服务水平 2009-09-07
讯飞语音助力太平人寿客服中心 2009-08-28
讯飞语音助力CDMA手机竞争终端市场 2009-08-14