首页>>厂商>>语音识别与合成>>科大讯飞

语音技术——增值业务新动力

2004/06/29

  目前,国内电信产业轰轰烈烈的大规模基础设施投资已是明日黄花,增值业务正借着市场开放的春风,进入复苏的季节,形成百花齐放之势。不仅国内如此,全球千千万万个电信增值业务公司正在成长壮大起来,随着数据和行业融合时代的到来,电信增值业务也在进入真正的黄金时代,"向增值业务领域进军"已经成为一道特有的风景。

  用户所期望的是利用一种非常简易的方式来获得他们所需的信息以及服务。现在互联网普及程度还远远达不到人们的需求,从而无所不在,话费相对低廉的电话、手机成为了最佳的选择。有了这样的通讯平台和用户基础,电话增值服务的兴起成为大势所趋。

  十年前, 可能会有好多人觉得语音带来商机是天方夜谈,但时至今时今日,再也没有人会否定这句话,因为事实已经证明了一切。各个企业对于语音技术的态度已经由从前过去的了解语音应用技术,改变为现在的去应用已成熟的语音技术的实际例子,以及业务项目的执行经验,从而去强化及丰富其本身业务,带来更大的收益。

  基于在语音识别技术准确度上已有突破性的进展,因此可以利用语音,不仅仅是改变原有的键盘输入查询方式,而且能够使自动应答系统处理更加复杂的情况。用户拨打服务电话的时候,只需说出他/她的需求即可。如在电子黄页业务中,用户要查询关于A公司的情况,服务电话接通以后就可以直接说出"A公司",而不要按键通过一层层的菜单目录,然后系统就能自动播报出该单位介绍信息和联系方式等。

  语音技术是一项新兴的技术,从90年代中期到现在的短短几年间,技术水平和产品化程度取得了突飞猛进的发展。语音技术包括人机交互的两个方面,语音识别:让系统自动识别说话人的语言或者命令;语音合成:让系统根据预设条件或者呼叫者的请求,自动将文本、数据库信息转换成语音播放出来。

  语音技术的采用,可以突破话机数字键盘的局限,降低录音和坐席成本,实现真正的自助服务。语音识别技术可以解放用户的双手,在开车时、走路时、工作忙碌时,免去按键的不便和繁琐,只要说出需求,一切就可以轻松搞定。而语音合成让来自过各种信息源的海量、动态信息实时转换成自然流畅的语音,用户就能得到最新的资讯和帮助。正是由于以上优点,语音技术已经成为西方发达国家通信增值业务中的一个亮点。

  众所周知,目前大多数电话机和手机的操作键盘都只有0-9十个数字键和*号和#号两个符号键,因此在设计导航菜单的时候很受限制。比如在点歌节目中,用这些数字键来指代上千首歌曲是根本不可能的。以前多采用的方法有两种:一是预先给用户发送歌曲手册,上面可以查到每首歌曲的代号。这种方式的缺点是实时性差,不能随时更新歌曲库。另外印刷宣传资料带来的人力和成本也不容忽视;另一种方法是将歌曲根据歌手、主题进行分类,比如下图所列的结构:


  这种方式虽然不必预先给目标用户发放歌曲手册,但歌手和歌曲的数量受电话、手机键盘上数字按键的限制,容量非常有限。歌曲的有限和陈旧又会影响用户参与的兴趣和积极性。并且曲库里的歌曲名称全部需要预先进行录音,管理和维护较为复杂。

  引入语音技术以后,说出歌曲名称或者歌手姓名就可以调出所需的歌曲,还可以容纳数千首歌曲,很好地解决以上提到的问题。同时,还可以利用语音合成系统将歌曲名称合成语音,以便动态添加、管理曲库。歌手、歌曲名称可以全部利用语音合成系统转换成语音,免去录音的繁琐工作。

  语音技术不仅可以解决原有业务的一些局限和弊端,还可以为拓展新业务铺平道路。比如近年时兴的语音电话本服务就是随着语音技术的成熟才成为可能。


  用户利用网页等方式添加的联系人姓名、昵称、电话号码、email地址等都可以利用语音合成转换成语音供电话查询。另一方面,拨打电话的时候只需要说出联系人的姓名就可以接通,这个效果是数字按键无法实现的。

  这样的服务能很好满足用户拥有一个"永不丢失,快速接通的个人语音电话本 "的电话本的需求。待到用户的联系人信息全部保存在服务器上,想来他也不再会考虑更换运营商了。具备这一有黏度的增值服务,运营商不仅可以开拓新的收益来源,还能大幅度提高用户忠诚度。以下就是美国第四大运营商Sprint运营语音电话本的业绩:业务开通10个月之内,有超过140万的用户申请服务;27周收回投资;每个用户可设定500个联系人,每个联系人可以有5个不同号码。 香港PCCW开通的语音电话本打出"数据保全 - 永不丢失的个人通讯录"的广告语,3天内就获得25,000 注册用户的娇好业绩,11天达到135,000 用户,2003年年底向60万用户迈进。并有传闻这个新业务的杰出表现甚至导致PCCW竞争对手不得不忍痛降价以挽留老客户。

  而在语音门户(Voice Portal)业务中,语音技术让业务内容更加丰富多姿,有新闻、天气预报、股评、外汇行情、笑话、邮件、短信等等。新服务的开通和维护都变得简单快捷,表现形式也更加人性化。最新鲜的股评和新闻等信息全部采用语音合成处理,不再需要大量耗时的录音工作,也能保证信息的及时发布和实效价值。


  山东联通"语音互联96133"就是典型的语音门户业务,开通了短信、娱乐、服务、新闻等频道;240线接入,7×24小时自动服务不收取信息费,平均0.3元/分钟。据称,该语音门户运营业绩也非常不错,通话时间稳定在30000分钟/天,每日收入过万元。

  除了以上服务形式,语音技术还可以用于电话QQ、高考查分、赛况热线、电话卡广告、电话定制接通音等不断推陈出新的新业务中。

选择合适的语音识别和语音合成引擎需要考虑的要点有几个:
  一、稳定性,增值服务所采用的语音系统一定是要能够在大话务量的情况下保证长期的稳定工作;

  二、具备集群工作的系统架构,在大规模应用、多台服务器协作的情况下有负载均衡组件;

  三、增值服务较基础业务对语音识别和合成的效果要求更高,以营造准确、愉快、亲切的人机交互界面。另外,专业语音技术提供商--科大讯飞在今年一季度推出的语音合成系统提供的多音色选择、添加背景音乐、统一管理提示音等新特性又能为增值服务增色不少。

  四、选择支持VoiceXML、SSML等国际标准的语音系统对于系统搭建和日后的升级很重要。
语音技术已经成为增值服务的全新动力,其卓越表现使增值服务突破传统CTI系统对内容和与用户交互方式的束缚,业务类型和收益模式多种多样,全新的语音界面让用户感受新信息技术的魅力和强大功能,带来更多看得见的收益。

科大讯飞公司供稿 CTI论坛编辑



相关链接:
讯飞畅言语音教具系统荣获“创新软件产品” 2009-09-08
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
“会说话”的显示屏提升居民小区信息服务水平 2009-09-07
讯飞语音助力太平人寿客服中心 2009-08-28
讯飞语音助力CDMA手机竞争终端市场 2009-08-14

分类信息:  增值电信_与_语音识别ASR  增值电信_与_语音识别ASR     热点专题_增值电信_新闻   热点专题_增值电信_文摘   文摘   技术_语音识别_文摘