首页>>>技术>>>语音应用>>>语音识别(ASR)  语音识别产品


语音,无所不在


Elizabath Hurt 2001/01/18

  对网络公司而言——无论是期望靠语音产品带动销售的零售商,还是期望拥有更多注意力的广告商,语音成了2000年秋天最热门的词汇。不管你相不相信,今后5年,你会看到消费品有一系列全新的应用——利用语音控制烤箱和录像机等设备。

  厌恶蜂窝电话的人运气真不好,因为现在语音成了每家网络公司都在谈论的话题。全球三大网络公司AOL、Lycos与Yahoo!抢先涉足基于语音的接入服务,为人们提供了一种检索电子邮件及其他网络内容的新方法。这三大公司涉足语音服务,充分证实了分析家的预测:语音技术将在新经济中起重要作用。网上语音给人的希望不仅仅是通过电话收发电子邮件,还将帮助网络商店获取来自电话而不只是PC或PDA交易的销售额,而且语音门户网站技术还会帮助传统商店与在线商店改善购物与客户服务,为服务组织节省更多的运营成本。


  潜力有多大


  分析家预测:到2005年,语音门户网站从广告、商业交易与客户服务中获得的收入将超过50亿美元。

  

  目前,AOL、Lycos与Yahoo!对语音识别和语音到文本技术的使用,限于用声音传送现有内容,所以用户可以通过电话阅读电子邮件、获取股票报价和新闻或享用其他服务。Yankee集团的分析家兰开斯特认为,在这一市场中,大公司具有相当大的优势。

  他认为:在吸引与留住顾客的这场竞争中,大公司正设法为自己的网站增添尽可能多的价值。就把电子邮件与众多信息服务结合起来而言,免费提供语音服务就是一种诱惑。为了留住顾客,这些公司可谓不遗余力,这是因为它们有能力这么做,而许多小公司却没有财力投资这类新兴而又有风险的服务。

  对大多数公司来说,提供语音服务还颇具风险,这主要是由于缺乏明确的收入模式。虽然广告似乎是必然选择,但很多消费者对广告已经大倒胃口。Cahners In-Stat 集团在调查了1000名消费者后指出,48%的人可能会使用语音门户网站——但如果必须收听广告的话,只有31%的人仍会选择这种服务。

  现在AOL的语音服务是免费的,但从2001年2月开始,用户必须每月支付4.95美元,而Yahoo!则选择向等待查阅电子邮件或定制信息期间的用户播放广告。Yahoo!高级制作人萨德纳·若利埃说:“我们认为用户会对语音广告产生积极反响,因为它完全纳入了整项服务中,类似于无线电广播环境。”

  其他可供选择的收入方案还包括收取赞助费,而最有前途的也许是语音门户网站向移动商业交易收取一定比例的费用。Cahners In-Stat集团的分析家认为,它们的下一个重大方向将对准基于交易的收入模式。不管门户网站使你能购买Britney Speares的最新唱片、预订饭店客房还是购买飞机票,他们肯定会想方设法获得一定比例的销售额。

  在语音技术变得越来越火的同时,专家们提醒我们,必须克服其中的一些设计问题及其他难以克服的障碍。


  什么拖了后腿


  试图发展网上语音技术的公司仍须克服许多设计、技术与观念上的障碍,而且决定通过哪种语音网络来提供服务也绝非易事。

  

  Jupiter通信公司的分析家谢默斯·麦卡蒂尔说:“现在公司完全是从以网络为中心的角度来对待移动服务,但这并不意味着必须通过每一个接口在每一个平台上提供相同的服务。”麦卡蒂尔强调:近期Qwest通信公司宣布,它将利用BeVocal的应用程序,运用语音浏览朝更有帮助、更有利润的方向前进。这项服务于2000年11月1日推出,它允许顾客先拨三个数字,然后只需对着电脑说话,而不再需要按任何键,就可询问交通、航班时间、饭店及其他类似信息。这种目录服务考虑到了消费者外出活动时真正需要的内容。因此,有可能在最短时间内获得收益的正是如Qwest之类的电信公司。

  除了观念上的障碍必须要消除外,这些公司还面临更普遍的问题,如设计。SpeechWorks的营销副总裁斯蒂夫·钱伯斯表示:“我们正在解决拨号时必须注视键盘的问题。我们预计这是一个机会:完全通过扬声器来控制拨号的语音设备,这对我们来说是件大事。那时,当你钻进汽车时,只需像打开收音机那样按一下按钮,就能到达你要去的任何地方,一切只需使用语音——这实在是很酷。”

  不过,SpeechWorks也正在致力于优化无线与IP网络技术,因为蜂窝网络可能产生问题。钱伯斯说:“蜂窝网络往往会丢失头信息包,这对语音系统来说非常糟糕,而技术优化完全有能力改善这种情况。”

  公司面临的另外两大障碍则是基于会话的交易及讲话人的识别与确认。IBM研究中心人类语音技术部门负责嵌入式设备的项目经理罗伯特·斯考尼领导的小组,正在开发为便携装置和基于服务器的语音门户网站等一系列设备增添会话功能的技术。

  现在,语音门户网站还只能完成较简单的任务。斯考尼说:“如果你想与这些系统自由自在地交谈,那还相差甚远。就这一点而言,旅行预订系统提供的服务更多样化。至于语音门户网站,大多数情况下只有几个命令可供使用,而且选择有限,你只能在特定的时候说特定的话,所以我认为,它还不是一种必然接口。”


  指点未来


  斯蒂夫·钱伯斯预言,今后5年,我们最终会看到人们期待已久的语音驱动的技术创新。到那时,你会看到消费品有一系列全新的应用——利用语音控制烤箱和录像机等设备,你只要对着这些设备说话,图像等更直观的表示就会出现在面前。

  

  随着语音识别技术不断向实用发展,很多领域对人工的需求会大大减少。虽然没人真正喜欢技术导致工人失业,但这对急于扩张势力而又希望降低管理费用的零售网站来说,也许是个好消息。语音接入能迅速将一个网站变成电话服务实体,提供相同的功能,但又允许人们——不一定是网络用户——利用电话在网上购物,它们可能只要派发一份印有与其网站相连的800免费电话号码的目录。

  这一进步将会是重要的一步,因为这使语音与视觉服务可以互换,从而给了消费者选择的余地,而这种选择可能取决于他们期望购买的商品。在某些场合下,语音购物并不需要目录或网站的图形元素。譬如说,许多畅销品就不需要听意见或谈价格。这可以让我们充分理解语音网络这个概念,即消费者只需拿起电话,就可使用能够识别语音并进入语音网站的软件。Nuance电信产品营销经理认为,语音网络的确是结合了电话网络与因特网优点的下一代网络。

  借助于声纹技术,计算机能根据对方讲话的声音来识别打电话者。家庭购物网络(HSN)目前使用Nuance的声纹技术,主要是为了让老用户避开繁琐的顾客身份确认过程。其另外一个优点就是,它使HSN能够区别同一户人家的打电话者——因为父亲的购物喜好与其十几岁的女儿肯定有所不同。

  有了语音网络,当某人拿起电话预订飞往伦敦的航班时,被语音激活的电话就会给出此人的旅行概况,并且浏览语音网站,搜寻最划算的价格。同样,这类技术创新也为其他的商业空间提供了机会。基本上来说,你拿起电话后,语音浏览器就会接通所拨号码的那个人,或存取位于呼叫中心或网站的信息,只要它具备语音激活功能。

  把Nuance的语音识别技术用于零售的还有Shop Talk,这家最初针对职业妇女的公司,帮助用户通过电话就能购买从尿布到电脑的一切物品,它与必胜客、Drugstore.com和KB Toys等零售商都建立了合作关系。2000年9月,这家自称拥有近50万注册用户的公司扩大了基于按钮式电话的业务,用户只要说出关键字(如“中餐”),就能听到有关的特别服务与折扣。Shop Talk则从交易中收取佣金,同时还向赞助信息收费。

  不管你信不信这种未来展望,语音服务显然将在商业中起到日益重要的作用。顺利的话,语音服务会使商家获得一种独特的技术,帮助赢得并保留顾客。反之,语音服务会使消费者比过去的语音邮件有更多的机会大发牢骚。

《赛迪市场专家》2000/12/04



相关链接:
语音识别技术面临的问题 2000-12-19
语音电子商务——因特网的下一个热点 2000-12-15
VoiceXML语音门户的引擎 2000-12-11
语音识别还有几道坎 2000-12-07
语音识别可用了 2000-12-07