发表评论分享按钮

手机语音搜索亟待突破中文识别技术瓶颈

2012/02/21

  “娱乐式尝鲜”利于产品升级改进

  在手机语音搜索这一年度移动互联网热点领域,苹果公司依旧是先行者。此前,苹果公司推出了iPhone 4S,并在其中集成了Siri模块——这使得用户可以通过语音对手机进行控制,同时也可以通过语音进行搜索。苹果公司巨大的行业示范效应使得手机语音搜索的市场被引爆,各类语音搜索的应用迅速涌现。

  近日,HTC旗舰级新机HTC Endeavour被曝出包含了一项名为“HTC Speak”的语音助理软件;国内热门移动互联网应用订餐小秘书也推出了支持语音搜索餐厅功能的Android版及iPhone版客户端。此前,百度、谷歌、腾讯、UC、科大讯飞等都陆续推出了自有移动语音搜索应用,一时间语音搜索似乎成为了未来智能终端的必备选项。

  事实上,与国外不同,目前国内手机语音搜索市场虽然已具备了一定的用户需求与初步的技术积累,但仍处在市场导入期阶段。由于目前的技术现状无法准确识别国内用户相关需求,用户多将其作为尝鲜的娱乐工具而非应用工具,可以看到,我国手机语音搜索应用从起步到成熟仍将有较长的路要走。

  Siri成功培养用户习惯

  虽未被广泛普及,但目前国内手机语音搜索的市场发展基础已经形成。

  首先,手机语音搜索迎合国内手机用户需求。用户在使用手机时,有相当比例的时间处在移动状态下,在这种状态下,用户视觉的使用需要在使用手机与其它行为(如观察路况等)间进行分配,因而无法专注地使用手机。而语音搜索则解决了这一问题,用户可以通过“说”来提交需求,通过“听”来获得反馈,而不会影响用户正常行为。

  其次,Siri成功引发了用户语音搜索使用兴趣,国内手机语音搜索市场发展的引爆点已经出现。在过去十多年中,苹果公司一直作为行业引领者而存在,每当其推出了新产品、新应用后,用户对其高度认可,并将其作为流行趋势来对待,而市场上也随之会出现一系列的“借鉴者”,在产品的外观、功能等诸多方面进行借鉴。可以看到,当Siri被集成到iPhone 4S中后,在其它各类应用市场上,迅速出现了上百种与语音相关的应用,并且凡是涉及到搜索的(包括搜索引擎以及各类应用中所涉及到的搜索功能),也无一例外地加上了语音搜索模块。

  第三,中文语音搜索的技术基础已初步形成。语音搜索并非苹果公司所独创,核心技术也并非完全掌握在苹果公司处,这就使得语音搜索的广泛应用成为可能。语音搜索从技术本质而言,是先对用户所说的语句进行语音识别,再根据识别的结果进行搜索,并反馈用户相应结果。目前,科大讯飞、谷歌等企业历经多年的发展,通过语音库、语义库的构建,已经能够较好地识别用户的语音;而语义库的构建,也实现了机器对人自然语言的解读,为更加精确反馈搜索结果奠定了基础。同时,移动互联网与云计算的发展,也使得基于在线庞大语音、语义库,实现精准识别成为可能。

  中文识别难上加难

  尽管手机语音搜索市场基础已经形成,但是短期内市场无法规模推广,其根本原因在于目前技术仍不成熟。

  众所周知,每个人的口音均有一定的差别,能够准确识别用户在说什么,本身就是一件很困难的事,而中文的同音不同字情况较多,将用户的语句识别为哪些词组,还需要考虑上下文的具体情况,相比英文、德文等拉丁语系的一个发音明确对应一个单词而言,中文的识别难度无疑会更高。同时,在中文中,同样的一句话,在不同的语境中,具备了不同的含义,识别难度会更大,很难实现以自然语言进行搜索,并准确反馈搜索结果。

  此外,为了调用语音、语义库,以更加精准地理解用户的意思,目前不少语音搜索服务商的做法是将用户所说的语音上传到服务器,由服务器进行识别,但这对网络的速度、服务器的处理能力等提出了较高的要求。

  笔者曾对目前较为流行的谷歌语音搜索应用进行测试,发现其对标准普通话的理解尚可,但如果发音稍不准确或者出现一些较为冷僻的词汇,则识别准确度就会出现明显下降,需要手工调整;同时,在光纤接入的Wi-Fi环境下,识别一句完整的话也需要数十秒的等待时间。

  音调类搜索或密集涌现

  从长期发展趋势上看,当语音搜索技术达到成熟时,手机将成为用户的智能助理,用户可以用自然语言向手机发出命令,手机快速完成用户的请求,包括执行相关应用、反馈相关信息等,而目前的应用如Siri,虽然具备了相应的理念,但尚不能完全实现相应的功能,特别是基于中文的应用。

  为了推动手机语音搜索产品加速步入成熟阶段,在现阶段,将有诸多厂商,按照手机语音搜索成熟阶段的理念提供相应产品,并不断优化。这些产品主要包括手机输入法、搜索框的输入、手机语音应用等。它们在初期或许并不成熟,用户需要努力用标准的普通话发音,而不能用自己所常使用的说话方式,并且未必能够得到精确的反馈结果,因此,此类产品往往被用户尝鲜式使用,并被当作一种娱乐工具而非应用工具,但是,在产品被用户使用的过程中,厂商能够不断采集用户的声音、用户语言,从而形成较为完善的语音库、语义库,使得产品能够逐步趋向成熟。

  同时,手机语音搜索的另一个发展方向是音调搜索,例如用户想搜索一首音乐,但他只能记得部分的声音片段,如果他能够哼唱出音调,那么搜索工具同样能够支持搜索。预计在未来,此类产品将不断涌现。

  总之,审视手机语音搜索的商业模式,笔者认为其不能构建独立的商业模式,而将更多作为一种技术手段,支撑其它各类型应用更好地发展,并且在不断的信息搜集中,实现ICT产业的重要发展目标之一,即人工智能的深入突破。

通信世界周刊



相关阅读:
华为与芒果网合推最新应用软件“势力邦” 2012-02-21
盛大语音平台为开发者插上声音的翅膀 2012-02-17
智能手机安全堪忧 安卓平台危险最大 2012-02-15
全球智能手机销量首超PC 移动互联网引发跨界风 2012-02-15
LinkedIn移动领域发展迅速 欲将广告植入应用 2012-02-10

热点专题:  移动互联网