首页>>厂商>>语音识别与合成>>得意音通

信息服务走向智能化

邓永强 郑方 2004/06/02

一、 巨大的市场需求

  通过自然语言与计算机进行交流,获取合适的信息,得到满意的服务,是人们长期以来所追求的目标。自然语言理解技术的发展,让文本自动分类、智能搜索、信息提取、语言翻译、自动文摘、自动勘校、智能聊天等成为可能。

  自然语言理解技术还达不到像人一样的智能理解水平,但是只要划定具体的领域(例如天气、体育等简单信息查询,也可以是交友、购物、保健等宽泛的智能聊天和咨询等等),都能量身定做出具足够实用性的智能信息服务系统,自动理解客户用自然语言发出的相关领域的问题,信息查询变得更方便、快速和准确。

  2003年,以Microsoft、AOL、Yahoo、Google等公司纷纷提供智能聊天机器人和智能搜索等个性化的智能信息服务。国内腾讯、慧聪等信息服务商也及时把握国际潮流,推出类似的新业务,力争巩固并拓展更大的市场份额。

  信息服务市场全球性爆涨后,智能短信服务适逢其时,先后在法国和中国投入市场。2003年底,Orange 法国公司采用Dejima公司的技术,为法国的短信用户提供从餐饮到汽车维修等多达150类的智能信息查询业务。2004年4月,北京得意公司率先把中文自然语言理解技术与短信服务相结合,与拥有丰富生活信息资源的《精品购物指南》报社合作,提供北京餐饮智能短信查询,并将陆续开通更丰富和实用的智能信息服务。

  智能信息服务将带来全新的应用模式,能有效提高服务的质量和满意度,拓展信息服务的发展空间.它将成为下一代互联网的重要应用,并有可能带来信息服务产业的变革。某机构调查结果显示,2004年中国大陆短信市场将达到300亿元人民币,网络短信用户将达到2640万;到2007年,短信、网上聊天的市场规模将达1500亿元。而智能信息服务的市场份额预计将达10%,也就是超过150亿人民币。

二、 丰富的智能服务方式

  智能信息服务已成功应用在客户服务、知识管理、智能软件帮助、企业管理、网上营销等多个领域。随着互联网的高速发展和产业的激烈竞争,智能信息服务不断走向实用化和大众化,智能短信服务、智能聊天机器人和智能搜索引擎等成为新的亮点。这些服务模式与普通用户更贴近、更具吸引力,也更具市场影响力和价值创造力。

1、智能短信服务

  智能短信服务,就是允许短信用户在手机上直接以自然语言的形式输入文字(而不是输入复杂的代码或操作繁琐的菜单),系统能迅速、准确地理解用户的意思,提供周到的信息和服务。短信服务商可根据具体应用领域定制一系列全新的智能短信业务,如旅游交通、餐饮娱乐、金融证券、交友网聚、智力竞猜等受欢迎的服务,将直接刺激用户使用短信服务的兴趣和频率。得意公司提供的北京餐饮智能短信服务可以灵活、方便地引导用户找到合适的餐饮信息(图1)


用户短信: 我想吃烤鸭
系统回答: 您好,吃烤鸭的地方很多,我不能都发给你呀,定个地点吧。
用户短信:西直门附近有吗
系统回答:在西直门附近只有1家。通华苑饭店餐厅(北礼士路101号(地铁西直门))。
用户短信:听说全聚德的不错
系统回答: 全聚德烤鸭店在XX路XX号。华威全聚德在XX里XX号。全聚德和平门店在XX大街XX号。谢谢您的支持,以后想吃什么就找我呀


2、智能聊天机器人
  目前流行于各大网站或各类即时通讯软件的聊天机器人,还没有应用成熟的自然语言理解技术,仅仅实现了基本的、简单的对话交流和信息查询等功能。引入自然语言理解技术的智能聊天机器人,能通过与用户对话和聊天的形式,了解用户的需求;它还可以利用智能搜索技术采集、分析互联网和知识库的信息内容,进行自动过滤、筛选、获取有效内容,对相关信息内容进行智能化编辑整理,并返回给用户。智能聊天、智能游戏、个性化的新闻定制、智能电子商务等服务,将为用户带来很大的方便和更多的乐趣。

系统:您好,欢迎使用本航班订票系统
用户:我要从北京到上海
系统:请问您要哪天的?
用户:明天下午的有吗?
系统:您要到虹桥机场的还是浦东机场的?
用户:我要虹桥的,国航757或者747的
系统:查到了3班:13:30,15:40,16:20,您要哪一班?
用户:最晚的
系统:您要订6月8日16:20北京首都机场飞上海虹桥机场的机票一张吗?
用户:是的
系统:您的订票号是123456,票价为850元。请您在起飞两小时以前到机场或者民航售票处支付票款。祝您旅途愉快!


  以上是一个专门提供航班信息查询服务的智能聊天机器人的对话过程.

3、智能搜索引擎
  目前的普通搜索引擎由于只使用关键词技术,每次搜索时只是按照关键词进行匹配,返回的大量信息中很大一部分不是用户需要的信息,往往导致用户无所适从。而门户网站或专业网站虽然对信息进行很好的分类,但是首先要用户记住网址,还要懂得分类的标准,然后逐层点击相应的分类链接,才能获得所需的信息.这样的信息分类查询给信息服务商带来了很大的工作量.服务成本和进入门槛显著提高,并且对用户而言也很不方便.智能搜索引擎是依靠语义网络、汉语分词、句法分析、处理同义词等自然语言理解技术,更大程度地了解用户的信息需求,获得更易用性、更准确、更智能的搜索结果。它具有人性化、交互性的特点,可以识别并回答用户的问题,摆脱了传统搜索引擎基于关键字的束缚,并能提供相关的、有参考价值的其他内容。

  智能搜索引擎除了应用于互联网上的常规终端以外,也可以支持WAP协议而应用在手机.其实用户往往在逛街、旅游等室外移动环境下更需要随时查询信息,手机在这些场合下是很好的查询工具,但是其屏幕小、内存少、计算性能低带宽窄,不适合接收和保存大量的信息,更难以满意地翻看大量信息.传统地基于关键词的搜索或分类信息查询模式都存在一定地缺陷,很不适合应用在手机终端上.而智能搜索引擎能很好地为手机用户提供随时、随地、随心地信息服务.

  智能搜索引擎一个典型的应用是基于丰富详尽的生活资讯知识库,构建智能生活资讯服务系统,支持互联网、短信、WAP等多种通讯手段,在吃喝玩乐、影视娱乐、消费购物、户外运动、美食餐饮、医疗保健等领域,为商家和用户提供更方便、直接的信息交流和互动手段。例如,传统的搜索引擎查询人名时,可能会出现上百个不同身份的重名;智能搜索引擎可以支持行业分类功能:输入"歌手黎明",就能直接指向香港歌手黎明以及他的歌曲下载地址、歌手资料、新闻、歌词的信息等等,没有了二次搜索的麻烦,更不会指向小说《这里的黎明静悄悄》。

三、 支撑技术

  计算机技术和人工智能技术的发展,是智能信息服务的广泛应用和日益普及的基础,自然语言理解技术是智能信息服务的支撑平台。

  自然语言理解技术最早地研究领域是机器翻译.早期所开发的机译系统的技术水平较低,不能满足实际应用.到了20世纪70年代初期,对语言理解对话系统的研究取得进展.进入20世纪80年代之后,机器学习研究又活跃起来,出现了许多较高水平的实用化系统.

两大技术方向

  现阶段的自然语言理解技术有两大研究方向,分别是基于规则的分析方法, 即所谓的"理性主义";以及方针对大规模语料库的分析法,即所谓的"经验主义".前者基本上掌握了单个句子的分析技术,但是还很难覆盖全面的语音现象,特别是对于整个段落或篇章的理解还无从下手.后者充分利用计算机的高速处理能力和海量存储,收集大量相关的文本建立语料库.语料库提供的知识是用概率统计表示的,因而常常会出现答非所问的情况,并且语料库需要耗费大量的时间和资源去建立、维护,成本很高.将来,这两个技术方向将相互取长补短,呈现融合的发展趋势.

  为了实现智能信息服务的种种功能,人们在开发自然语言的词法分析、句法分析、语义分析、语境分析等技术,不断积累诸如电子词典、语料库等语言数据资源。

优良系统的追求目标

  自然语言理解系统要具备好的适用性,应该支持上下文相关分析、话题自由变换、人机混合主导以及口语对话等特点.

  上下文相关分析是指系统在理解当前语句时可以联想用户以前所说的话进行综合分析,因此即使有时用户所说的话有一定的省略,系统同样可以理解。

  话题自由变换时指允许用户在多个话题之间不断转换,系统同样可以记住以前的谈话内容。例如用户在问航班起飞时间时,突然插入目的地与本地的时差问题,然后在继续关于该航班的问题,系统都能回答。而目前的一些系统,往往只能局限于某一个话题,一旦用户变换话题,系统将无所适从。

  人机混合主导则是完全的自然对话,用户可以转换话题后再回到原来的话题(像人一样);用户可以"答非机问"(多回答或少回答);而系统都可以根据实际情况提取语义信息,如果用户询问中的信息足够丰富,那么系统直接回答问题;如果用户询问的信息不全或者用户迟疑太久,那么系统则主动询问来获取足够的信息。而不具备人机混合主导性能的系统只能等用户发问,如果用户根本不知道问什么,那么系统一直待机等待。

  口语对话是自然理解技术实现的难点,但也是应用系统适用性的关键点。口语中,人们的语言很随意,可以省略、更正、倒叙等等,这些口语现象是传统的单单基于词法分析的理解系统所难以解决的,而引入基于关键语义的技术却很好地解决。

  从目前的理论和技术现状看,通用的、高质量的自然语言处理系统,仍然是较长期的努力目标。但是针对某些特定应用的系统已经出现。

  自然语言很复杂,人类对自己理解语言的机制还不是很了解。要主计算机理解自然语言,必须先将人是如何学习和理解语言的机制研究透彻。对此,需要计算机技术与语言学进行交叉学科的研究。

研究现状
  国外在1963年就建成了早期的自然语言理解系统,许多著名的大学和科研机构都投入了大量的科技资源进行研发。IBM、Microsoft等公司先后推出各种基于自然语言理解技术的产品和应用,在英语、法语等语种上积累了大量的经验和成功案例。20世纪90年代,IBM、Microsoft先后在我国建立研究院,开展中文语言理解技术研究,其中一些新成果预计将在近期推向市场。

  中国在1980年建成了两个汉语自然语言理解模型,都以人机对话的方式来实现。目前清华大学、北京大学、北京语言大学、上海交大、复旦大学、中科大、中科院、社科院等主要科研单位都在自然语言理解技术方面有雄厚的技术力量。总体上看,国内外的自然语言理解技术方面的研究有一定的差距。当然,国内研究也有优势,语言工程所需要的大量专家水平的人力以及语言数据资源都是丰富的,价格相对低廉,目前有些系统取得了可观的经济效益。例如,华建集团的智能辅助翻译系统,是语言理解技术的出色应用;中文之星、紫光拼音等中文智能输入法引入中文语言模型,目前占有一定的市场份额;ChinaRen(现被搜狐并购)、慧聪等搜索引擎技术开发商也先后推出中文智能搜索引擎,力图在激烈的市场竞争中获得有利的地位;得意公司近日开通的智能短信服务系统,开辟出中文语言理解技术崭新的领域。

前景展望
  人机交互的最高境界,是非常智能的信息服务。任何人、在任何时刻、在任何场所、在任何设备上,都可以通过自然语言和语音方便互相传递信息,随时随地进行交流。如图2


  不久的将来,我们可能会经常遇到这样的应用场景:一个人到一个新的城市(例如北京),若想尽快了解有关北京的生活服务信息,就可以用手机或者电话打到一个提供智能信息服务的系统。他可以直接用口语去问一个拥有海量信息的服务器:北京有哪些好玩的地方?哪些地方能够提供很好的餐饮服务?哪些地方可以购物?他还可以与系统进行人机对话,轻松地买机票、订房间等等。

  北京2008年奥运会将是智能信息服务大展拳脚的舞台,奥运会面临语言障碍。国内外产业界正在紧密合作,研制"面向奥运的多语言智能信息服务网络系统",力争在北京奥运期间为各国运动员、记者、观众,以及来自全世界数以百万计的旅游者提供综合、全面、多语种、可定制的智能信息服务。该系统将包括多语言信息同步发布、信息查询和语音交互式的电子商务,并重点提供基于位置的信息服务;另外还有口语翻译机和自动翻译电话等。

  中文的使用人数以及分布范围仅次于英语,因此中文语言理解和智能信息服务领域的发展空间很大,国内的社会各界也认识到中文信息处理的重要性,正在开展具有完全自主知识产权的技术研发,并积极引领相关的国际和国内技术标准,以争取产业发展的主动。

得意音通公司供稿 原文发表于微电脑世界》第十期



相关链接:
得意珠三角综合智能信息增值平台项目中标 2009-08-20
北京软件产品质量检测检验中心对《海量语音文件的目标说话人筛选系统》进行测试 2009-06-25
广东政府和清华大学举行了全面开展产学研合作协议签约仪式 2009-06-25
得意中文整句输入法V1.0开源for Windows Mobile5.0 2009-01-23
得意声纹识别VPR4.0_b20080808新版本发布 2008-08-27

分类信息:     文摘   技术_语音识别_文摘