首页>>厂商>>语音识别与合成>>得意音通

郑方:产学研合作肩负标准与产业重任

郑方 2006/02/24

  比尔·盖茨在1999年出版的《未来时速》一书中曾经预测,人类计算的未来是让计算机能够看、听、学,能用自然语言与人类进行交流。他的话正逐步成为现实。

摆在眼前的问题

  我们经常会遇到这样一些问题:QQ一下、短信一下,单纯的文字交流已经不能满足需求,于是视频聊天、摄像手机开始流行;面对着每天上G、上T字节的信息,如何快速搜索有用的信息?google一下、百度一下,几万甚至几十万条信息,通常能浏览的大概不到100条,于是人们希望精细查找;2008年奥运会即将到来,学英语的浪潮正在席卷,然而更多的语种就需要机器翻译……

  这些关乎中文语言理解技术应用的需求日趋高涨。

  除了有关语言理解内容方面的应用之外,在2005年国际中文语言资源联盟年会上,清华大学信息技术研究院副院长、CCC理事长、北京得意音通技术有限责任公司董事长郑方教授还提到关于内容安全的问题。首先,内容在传播过程中,我们怎么保证有用的信息不被没有授权的人获取;其次,一些有害的信息,甚至一些危险的信息,我们怎么能够过滤掉。这是一个非常大的问题。现在,在网上传播的一些信息让用户很烦,包括垃圾邮件。而我们用简单的方法过滤出这些信息往往达不到一个有效的效果,有的时候把一些有用的email、有用的网页都挡在门外,实际上这样的结果是我们非常不希望的。为什么会这样呢?是因为我们没有真正理解这个email,也没有真正理解这个网页它所要表达的内容,到底是反对某个事情,还是支持某个事情。如果我们通过语义的理解,知道这点,那就可以做到有的放矢,有用的、有利的、安全的我就让它过;相反就把它阻止在外面。以上讲到的是怎么去防止的问题;哪些人可以对这个信息进行存取,哪些人不能,这涉及生物认证技术。声纹技术可以做到进行“真实自我和真实意思”的判断。众所周知,生物特征是不能被借走和偷走的,它展示的是“真实自我”,而利用语言中所包含的韵律等信息,就可以对“真实意思”做出判断。

  这些就是目前中文信息处理产业要解决的一些问题。这些问题来自产业界的一些需求,也来自国家战略的一些需要,而这些需求的满足,正是中文信息产业的机遇所在。

触手可及的商机

  郑方教授在主题演讲《发挥产学研通道优势,开展自主创新活动,推动中文信息产业发展》中充分论证了中文信息处理产业发展的商机。7亿电话用户的规模,2178亿条的短信量和58.8%的增长率……这些数据的背后是庞大的市场机遇。

  郑方以两个行业为例向与会者介绍了技术的增长趋势。国际生物集团提供了一个未来生物识别市场的预测,2005年达到21亿美元,2007年将达到40亿美元。在这里面,各种不同的生物特征,分别占据不同的比例。其中,2003年声纹识别应用占了4.1%的比例,这个比例不是很大,但是2004年就上升到了6%。IBG集团曾经预测,到2007年,声纹识别应用可以占到10%,可见数据增长速度还是比较快的。

  再从商业模式的方面来看。在1980年到1995年之间,主要是门禁系统和PC的登录方面应用比较多;从1995年到2005年,在信息系统的身份认证方面比例增加,增长速度也比较快;但从2005年开始,网络用户身份的验证,就逐渐占据主要的、显著的地位了。众所周知,网络用户之间可以对话,可以就各种问题进行讨论,但是,彼此之间却不知道对方是谁。因此,“用声音去判别身份”成为互联网用户验证的手段,同时为中文语音的发展带来很大的空间。

  语言理解也是一样。搜索引擎的企业数量和市场规模快速增长,到2006年,市场规模可达到24亿元,增长速度很快。其中,面向行业的垂直搜索目前正在逐步引起业界的重视,相比而言,垂直搜索也更容易与中文语言处理技术互相促进,共同发展。因为垂直搜索,可以把中文语言理解技术限定到特定领域,有针对性地去理解用户的需求。

  产业发展的商机已经势不可挡,从国家战略来看,中文信息处理产业也是符合国家中长期规划提出的科技发展的指导方针“自主创新、重点跨越、支撑发展和引领未来”。正是在这样天时、地利、人和的条件之下,中文信息产业作为“中国信息产业中为数不多的、跨国企业未能垄断、而民族企业的技术水平与国际先进水平相当的领域之一”,发展适逢其时。

产、学、研通道建设

  尽管产业机遇当前,但是问题不容忽视。郑方教授指出,在一些科研活动和市场活动中我们发现,中文信息处理面临着自主创新成果和产业开发之间的严重脱节。一方面,一些科研成果缺少产业化的考虑,好多教授、专家在大学、研究所做的一些成果追求的是高、精、深,追求的是学术水平,但是往往脱离产业需求;另一个方面,企业缺乏创新能力。更重要的是,科研机构与企业之间缺乏沟通的渠道与机制。“国家在中长期规划里面讲的‘以企业为主体的自主创新’,这不应该仅仅停留在口号上,我们必须有一种机制有一种渠道来做保证。很显然,产、学、研的通道就是最好的一个实现途径。”郑方说。

  国际中文语言资源联盟的成立,就是为科研机构和企业之间提供一个无缝的交流和合作的平台。作为联盟理事长,郑方始终强调产学研通道建设对于中文信息处理产业发展的重要性。通过联盟内成员的合作,目前,联盟成员共同承担公安与边防领域的课题,应用于司法鉴定、技术侦查、2008年新版护照等重要领域;联盟成员合作推出了多款声纹认证加密锁;联盟成员通力合作推出了国际首创的中文互动短信服务、无线智能歌曲搜索业务、航班信息查询,为手机用户和互联网用户提供功能强大的智能信息服务,开创了智能互联网的新领域,这些产品都是已经在中国移动正式使用的。

  联盟从2004年3月成立,到2005年,数据库规模翻了一番。虽然从绝对数字上看不是很多,但语音和语言数据库的创建是非常花时间,也非常花财力、物力的,因此,实现数据库数量翻一番是得到很多联盟成员支持的结果,也是得到海淀区支持的结果。另外,目前还有3个仍在开发的巨型说话人识别数据库,这些数据库都是万人规模的。

  “未来我们要以促进标准和产业的发展作为己任,首先是中文语音交互标准工作组。联盟成员负责或参与起草的有三个标准:语音识别(参与起草)、数据库及标注(负责起草)、声纹识别(负责起草)。我们对标准的起草工作非常重视。另一方面,就是通过举办技术与应用培训、与国内及国际性的专业协会进行产业联盟等多方面的接触与交流;通过发布联盟网站,提供了联盟成员之间交流合作、资源共享、形象宣传、成果推广等,促进产业的发展。”郑方说。新的机遇等待着联盟中产学研商各方的共同努力和推进。

得意音通公司供稿 原文刊登在科学网



相关链接:
得意珠三角综合智能信息增值平台项目中标 2009-08-20
北京软件产品质量检测检验中心对《海量语音文件的目标说话人筛选系统》进行测试 2009-06-25
广东政府和清华大学举行了全面开展产学研合作协议签约仪式 2009-06-25
得意中文整句输入法V1.0开源for Windows Mobile5.0 2009-01-23
得意声纹识别VPR4.0_b20080808新版本发布 2008-08-27

相关频道:           文摘   技术_语音识别_文摘