首页>>>技术>>>语音应用>>>语音合成(TTS)  语音合成产品

语音合成技术开启后阅读时代

2008/05/14

  正当台前的明星名人纷纷从台前走进电脑屏幕背后开博走进事业第二春的时候,正当我们呼吁给孩子们一个干净良好的网络环境的时候,正当我们为究竟谁才是拥有世界上最众多网民的国家而暗暗较劲的时候,一个不一样的时代已经悄悄来临。  

  语音合成技术,作为智能计算机研究的主导方向和人机智能交互的关键技术,一直受到业界的广泛关注。据专家预测,五年内,整个中文语音市场将至少在1000亿人民币以上。面对巨大的国内语音市场,摩托罗拉、IBM、微软等国际大公司纷纷投入大量的资金进行研发,并推出自己产品。中文语音市场正面临着国际竞争的巨大压力。

  近日如火如荼的“征集n词酷宣传口号 赢取Ipod”的活动,来自一个韩国的在线词典n词酷。这个词典也是开启后阅读时代的先锋。它把语音合成技术与在线词典结合在一起,将在线词典的便利性以及功效性提升到最高,开启了无所不在的试听时代。如今,我们正在目睹和经历这样一个时代——后阅读时代。

  事件一 浏览网页不再用“看”

  利用语音合成技术让页面内容发音,这可以看做是后阅读时代的纵向化,这让阅读和浏览顿时上了一个新的高度。比如一些在线词典网站,很多网民甚至会把能不能发音这个功能作为衡量一个词典网站做的好不好,是否主流的标准;再比如新浪博客的验证码收听功能,瞬间解决了繁琐而千奇百怪令人生厌的验证码输入问题。但这项技术显然没有得到广泛和应有的应用,只被用于简短的、自主性较低的信息提取上。

  网页发声的最高境界当然是用户可以随心所欲地把任何内容转化为语音信息,但由于系统的断句提词做得还不够好,以至要实现这个愿望还有一定距离。关键在于,如何才能解决大段文字的识别与自动发音。 “n词酷”,作为第一个吃螃蟹的网站,该网站基本实现了较大段选取网页内容,中文英文发音都很地道,断句技术也做得不错。而且n词酷把这项功能作为一个名为“n词酷小助手”的插件形式,从而实现了跨网站的发音。众多用户将其应用于互联网上各种无声文字资料的学习。  

  事件二 浏览英文网站不再需要“高手”

  在我们的印象里,似乎只有社会精英和一些外语高手才放着扎堆的中文网站不去看而去点击浏览一些英文网站。因为语言门槛的存在,网络并没有像想象的那样令世界变得畅通无阻。CNN的虚假不实报道就是一个很好的例子。

  用工具去翻译其他语言的内容要比亲自去学习那种语言的简单得多,所幸,现在已经有很多工具可以实现对网页的翻译了。大家常用的任何一款翻译软件或者词典都可以实现。这方面做的比较好的有金山词霸,灵格斯等等。但如果这些具备翻译功能的工具能够和n词酷的整段发音结合起来,一定可以有很好的效果。但是开发一个完备的语音合成系统显然比开发一个整段翻译系统更困难。究竟谁才能最先抢占后阅读时代这一块蛋糕呢?我们不关心。用户最关心的当然是什么时候,这种集视听于一身的浏览工具会真正出现。

  加拿大传播学家麦克卢汉曾经有一个理论:媒介即信息。不管承载的信息内容是什么,光是一个新媒介本身的出现,就可以对人们的传播行为以及思维方式产生深远的影响。从最早的不可携带的石质重型媒介,到纸的出现,再到印刷机,收音机,电视,乃至电脑的出现,人类的文明正以爆炸式的速度增长,后媒介时代这个预言到底会不会成为现实,我们拭目以待。

eNet硅谷动力(cio.enet.com.cn)



相关链接:
有关语音自动化的十大常见误区 2008-05-06
科大讯飞总裁刘庆峰:语音市场进入爆发期 2008-01-04
身边的“智能”生活 2007-12-28
语音IM在带宽方面无需担忧 2007-12-24
科大讯飞:“语”翼畅翔CTI广阔天地 2007-08-20

分类信息:     行业_媒体_新闻