首页 > 新闻 > 专家观点 >

如何抢滩智能语音字号 打造人机智能语音交互时代

2014-06-18 09:46:14   作者:   来源:中国计算机报   评论:0  点击:


  各展所长 开放竞合

  随着谷歌、微软、IBM等IT巨头加快对智能语音领域的布局,以及Nuance在中国的本土化不断加强,国内语音企业将面临越来越大的竞争压力。相较于Nuance等国际巨头,国内语音企业在研发力量、创新能力、集成应用、行业应用拓展等方面还有不小差距。国内语音企业间的合作、并购、整合步伐也相对要缓慢一些。

  对于国内语音企业的发展,作为行业专家的李德升给出了他的见解和建议。他认为,在传统语音技术厂商中,科大讯飞的实力有目共睹,而捷通华声的语音合成在铁路交通、金融电信等领域也有较高的市场占有率,很多高铁、公交站等的报站语音是捷通华声做的。对于这类厂商,李德升给出的建议是得专注于语音,引入互联网思维,真正做大做强。对于百度、腾讯、搜狗等互联网厂商做语音,李德升认为他们具有最丰富的互联网语音资源,更重要的是他们有技术实力、有用户、有互联网思维,这些厂商最有可能可以和国外竞争者一较高下。而对于第三类语音创业企业,李德升的建议是尽量采取合作方式,与互联网厂商合作,专注于特定行业领域积累实力,既不能小富即安,也不能贪高大上,只要积极进取,踏实经营,还是有非常大的成长空间的。

  “其实,以苹果为代表的软硬件一体化厂商做语音是为了卖硬件产品,互联网厂商大多是从帮助用户搜索的角度做语音,相对于创业型的语音企业,科大讯飞的优势就在于语音的宽度和厚度积累,优势就在于多年来对语音识别、语音合成、语音评测与语义理解各方面立体的投入和研究,目前拥有全方位立体的语音技术产品。”江涛说,在语音推广方面,科大讯飞坚持两条腿走路:一是坚持移动互联网能力开发,一是通信、教育和安全等重点行业推进。逐步拓展移动互联网能力的三驾马车是手机、汽车和智能电视。目前科大讯飞手机语音已经有四亿的用户,每天活跃用户达四千多万。在教育领域,科大讯飞的语音合成、语音评测在广东高考英语口语考试,西部中小学的英语教具和日常教学中已经发挥很大作用;而在安全领域,公安部第一个跟企业合办的部级重点实验室—公安部声纹实验室就设在科大讯飞。

  江涛也坦言,相较于百度等互联网巨头做语音,传统语音技术厂商确实存在一些劣势,“在整个大的开发平台、云存储、位置服务和构建整个生态系统方面,互联网公司确实值得我们学习。我们还是要专心做好自己所长,聚焦在语音和语义方面,真正做好开发者服务,基于语音和语义构建生态系统,尝试推广人机交互广告等。”

  “互联网巨头要拥有语音这个技术,不被别人卡住喉咙,但他们有自己的主业,不会放太多精力在语音上。”张连毅如此判断,“语音技术厂商只要做好自己的技术和产品,保持开放合作就能获得良好的发展。”除了夯实智能语音市场,捷通华声更要做的是实现包括智能语音、图像识别(OCR)、生物特征识别在内的全方位的人机智能交互。

  说到与其他厂商的竞争,云知声并不担心。干净环境下朗读语音的识别早已不是问题,特殊场景应用大幅提升,语音市场未来潜力巨大。黄伟认为,语音这个市场足够大,找准各自细分的目标市场,只要各自做得好,都能分到自己那杯羹,生存发展的机会很大。云知声除了做金融等行业应用推广,主要聚焦在视频和车载领域。而对于全智能交互,云知声的策略是连横—联合多家创业公司,包括语义理解技术公司哦啦、图像识别技术公司亮风台、人脸识别技术公司Face++成立了全智能交互联盟,将语音、图像、人脸交互方案打包,期待不同的交互技术发生化学反应,用做乘法代替做加法,为用户打造最佳的全智能交互体验。除此之外,云知声仍将专注于云(移动应用、呼叫中心、在线教育)、端(智能终端包括智能家电、可穿戴设别、智能车载等)、芯(智能芯片)领域的智能语音推广与应用。

  的确,这是一个蓬勃向上的时代,也是一个不进则退的时代。中国语音技术企业只要抱定“以针破天”的信念,专注坚持,踏实积累,把握机遇,就能鲲鹏击浪,展翅怒飞,扶摇直上九万里。加油吧,中国智能语音。

  百度语音SDK功能特点

  • 微工作量就可以开发出连接

  百度语音服务的客户端应用

  • 支持Android和iOS平台SDK
  • 针对场景深度优化
  • 针对领域优化,使垂直类应用

  有更好的识别效果

  • 用户定制化识别
  • 自动端点断点检测和数据传输,极致优化流量消耗
  • 丰富可配置的UI组件
  • 提供底层API,使用方式更加 灵活强大
分享到: 收藏

专题