首页 > 新闻 > 国内 >

中国智能语音市场竞争格局分析

2013-12-31 14:42:53   作者:   来源:CTI论坛   评论:0  点击:


  智能语音技术是人工智能的研究领域之一,其原理涉及声学、语言学、数字信号处理、计算机科学等多个学科,研究周期长、投入成本大,技术壁垒高,全球和中国语音市场基本形成寡头垄断格局。随着智能语音产业的快速发展,产业竞争进一步加剧,吸引IT巨头和中小创业团队争相进入,和传统语音技术提供商共同角逐智能语音市场。

  一、基本形成寡头垄断格局

  就全球市场而言,谷歌、苹果等IT巨头的强势进入,加上传统语音技术厂商长期的技术和用户积累,市场基本上形成了寡头垄断格局。2012年,Nuance、谷歌、微软、苹果、IBM、科大讯飞五家龙头企业占据超过95.0%的市场份额。其中,Nuance自2005年与ScanSoft公司合并后,成为全球最大的语音技术厂商,凭借自身先进的语音识别、自然语言理解技术以及优秀的语音解决方案,占有全球62.0%的语音市场。截至2012年底,其在全球拥有超过100家分公司或办事处,业务覆盖美国、英国、澳大利亚、奥地利、加拿大、德国、印度、中国等30多个国家和地区,业务涉及医疗保健、手机及消费者、企业服务等多个领域。谷歌凭借搜索方面的优势,通过对智能语音技术的持续大规模投入,将其应用在移动搜索、可穿戴设备等领域,后来居上,占据18.9%的市场份额。微软作为较早从事智能语音技术研究的企业,其语音服务器在政府、金融、医疗、制造业等领域均得到应用。近年来,微软将其语音技术在游戏、即时翻译、Windows Phone等产品中推广应用,市场份额不断扩大,达到6.6%。苹果长期以来致力于智能语音技术研发及其在电子终端上的应用和推广,早在1984年就推出了第一台会说话的计算机Macintosh,于2010年收购Siri,2011年推出了内置语音助手软件Siri的iPhone 4s,成功掀起了智能语音产业热潮。2012年,苹果凭借Siri迅速抢占全球智能语音市场,占据近4.2%的市场份额。IBM是最早进入语音领域的企业之一,通过在语音识别和机器翻译产品方面的持续发力,占据超过4.0%的市场份额。科大讯飞作为中文智能语音的引领者,占据全球约3.2%的市场份额。

中国智能语音市场竞争格局分析
图1  2012年全球智能语音企业市场份额
资料来源:工业和信息化部电子科学技术情报研究所

  在中国智能语音市场,鉴于中国传统文化和中文的特殊性,且得益于国内科研院所、企业扎实的研究基础,中文智能语音技术处于国际领先水平,形成了一批优秀智能语音企业,提供面向多领域、全行业的智能语音技术及服务,核心技术包括语音合成、语音识别、语义理解、声纹识别等多个方面,业务涉及移动互联网、智能家电、智能客服等多个领域,覆盖教育、汽车、金融、医疗等多个行业,以科大讯飞、百度、Nuance、捷通华声为代表的寡头垄断格局基本形成。其中科大讯飞凭借多年的技术和用户积累,以54.3%的市场份额稳居行业龙头的位置。百度凭借在互联网领域的优势,后来居上,成功在智能语音市场占据了重要位置,市场份额达到13.0%。百度自2010年进入智能语音领域以来,其语音搜索用户已经占据其移动搜索用户的1/10。苹果凭借Siri与iPhone系列产品的绑定销售,占据中国约11.7%的市场份额。Nuance凭借其雄厚的技术实力和强大的市场拓展能力,以5.4%的市场份额在中国市场仍占据一席之地,但其市场份额已经出现一定下滑,这主要是受制于中文智能语音的技术门槛。目前其在中国的主要市场为移动互联网和车载市场。如为苹果Siri提供技术支持,以及为宝马、奔驰等进口汽车厂商提供智能语音技术支持。但其在呼叫中心等传统领域的市场份额大幅下降,目前主要依靠华为、思科等硬件厂商仍占有少量份额。捷通华声、中科信利、中科模识作为行业的先行军,凭借其雄厚的技术背景,继续在智能语音市场占据重要位置。

中国智能语音市场竞争格局分析
图2  2012年中国智能语音市场份额
资料来源:工业和信息化部电子科学技术情报研究所

  二、传统技术企业依托科研院所仍居主导地位

  以学带研、以研促产、产学研用密切结合是智能语音产业发展最为典型的特点。作为科研驱动型行业,智能语音技术研究最早起源于贝尔实验室,斯坦福、卡内基梅隆等学校的研究为智能语音产业发展奠定了坚实的基础,苹果Siri的雏形便是源自于斯坦福研究院联合麻省理工学院、卡内基梅隆大学等多家机构承担的美国国防高级研究计划局(DARPA)的CALO项目。Nuance也是源于斯坦福研究院的STAR实验室。

  在中文智能语音市场,基本形成了基础研究与产业应用协同发展的局面。围绕科研院所形成的传统技术厂商呈现高度集聚发展的特性,依托科研院所的技术优势,他们在行业中仍居主导地位。以中国科学院声学所、中国科学院自动化所、中国科技大学、清华大学、北京大学、社科院语言所为代表的科研院所作为最早从事智能语音及相关技术的研究机构,长期以来专注于语音理论研究和技术研发,形成了领先的中文智能语音技术体系。一方面,他们自己成立智能语音控股公司,形成了真正的产学研一体化,如中科院自动化所的中科模识、中科院声学所的中科信利、清华大学的得意音通。另一方面,他们与企业结成了广泛的合作关系,为其提供技术支持,如百度与中科院声学所在2010年初就联合成立了百度—中科院声学所联合实验室。另外,这些科研院所培养出来的人才也逐渐成为技术领军人才,成为产业发展的中流砥柱。

中国智能语音市场竞争格局分析
图3 主要传统语音技术企业及其支撑科研院所
资料来源:工业和信息化部电子科学技术情报研究整理

  2010年,科大讯飞推出语音云服务,并凭借在语音识别和语音合成及行业应用等方面深度的积累,2012年收入7.8亿元,其中语音及相关业务收入超过5.3亿元,合作伙伴超过2000家,语音云用户超过3亿。捷通华声、中科信利、中科模识等企业具有在语音领域多年的技术和用户积累,是智能语音产业的中坚力量。捷通华声是最早成立的智能语音企业之一,凭借其在语音合成、手写识别等智能人机交互技术方面的优势,与三大运营商、华为、中兴等多家企业达成合作,业务领域覆盖金融、电信、航空等多个领域。中科模识是中科院自动化所的经济实体,自动化所依靠模式识别国家重点实验室,在语音识别领域具有近30年的研究历史。目前有各类研发人员近100多人,研究范围涉及语音识别、语音合成、对话管理和理解、多语言翻译等。中科信利是中科院声学所的经济实体,声学所是中国声学研究的奠基单位之一。公司目前拥有研发队伍130余人、授权发明专利42个。公司长期专注语音识别研究,注重研究与实用相结合,除与百度合作之外,还通过把语音技术授权给腾讯、阿里巴巴、YY语音、UCweb、联想、长虹、步步高、诺亚舟、索贝、大洋等客户,其语音技术服务的用户群体迅速扩大。

  三、IT巨头强势进入抢占语音信息流入口

  伴随着智能语音发展的热潮,通过主导智能语音技术服务而拥有信息技术应用和语音信息流的关键入口成为IT企业竞争的热点和焦点。近年来,以谷歌、苹果、微软、百度、腾讯、搜狗为代表的IT巨头纷纷通过自主研发和合作研发推出自己的语音产品,加大对语音市场的争夺。

  谷歌通过在语音领域的大力投入,以及其强大的知识图谱和用户积累,在语音市场占据重要位置,并率先掌握了全球语音信息流入口。截至目前,其智能语音技术在输入法、语音控制、翻译、网页搜索等应用中进行了深度整合,于2010、2011、2012年相继推出支持语音搜索等功能的Voice Action,Google Now、Google Search、谷歌眼镜等产品,并开放了语音识别的API供开发者使用,在最新推出的Moto X中内置了随时待命的语音助理。苹果在2011年10月将语音助手Siri作为iPhone 4S的核心功能推出,力图掌握移动互联网信息流入口。2013年8月,苹果成立自己的语音小组,试图摆脱对Nuance语音技术的依赖,代表其正式进军智能语音行业。微软将智能语音技术与Windows操作系统和Windows Phone系统结合,把语音交互作为其核心交互模式,试图将对信息技术应用和语音信息流入口掌控从桌面延伸到移动互联网领域。同时,微软实时语音翻译软件已具雏形,可实现26种语言互译,这为其抢占全球语音市场占得先机。

  国内如百度、搜狗、腾讯等IT巨头先后涉足智能语音领域,并先后推出自己产品,力争抢得智能语音信息流入口先机。百度2010年开始进行智能语音及相关技术研发,凭借其强大用户积累,用户规模迅速扩大。2010年9月,百度基于中科院声学所语音识别技术在国内推出了第一个基于云端识别的移动互联网应用--“掌上百度”,拉开了移动互联网语音应用的序幕。2012年12月,百度推出自主研发的语音助手,截止到2013年6月,其语音搜索用户已占其移动搜索总用户的1/10。2013年8月,百度正式宣布将向开发者开放语音生态系统,此次的开放分三个层次,一是最底层的语音识别技术应用程序编程接口(API)的开放,包括合成技术、理解技术、认证技术、指纹技术等,开发者可以调用API实现语音识别功能。二是百度语音助手软件开发工具包(SDK)开放,向开发者提供开发工具包,实际上是对语音识别标准化服务进行封装,识别结果做关键词抽取,搜索结果进行结构化数据返回,最终对接服务和应用。第三层的开放主要面向能力弱的开发者,将百度语音助手直接安装在硬件上即可使用。9月,百度与三星达成合作,将其语音助手内置在智能手表Galaxy Gear上,为其进入智能穿戴设备领域奠定了基础。搜狗于2012年12月正式推出语音助手,成为国内第一家涉足移动智能语音服务领域的搜索厂商。2013年2月,搜狗语音助手联合微信开发首款微信语音应用——搜狗语音助手微信版。9月,搜狗语音助手接入搜狗知立方数据。2013年8月,腾讯为进一步提升用户体验水平和数据资源整合,在微信5.0中增加语音输入功能,其语音团队打造的语音技术成果正式亮相。随后,网易联合中国电信推出易信,强大的语音功能和优质的效果成为其主要卖点之一。

  四、中小创业团队凭技术和产品创新快速成长

  中小创业团队借智能语音东风趁势而起,以云知声、紫冬锐意、光年无限、聚熵智能为代表的创业团队凭借其较强的技术和产品创新优势迅速成长,并逐渐在市场中占据重要位置,发展潜力较大。其中,云知声作为智能语音领域的新锐企业快速成长,依托强大的语音识别和自然语言理解技术,仅一年就推出了自己的语音产品和语音云平台,与搜狗、乐视等1000多家企业展开合作,业务遍及移动互联网、车载、智能电视等多个领域。紫冬锐意以中国科学院自动化研究所技术为背景,2012年发布国内首个集成中英文语音识别、中英文语音合成、多语言翻译技术的“紫冬语音云平台”,同时发布国内首款基于云识别的同声翻译软件——紫冬口译。聚熵智能、光年无限等企业专注于自然语言理解技术和产品创新,通过与科大讯飞等传统语音企业的合作,迅速抢占市场,已经在智能语音领域占据重要位置。据易观数据,截止2013年5月27日,虫洞语音助手、智能360的累计下载量已分别达到1325.3万、1117.3万。

分享到: 收藏

专题