首页>>厂商>>语音识别与合成>>科大讯飞

科大讯飞构筑语音技术领域的核心竞争优势

2003/09/19

  作为语音关键技术的语音合成又称"文语转换",即TTS(Text To Speech),就是让计算机把文字"朗读"出来。语音合成技术追求的目标是计算机输出的"合成语音"清晰、可懂、自然、具有丰富的表现力。

  前景广阔引来"群雄逐鹿"

  语音技术的广泛应用,是市场需求发展和深入的必然。

  作为智能计算机研究的主导方向和人机语音通信的关键技术,语音技术一直受到各国科学界的广泛关注。同时,作为当今迅猛发展的电子商务最重要的"推进器"之一,随着互联网与移动计算技术的发展,语音技术在过去的几年中,已经取得了很大的进展,应用越来越广泛。据预测,2006年语音技术市场仅在美国就将达到300亿美元的规模。

  这其中,作为整个语音技术市场的重要组成部分,语音合成技术对社会生活的重要性更是日益凸现出来。以语音合成技术开发出的计算机应用软件产品,几乎深入到社会的每个行业、每个方面,其应用和经济社会效益前景非常良好。尤其对于汉语语音合成技术应用而言,面对有十几亿人的泱泱中华大国,其市场需求、应用前景和经济效益等等都可见一斑。据专家预测,未来几年内,语音合成技术的应用将遍及所有与IT相关的产业,其国内的市场价值,将达到几十亿甚至上百亿元。然而,在1998年以前,仅将研究成果束于实验室的"高阁"、缺乏产业化领导厂商的国内语音技术市场却只能基本由国外厂商占据。据了解,在中国开拓语音技术市场的国外"群雄"包括Microsoft、IBM、Intel、Motolora、Philips、Lucent等一批IT业的巨头。

  然而,值得欣喜的是,随着以科大讯飞为代表的拥有自主核心技术、注重产业化和市场应用的本土专业语音技术提供商长期不懈的努力拼搏,逐步在中文语音市场占据了主力军的领先地位。

  应用为本,创新为先

  早在上世纪80年代初,我国就开始以国家重点研究项目资助的形式发展中文语音和语言技术的研究。中国科技大学"人机语音通信实验室"作为最早研究中文语音合成技术的机构,在这一领域的创新研究成果脱颖而出。但这一阶段技术的发展还停留在实验室的研究阶段,中文语音技术还未能形成产业化。

  通过语音合成技术自动将文本信息转换为清晰流畅的自然语音,有利于人们以最便捷、最经济的方式,随时随地获取所需信息。正如语言因交流而体现其生命力一样,语音合成技术生来就具备与应用相结合的特点,在其产生、发展的过程中,失去了应用,其价值也就无从体现。

  科技需要创新,但只有从"应用"出发,才能真正促进发展,持续创新。

  为建立将领先的创新语音技术研究成果实施产业化的平台,1999年6月9日,中国科技大学人机语音通信实验室年轻的语音技术专家,现任科大讯飞公司总裁的刘庆峰,出于对中文语音产业广阔前景的看好和对民族语音产业化迫切性的认识,带领创业团队成立了中科大讯飞信息科技有限公司。中文语音合成技术,也随之走向由技术研究向应用创新发展的新历程。

  在科大讯飞的产业化道路中,一开始从要求最高的重点行业应用需求入手,进行产品的定位和功能架构设计。自80年代中期开始基础研究以来,科大讯飞每一次技术的进步都标志着中文语音技术一个全新里程碑的到来,而市场需求毫无例外的成为技术与产品提升的源动力。1999年推出产品至今,目前使用科大讯飞语音平台产品的开发商合作伙伴近500家,实际应用案例超过3000个,在国内语音市场的占有率已达80%以上,每天有上万线的语音合成在提供服务,应用遍及金融、电信、邮政、电力、政府和企业等等各个重要行业和领域。

  "应用为本,创新为先",科大讯飞以其自身的产业化实践,展示了我国中文语音技术走出实验室,面向应用,不断追求技术创新,走向产业化发展的进程。

  良性竞争,构筑民族语音产业核心竞争力

  与信息产业的其它领域一样,国内厂商持续领导和推动中文语音技术市场的前进,需要构筑自身的核心竞争力,即围绕基础研究、核心技术、市场需求、产品开发和应用实践等所有重要方面展开,在此过程中,一切浮躁的短视行为都无助于积累企业自身的核心优势,终将遭遇后继乏力的尴尬境地。

  科大讯飞深刻的理解到构筑核心竞争力对企业长续发展具有重大的战略意义,自成立之初就从各个方面来加以保障。在核心技术的研究与发展方面,成立基础研究中心专门进行技术前沿的探索。为了把握语音技术研究的源头优势,科大讯飞与国内语音技术领域积累最深厚、最具优势互补的科研院所:中国科技大学、中科院声学所和社科院语言所先后建立联合实验室,通过创新的机制,使得合作伙伴各展所长,专注于其擅长的研究,研究成果由科大讯飞统一实施产业化,将语音研究领域的局部优势转化为中文语音技术的整体优势。

  除了持续巩固与扩大在中文语音技术研究上的领先优势之外,科大讯飞在多语种方面成果同样突出。中英文混读语音合成系统适应于中文、英文和越来越多出现的中英文混杂在一起的各种复杂语言环境。而新近推出的广东话语音合成系统则适应了以粤港地区为代表的广东话区域的语音应用需求。

  汉语是世界上最为复杂的语言,在不同的行业、不同的应用领域都有自身的显著特点。科大讯飞针对行业应用的具体特点,对重要领域,如电信、金融、政府等重点关注,在产品方面满足各个重点行业实际应用的要求,体现出最好的效果。而这些需要合理的架构、广泛的知识获取途径、充分的资源储备以及专业的人员、成熟的方法和完善的工具来保障。科大讯飞的整体实力和技术能力使之成为可能。

  为了使领先的技术和成熟的产品真正贴近实际应用,还需要完善的支持和服务体系来支撑。科大讯飞为此建立起技术精干的专业技术服务团队,以标准规范的形式,结合自身在语音应用方面的深厚积累,努力提供周到的服务,不断地向客户提供围绕语音应用全过程的完整支持与服务,使用户能够在竞争的环境下获得成功。

  作为国内的专业语音技术提供商,科大讯飞更多是把自己看作中文语音技术的拓荒者,相比国际IT业的巨头,科大讯飞的产业化之路还刚刚起步,立志于构筑参与国际竞争的核心优势,科大讯飞任重道远。

  随着语音技术水平的不断提高,语音技术在中国地区的应用也日益广泛。如今,科大讯飞不仅在各行业树立了为数众多的成功案例,而且在语音应用方面积累了深厚的经验。"应用为本,创新为先",科大讯飞作为领先语音技术厂商将持续构筑中文语音技术领域的核心竞争优势,倡导良性的市场竞争环境,与产业共成长。

ChinaByte(e.chinabyte.com)


相关链接:
讯飞畅言语音教具系统荣获“创新软件产品” 2009-09-08
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
“会说话”的显示屏提升居民小区信息服务水平 2009-09-07
讯飞语音助力太平人寿客服中心 2009-08-28
讯飞语音助力CDMA手机竞争终端市场 2009-08-14

分类信息:     文摘   技术_语音合成_文摘