首页 > 新闻 > 国内 >

捷通灵云语音识别助推车联网人工智能热潮

2014-06-13 16:34:18   作者:   来源:CTI论坛   评论:0  点击:


  此外,灵云语音识别(ASR)平台级产品具有功能强大、识别率高、识别速度快、SDK开发简单、开发包资源小等优势,能够实时、准确地对输入的语音进行识别。捷通华声根据不同的用户需求又将灵云语音识别系列引擎iSpeak划分为三种:

  1.iSpeak Freetalk(自由说引擎):自由说引擎又称“听写机”或“语音转写”,基本上不限定用户说话的范围、方式和内容。自由说引擎可以对整段或者是分段传入的音频进行识别,返回识别后的文本。

  2.iSpeak KeywordSpot(关键词检出引擎):关键词检出引擎可以在连续语音流中检测出是否存在某些感兴趣的关键词。在使用时,需要事先给定一个关键词列表,系统则给出识别出的关键词在语音流中出现的位置。

  3.iSpeak SpeechAnalysis(语音质检分析引擎):质检分析引擎在自由说引擎的基础上,加入了针对语音质检分析的一些额外的分析处理能力,包括话者分离、情绪检测、静音检测和语速检测等等。

  灵云语音识别上述三种引擎可以满足IVR导航系统应用的双向需求:汽车智能体系既可以通过自助化语音服务进行有效的分流、缓解驾驶人员压力,也可以通过识别结果挖掘用户需求、完善地理导航精准性和智能性,从而使汽车驾驶实现“人车合一”的高层境界享受。

  灵云智能语音:源自清华 服务全球

  捷通华声作为国内最早提供智能语音技术服务的专业化厂商,捷通华声的灵云多语种语音合成(TTS)技术早已在金融、电信、交通、能源及CTI等领域大规模应用,在高铁、民航、医院等众多领域……捷通华声的灵云语音合成技术几乎无处不在,市场占有率超过50%,服务十三亿大众大十五年之久。有了灵云语音合成技术的雄厚市场基础,灵云语音识别在国内语音市场异军突起,“能说会听”语音交互技术双剑合璧,为车载导航、智能电视、穿戴式设备等厂商提供了最完整的智能语音解决方案。

  十几年来,捷通华声始终坚持自主研究语音合成、语音识别等智能人机交互(HCI)技术,并始终在国内智能语音技术领域保持领先者地位,在为智能驾驶、智慧城市等诸多领域提供多方面的智能技术服务支持的同时,也为保证我国智能语音交互技术始终与世界发展同步做出了重要贡献。2011年,捷通华声开创性的推出了全球第一个最大、最全的智能人机交互技术开放平台 - 灵云,提供语音合成(TTS)、语音识别(ASR)、光学字符识别(OCR)、手写识别(HWR)、语义理解、机器翻译等智能人机交互(HCI)技术能力服务,并以“云 + 端”的方式向开发者全面开放。

  捷通华声在发展智能语音与灵云平台的过程中,得到了清华大学的鼎力支持。2013年,清华大学产业基金入资捷通华声,也因此确立了捷通华声与清华大学的战略合作关系。在清华大学的支持下,捷通华声开始全面实施“灵云科技 源自清华 服务全球“的战略规划,灵云智能语音识别与灵云语音合成技术产品相辅相成,不仅为智能导航、智能驾驶、信息安全等领域系统应用提供更具中国汉语言特色的智能语音交互全面解决方案,也代表智能语音机交互技术在我国智能驾驶领域应用进入全面普及的阶段。

分享到: 收藏

专题