首页 > 新闻 > 国内 >

灵云语音识别(ASR)

2013-10-18 09:46:30   作者:   来源:CTI论坛   评论:0  点击:


  语音识别,就是让机器通过分析和理解过程把语音信号转变为相应的文本或命令的尖端技术。语音识别是一门交叉学科,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术与语音合成技术一同成为实现人机语音通信,建立有听和讲能力的语音系统所必需的两项关键技术。

  捷通华声ASR核心引擎是针对特定语言的识别软件模块,该软件模块是整个ASR软件的核心模块。核心模块接收其他模块的设置,并根据设置内容对语音数据进行识别,并将识别结果列表返回给调用模块。返回的识别结果列表,包含一组识别结果--识别信心值对,以供调用模块使用。

\

  捷通华声ASR语音识别技术具有以下特点:

  • 支持语种:广泛支持中英文识别;
  • 识别率:高针对汉语普通话,连续语音识别率可以达到90%以上,支持语音打断功能与端点检测功能;
  • 识别速度:采用实时识别方式,实现语音数据的传输和识别的同步,实时率可达0.5以下。
  • 可定制:定制模型的识别率可达到95%以上
  • 词表长度:大词表长度可达到百万以上(可根据需要扩展);
  • 音频格式:用于进行语音识别的输入语音格式为:16K*8Bit A-Law、16K*8 Bit u-Law、16K*16 Bit PCM;
  • 识别方式:支持词表识别、语法识别和自由说识别。
  • 语法功能:可以在加载多个语法文件的情况下,同时激活多个语法文件,读取单个词条,从多个语法文件中得出单个词条的识别结果。
  • 支持云端识别和本地端识别。
分享到: 收藏

专题