首页>>厂商>>语音识别与合成>>得意音通

"得意命令"SDK

2003/11/24

  "得意命令"技术是一种孤立词的自动语音识别技术,用于语音命令和控制。它要求使用者只能说使用者或设计者预先定义好的词,不能夹杂其他的词或音。适用于任何家用电器和电子设备,比如电视、计算机、汽车、音响、冷气等的声控遥控器,电话、手机或PDA上的声控人名拨号、数字录音机的声控语音检索标签、儿童玩具的声控等等。

  "得意命令"开发工具目前支持基于ADSP (Analog Devices, Inc.)芯片和Microsoft Windows系统的开发。

  基于ADSP芯片的语音命令开发工具包支持多项强大的功能:根据用户的选择,语音训练的遍数,可一遍,两遍或者三遍;每个条目的声学模型(AM)存储空间只需78 x 16 位;同时具备拒识的功能。规格如下:

  (1) 每个命令需要存储空间156字节,命令词条可达数百个,无明确限制;
  (2) 每个命令的训练可以是1遍、2遍或3遍,可由设计者或使用者确定;
  (3) 设计者可以方便地定义正确接受正确的识别结果、正确拒绝错误的识别结果两个阈值;
  (4) 识别准确率大于97%;集外命令正确拒绝率大于80%;由于拒识功能,错误率小于1%。
  应用举例:声控拨号器

  为每个人名训练一个模型,并记录一个或几个电话号码;使用时,只需要呼出人名,得意命令就可以识别出来并取得电话号码,从而产生DTMF (Dual-Tone Multi-Frequency)信号把电话号码自动拨出。

  基于Windows系统的得意命令开发工具包支持多项强大的功能:非特定人、连续语音方式、可以稍带口音的汉语普通话。规格如下:
  (1) 语音模型小,总共5MB;
  (2) 命令词条数目无明确限制,且词表可随时改变;
  (3) 设计者可以方便地定义正确接受正确的识别结果、正确拒绝错误的识别结果两个阈值;
  (4) 识别准确率大于99%;集外命令正确拒绝率大于95%;由于拒识功能,错误率小于1%。

  应用举例:Windows语音命令导航员

  使用得意命令开发工具,利用动态词表,可以口呼命令进行Windows操作,如打开文件、发邮件、修改字体等。

得意音通公司供稿 CTI论坛编辑



相关链接:
得意珠三角综合智能信息增值平台项目中标 2009-08-20
北京软件产品质量检测检验中心对《海量语音文件的目标说话人筛选系统》进行测试 2009-06-25
广东政府和清华大学举行了全面开展产学研合作协议签约仪式 2009-06-25
得意中文整句输入法V1.0开源for Windows Mobile5.0 2009-01-23
得意声纹识别VPR4.0_b20080808新版本发布 2008-08-27

分类信息:     技术_语音识别_解决方案