"得意命令"SDK_语音识别

"得意命令"SDK

2003/11/24

　　"得意命令"技术是一种孤立词的自动语音识别技术，用于语音命令和控制。它要求使用者只能说使用者或设计者预先定义好的词，不能夹杂其他的词或音。适用于任何家用电器和电子设备，比如电视、计算机、汽车、音响、冷气等的声控遥控器，电话、手机或PDA上的声控人名拨号、数字录音机的声控语音检索标签、儿童玩具的声控等等。

　　"得意命令"开发工具目前支持基于ADSP (Analog Devices, Inc.)芯片和Microsoft Windows系统的开发。

　　基于ADSP芯片的语音命令开发工具包支持多项强大的功能：根据用户的选择，语音训练的遍数，可一遍，两遍或者三遍；每个条目的声学模型（AM）存储空间只需78 x 16 位；同时具备拒识的功能。规格如下：

　　（1）每个命令需要存储空间156字节，命令词条可达数百个，无明确限制；
　　（2）每个命令的训练可以是1遍、2遍或3遍，可由设计者或使用者确定；
　　（3）设计者可以方便地定义正确接受正确的识别结果、正确拒绝错误的识别结果两个阈值；
　　（4）识别准确率大于97％；集外命令正确拒绝率大于80％；由于拒识功能，错误率小于1％。
　　应用举例：声控拨号器

　　为每个人名训练一个模型，并记录一个或几个电话号码；使用时，只需要呼出人名，得意命令就可以识别出来并取得电话号码，从而产生DTMF (Dual-Tone Multi-Frequency)信号把电话号码自动拨出。

　　基于Windows系统的得意命令开发工具包支持多项强大的功能：非特定人、连续语音方式、可以稍带口音的汉语普通话。规格如下：
　　（1）语音模型小，总共5MB；
　　（2）命令词条数目无明确限制，且词表可随时改变；
　　（3）设计者可以方便地定义正确接受正确的识别结果、正确拒绝错误的识别结果两个阈值；
　　（4）识别准确率大于99％；集外命令正确拒绝率大于95％；由于拒识功能，错误率小于1％。

　　应用举例：Windows语音命令导航员

　　使用得意命令开发工具，利用动态词表，可以口呼命令进行Windows操作，如打开文件、发邮件、修改字体等。

得意音通公司供稿 CTI论坛编辑