语音识别演示及开发电路板_语音识别

语音识别演示及开发电路板

2002/11/28

1、简介

　　RSC-300/364演示及开发用电路板是为美国Sensory公司的RSC-300/364语音识别芯片所专门设计的演示及开发用电路板，它可以用来演示Sensory的各种语音识别技术，如SD（Speaker Dependent，特定人语音识别），SI(Speaker Independen，非特定人语音识别)，SV(Speaker Verification，身份识别)，RP(Record & Play，录音回放)等等，也可以用来做Sensory RSC-300/364语音识别芯片的简易开发装置。

2、演示程序说明

Speaker Dependent（SD）

　　SD 演示的是Sensory的需要说话人训练语音识别模板的语音识别技术，它的特点是用户需要先对所要识别的语音命令进行训练，然后才能进行语音识别。
本程序设定用户可以依次训练32个命令, 命令无语言限制。SD有用FLASH SST 29EE020 作数据存储器和用SEEPROM 24LC32作数据存储器两个版本，前者可以对所训练的语音命令进行录音，在语音识别时用来回放确认，后者无此功能

Speaker Independent（SI）

　　与SD相比，SI的最大特点是无需用户训练，它的识别依赖于Sensory所事先已经采集制作好了的语音模板，因此它的局限性较大，不仅是在语言上，还是在词汇量上，都受到一定限制，但用户使用方便。

　　本程序设置了六个语音命令：record，play，erase，call，modify，skip，用FLASH SST 29EE020 作数据存储器。

Speaker Verification（SV）

　　SV的最大特点就是能够识别用户的身份，与SD相比，SV与SD都需要训练，不同的是在SD方式下，某个人训练的命令，在识别时由别人来说，只要两人说得差不多，识别即可通过，而在SV方式下，某个人训练的命令，在识别时由别人来说，即使两人说得差不多，也很难通过识别，因为SV能够识别用户的身份，因此SV常被用在安全系统方面。

Record and Playback（RP）

　　RP主要是演示Sensory的录音回放技术，同时它也应用了Sensory 的SI语音识别技术来选择进行录音还是回放操作。RP录音时间的长短依外接存储器的大小而定，本程序用SST29EE020（2Mbits）作为数据存储器，可以存储大约16 秒的录音。

深圳捷通公司供稿 CTI论坛编辑