语音识别演示及开发电路板
2002/11/28
1、简介
RSC-300/364演示及开发用电路板是为美国Sensory公司的RSC-300/364语音识别芯片所专门设计的演示及开发用电路板,它可以用来演示Sensory的各种语音识别技术,如SD(Speaker Dependent,特定人语音识别),SI(Speaker Independen,非特定人语音识别),SV(Speaker Verification,身份识别),RP(Record & Play,录音回放)等等, 也可以用来做Sensory RSC-300/364语音识别芯片的简易开发装置。
2、演示程序说明
Speaker Dependent(SD)
SD 演示的是Sensory的需要说话人训练语音识别模板的语音识别技术,它的特点是用户需要先对所要识别的语音命令进行训练,然后才能进行语音识别。
本程序设定用户可以依次训练32个命令, 命令无语言限制。SD有用FLASH SST 29EE020 作数据存储器和用SEEPROM 24LC32作数据存储器两个版本,前者可以对所训练的语音命令进行录音,在语音识别时用来回放确认,后者无此功能
Speaker Independent(SI)
与SD相比,SI的最大特点是无需用户训练,它的识别依赖于Sensory所事先已经采集制作好了的语音模板,因此它的局限性较大,不仅是在语言上,还是在词汇量上,都受到一定限制,但用户使用方便。
本程序设置了六个语音命令:record,play,erase,call,modify,skip,用FLASH SST 29EE020 作数据存储器。
Speaker Verification(SV)
SV的最大特点就是能够识别用户的身份,与SD相比,SV与SD都需要训练,不同的是在SD方式下,某个人训练的命令,在识别时由别人来说,只要两人说得差不多,识别即可通过,而在SV方式下,某个人训练的命令,在识别时由别人来说,即使两人说得差不多,也很难通过识别,因为SV能够识别用户的身份,因此SV常被用在安全系统方面。
Record and Playback(RP)
RP主要是演示Sensory的录音回放技术,同时它也应用了Sensory 的SI语音识别技术来选择进行录音还是回放操作。RP录音时间的长短依外接存储器的大小而定,本程序用SST29EE020(2Mbits)作为数据存储器,可以存储大约16 秒的录音。
深圳捷通公司供稿 CTI论坛编辑
相关链接:
捷通82语音识别模块产品说明书
2003-06-09
语音合成芯片情况介绍和产品设想
2003-05-06
数字可视复读机方案
2003-04-09
语音识别控制电话机方案
2003-04-04
智能早教机方案
2003-04-03
分类信息:
文摘
技术_语音识别_文摘