语音识别演示及开发电路板

2002/11/28

1、简介

  RSC-300/364演示及开发用电路板是为美国Sensory公司的RSC-300/364语音识别芯片所专门设计的演示及开发用电路板,它可以用来演示Sensory的各种语音识别技术,如SD(Speaker Dependent,特定人语音识别),SI(Speaker Independen,非特定人语音识别),SV(Speaker Verification,身份识别),RP(Record & Play,录音回放)等等, 也可以用来做Sensory RSC-300/364语音识别芯片的简易开发装置。

2、演示程序说明

Speaker Dependent(SD)

  SD 演示的是Sensory的需要说话人训练语音识别模板的语音识别技术,它的特点是用户需要先对所要识别的语音命令进行训练,然后才能进行语音识别。
本程序设定用户可以依次训练32个命令, 命令无语言限制。SD有用FLASH SST 29EE020 作数据存储器和用SEEPROM 24LC32作数据存储器两个版本,前者可以对所训练的语音命令进行录音,在语音识别时用来回放确认,后者无此功能

Speaker Independent(SI)

  与SD相比,SI的最大特点是无需用户训练,它的识别依赖于Sensory所事先已经采集制作好了的语音模板,因此它的局限性较大,不仅是在语言上,还是在词汇量上,都受到一定限制,但用户使用方便。

  本程序设置了六个语音命令:record,play,erase,call,modify,skip,用FLASH SST 29EE020 作数据存储器。

Speaker Verification(SV)

  SV的最大特点就是能够识别用户的身份,与SD相比,SV与SD都需要训练,不同的是在SD方式下,某个人训练的命令,在识别时由别人来说,只要两人说得差不多,识别即可通过,而在SV方式下,某个人训练的命令,在识别时由别人来说,即使两人说得差不多,也很难通过识别,因为SV能够识别用户的身份,因此SV常被用在安全系统方面。

Record and Playback(RP)

  RP主要是演示Sensory的录音回放技术,同时它也应用了Sensory 的SI语音识别技术来选择进行录音还是回放操作。RP录音时间的长短依外接存储器的大小而定,本程序用SST29EE020(2Mbits)作为数据存储器,可以存储大约16 秒的录音。

深圳捷通公司供稿 CTI论坛编辑



相关链接:
捷通82语音识别模块产品说明书 2003-06-09
语音合成芯片情况介绍和产品设想 2003-05-06
数字可视复读机方案 2003-04-09
语音识别控制电话机方案 2003-04-04
智能早教机方案 2003-04-03

分类信息:     文摘   技术_语音识别_文摘