"多功能电话机普通话语音识别模块"项目书

赵大有 2002/12/05

  据信息产业部(www.mii.gov.cn)统计公报的数据表明:我国固定电话机近年来一直是增长态势,继2000年历史发展最高记录以来,2001年已达1.804亿万户,一年新增用户3000多万户,其中城市用户11228万户,新增2000万户,农村用户6811万户,新增1630万户,2002年截止到6月末,全国固定电话用户总数为1.98亿,半年新增1991万户。

  我国电话机产量约占世界总数的一半以上,并向世界81个国家和地区出口,其中向美国出口最多,约占美国电话机市场的2/3,其次是香港,日本,德国,新加坡,韩国,英国等国家。据行业估计,2001年全国电话机总产量为6000万台左右。

  1994年国家全面开发电信市场之前属于电话机行业的"垄断时代"(几大品牌借力于邮电部门,垄断了90%以上的市场),之后进入"自由竞争时代"(各生产厂家在商业市场自由角逐);自99年以来,国内电话机行业进入"品牌时代"。电话机行业从未像今天这样引人关注,以前的VCD/DVD企业,以及家电行业的巨头,甚至一些著名的外国名牌(西门子、索尼)也向电话机市场迈进一只脚。经过"价格战" "广告战" "服务战",目前电话机制造行业已趋于冷静和成熟,具有高科技含量的,含有较高附加值功能且价格合适的多功能智能话机成为"美味享受"。

  据此,开发多功能电话机普通话语音识别模块,就具有很大的市场价值。

一、 项目功能

1、 普通电话机功能(含来电显示)
2、 语音提示
3、 语音拔号
4、 四种音乐(MIDI)振铃选择
5、 定时录音(25秒左右)
6、 来电、去电信息保护 (掉电不丢失)
7、 语音电话号码薄
8、 远程遥控查询
9、 语音密码
10、 来电报号码及报人名

注:以上除第1项外,2-10项可由客户灵活选择选用。

二、 电路框图


三、 行业中同类各方案比较

  具有语音识别功能的电话机,近年在国内、外皆有开发,但市场上未能成气候。

  1、 一种是其于DSP(数字信号外理器)的电话机,其功能足够强大,性能不可谓不好,但价格太昂贵成了其致命弱点,此类电话机少则¥500-600,多则上千元。(如中科模式方案,清华大学方案)。近期此类产品不可能有太大市场,国内生产制造商大多不会感兴趣。

  2、 另一种是其于语音识别芯片的电话机,这种系统成本相对较低,国内曾有两个电话机厂家(高科、天时达)试产过几千台(1999-2000年),之后亦再无生产。主要原因是,当时的识别效果不够理想,功能单一,市场卖点不多。试想,仅仅为了加入一项语音拨号功能,就必须增加近人民币100元之成本,有哪个电话机厂会真正有兴趣呢?TCL也只是在高交会上展出了样机,之后亦未有动作。

  因此,语音识别技术在电话机行业之推广,遭遇了一个艰难的过程,似乎大多生产厂家皆"谈虎色变",避而远之。

  但是,我公司之语音识别电话机模块,克服了以上两种不利情况。我公司认真进行了大量周密的市场调查,以"在适当增加成本的前提下,增加具有附加值的实用流行功能"为指导思想,利用当今世界最先进语音识别芯片,并相应选择最合适的电话控制芯片,形成了一套目前最优化的多功能电话语音识别模块方案,具有丰富的市场切入点和较高市场价值,并且在未来亦有强大的竞争能力。

四、 重要特性分析

  1、 语音拨号及语音提示

几年前即开始流行的语音电话机市场,现仍十分巨大,随着产量逐渐加大,语音IC价格已从每套人民币17-18降至人民币5元。但语音提示电话机不多,这块市场基本空白。此模块所使用的语音识别芯片,本身具有语音合成功能,因此无需另外增加任何硬件成本,即可实现语音提示功能。而对于语音拨号功能,其实用性已无须多说,用户最关心的是其识别的准确度,此模块之一次识别准确率可达95%,工作准确率为100%。(联想,乔兴,步步高已对我公司语音识别通用模块识别精度给予认证。)

  2、 四种音乐选择振铃

  电话机市场在每一阶段都有一两个之流行功能。三年前开始出现来电显示(现在成为电话机的基本功能),2001年是流行来电报号,今年以来,短信息电话和MIDI电话机开始流行。(成电新公司50K芯片已被一次性预定完。)现市场出现之MIDI电话机需另增加一0.3美元之芯片,而此系统中之语音识别芯片亦已含4个MIDI音乐,无需另增加硬件成本。

  3、 通话实时录音功能

  我们常常遇到以下情况:电话中对方告诉你一个电话号码,或一次约会的时间地点,而你必须记录下但手边没有纸和笔,这时,20-30秒之实时录音即会十分方便。录音电话机的种类有三种:留言电话机,电话录音机和自动应答机,后一种是前两种之结合,目前最为流行。目前答录机的录音时间都在15分钟以上,无论是用磁带或数码录音,成本都较高,近期有电话机厂家生产了一种短时间录音电话(20秒),不过用了一颗1.5美金的芯片,市场反馈意见是成本太高。此模块系统中已经包含有2M(或4M)的FLASH存储芯片,即可实现20-30S的录音,也无需另加硬件成本。

  4、 来电/去电信息保护

  现在市场上电话机,许多都带有来电/去电查询,但一断电即丢失信息。此模块利用了系统中之非挥发性存储器(ROM),可使此信息在断电时不丢失。

  5、 语音电话号码薄/遥控远程查询/来电报姓名

  现有电话机之电话号码薄,输入姓名不方便,此模块实现了用语音输入姓名 ;若是出差在外,想查询一个好朋友的电话号码,只需打个电话、报出姓名即可;现在来电报号正十分流行,若来电属于语音号码薄之一,则连姓名也可以报出。试想,若是老板来电,你总不能睡意朦胧去接电话吧!

  6、 语音密码防盗打功能

  利用语音识别技术之身份识别技术,给你的电话加上一个语音密码,〈例:芝麻开门〉,真是方便实用又有趣。

五、 技术水平分析

  本模块由我公司与深圳成电新公司(见附页:成电新公司简介)合作开发。

  1、 技术之先进性:本模块采用了当今世界性价比最优的语音识别芯片。(美国SENSORY公司的RSC300芯片,WWW.SENSORYINC.COM)

  2、 技术之适用性

  本模块采用的语音识别及其相关技术适合我国目前电话机市场的发展阶段,是一项适用技术。

  3、 技术之可行性

  经过国外市场5-6年之试验认证,本模块采用之所有技术已经成熟和稳定,亦无任何专利限制问题。

  4、 技术之经济性和合理性

  本模块投入--产出关系合理,能够获得好的经济利益,而且适合公司规模。

  5、 技术之领先独占性

  结合了多种实用新颖功能之本模块,目前在市场上尚无类似产品。 本公司正在向专利局提出专利申请。

六、 经济分析

  1、 模块成本估算(以批量100K计):人民币20左右。

  (CPU$1.0+FLASH$0.5+EPROM$0.4+其它$0.5=$2.4)

  2、 利润估算:

  预计模块销售价格在人民币25-30元之间,利润率可达25%-50%。

  3、预计生产计划及销售量估计:

  2002年8-9月:出样品及样机(预计生产样机50-100台)
  2002年10-11月:小批量生产,10-20K/月。
  2002年12月始:大批量生产,100K/月。

  4、 投资概算:

  前期小批量生产阶段投入:人民币30-40万元。
  进入大规模量产阶段:人民币100万元。

七、 项目后续计划:

  本模块为国内版,仅适用于中文市场(提示音为中文),计划2002年底开始国外版之模块开发,预计每个语种之模块开发周期为一个月。针对现有电话机国外销售市场,暂定语种有:英语/阿拉伯语/西班牙语/俄语/韩语//葡萄牙语/越南语。

深圳捷通公司供稿 CTI论坛编辑



相关链接:
捷通82语音识别模块产品说明书 2003-06-09
语音合成芯片情况介绍和产品设想 2003-05-06
数字可视复读机方案 2003-04-09
语音识别控制电话机方案 2003-04-04
智能早教机方案 2003-04-03

分类信息:  电信_与_语音识别ASR     行业_电信_解决方案   技术_语音识别_文摘