
极限元是国内领先的人工智能技术公司,以“智能交互”为核心,拥有自主产权的智能语音、人机对话、机器视觉、大数据分析等AI技术,推出了云端、桌面、嵌入式等跨平台AI技术解决方案,产品和服务广泛应用于教育、安全、交通、智能硬件等多个领域。
公司致力于发展智能交互技术,与中国科学院自动化研究所挂牌成立了“智能交互联合实验室”服务于腾讯、奇虎360、搜狗等公司以及网信办、公安部门等国家相关安全机构。
核心技术优势:
(1)前端信号处理
通过前端处理模块可以有效抑制噪声、混响、回声的干扰,增强语音的可懂度,提高真实环境下语音识别的鲁棒性;在智能家居、智能车载等领域有广泛应用。
(2)声纹识别
声音就是密码,自动识别说话人身份,实现快速精准的身份认证。
(3)情感识别
能够精确探测用户的面部表情、语音语调、语言情绪等特征,识别喜、怒、哀、惊、惧情绪,并在此基础上,制定拟人化的情感交互模型和对话策略。(如使用于呼叫中心质检等场景)
(4)语音识别
将语音识别成文字,让机器具有人类一样的听力。识别准确率达97%以上,支持方言口音识别、智能降噪,识别实时率<0.15.
(5)语音合成
将文字合成为语音,让机器说话,媲美真人发声,专业MOS分可达4.4,多方言、多语种、多音色的音库选择,支持个性化语音定制。
(6)人机对话
实现多类型人机对话管理,结合上下文的多轮对话,面向口语的语义理解,基于语音的鲁棒性问答。
解决方案
(1)语音质检
针对现行业内运用的质检方式的诸多弊端,“极限元”采用了基于语音识别、语音关键词检索技术、音频对比技术、情感识别技术的录音质检方案。本方法有效的减少语音识别准确率不高带来的录音质检误差,有效提升了录音质检效率,全面覆盖人工客服与用户的每一次对话,基于度神经网络算法,智能分析人工客服对话内容,节约大量的人工成本,同时根据各客服系统的工作重点和特点,进行个性化设定与定制。

(2)智能客服
基于语音识别、语音合成、语义理解等技术,可以实现呼叫中心拨号音检测、智能外呼、智能问答、语音导航、智能营销等一系列的功能。应用场景:客户回访、产品推荐、债务提醒、信息资讯、业务办理、电话订购等,可应用领域包括:金融、保险、电商、教育、企业服务、生活服务。

(3)语音转写
录音转写文稿、快速定位回听、视频字幕制作,可实现长句子连续语音识别,音频文本对齐时间轴,普通话识别准确率高达96%,帮助各行各业的用户实现高效记录和信息输入。应用场景包括演讲或授课、记者访谈、会议办公、影视娱乐视频字幕等。
(4)智能交互
多通道语音前端信号处理方案,嵌入式远讲语音唤醒,离线模式下语音/指令词识别,云-端一体化语音交互方案,可应用领域:车载导航、智能音箱、智能家居、机器人等。
企业网址:www.jixianyuan.com