
聊天机器人:平稳发展、金融成为应用规模最大领域
聊天机器人主要有两种,即:任务式机器人和闲聊式机器人。
任务式机器人主要目标是帮助用户解决带有特定需求的问题,而闲聊式机器人主要目的是陪用户闲聊,打发时间。
聊天机器人:检索式与生成式的内在逻辑
任务式机器人主要目标是帮助用户解决带有特定需求的问题,而闲聊式机器人主要目的是陪用户闲聊,打发时间。
当前聊天机器人主要有两种实现方式:(1)检索式;(2)生成式。
01.基于检索的chatbot:
检索式的方法依赖文本匹配技术,在诸多候选回复中,选择匹配分数最高的作为回复。
对语料检索匹配
这种检索在客服问答领域非常常见,只要用户给到一个query命中知识库哪个问题,就将其与语料库中的对话进行匹配,筛选出用户可能喜欢最优解。
考虑上下文进行评分
经过上一轮检索匹配,筛选出几个候选response,需要将上下文考虑进去,从而使得对话看起来比较智能。
由此看出:基于检索的bot核心思想是从语料库中寻找最适合的匹配回答,而bot的效果就会被相似计算的特征设计以及语料库的丰富度影响。
02.基于生成的chatbot:
对于闲聊bot来讲,生成模型更像是类似机器翻译的“编码-解码”的生成模式,编码器读取对话历史,解码器直接生成相应回复。
考虑上下文
每一次模型编码都要考虑前序编码结果,每次解码生成的语句才能考虑了上下文的信息。
考虑情感化
有了情感化的chatbot才更像一个聊天的人而不是bot。这是提高用户感受的重要因素。
考虑知识/主题
通过查询数据库、通过槽位追问得到信息来作为条件限制解码器的输出。
加入强化学习DM
由于传统机器人对话缺乏情感化元素,chat场景与task一样需要策略管理系统。
由此看出:机器翻译的结果比较肯定,具有客观性。而在对话任务上,生成式的输出结果有一定的多样性,类似我们做的阅读理解题目。所以,评估生成式对话的结果是否准确,往往也是一件费时且不易判断的事情。
生成式的聊天机器人:检索式与生成式的内在逻辑
总体上说,生成式的聊天机器人确实还存在一些问题,例如不可控性,语料成本昂贵,缺乏工业实用性等。但是,优点也很明显,例如可玩性, 生成多样性,发展趋势性等。
在目前主流的实际项目应用中,聊天机器人的作用更多地还是增加一些趣味性,弥补任务型或事实问答型机器人的乏味性。也许,有一天,当自然语言理解的能力足够强大时,生成式机器人会逐渐替代任务型和事实型机器人的工作。
说了那么多理论知识,也该看点有趣的事情了。
远传生成式聊天机器人基于闲聊对话算法生成模型基于GPT2模型,训练语料50万以上,响应时间不超过300ms,并发承载200TPS。