xinqi's blog

This is xinqiyang

xinqiyang的手记-吐槽人生

携程技术沙龙-人机智能交互AI与客服机器人-总结

时间: 2017-09-23 上海 携程

议题:人机智能交互AI与客服机器人

PDF及录音:https://pan.baidu.com/s/1dFmzRxf 提取密码: vxxw (文件超过插入大小,放到百度网盘上了)

第一讲:微软技术在客户中的应用- 微软 于辉

第二讲:腾讯语音人工智能技术的应用 - 腾讯

第四讲:UNIT:语言理解与交互艺术-百度孙珂

这些偏广告方面,我们先给略过了,下面的三个session深入聊下。

第三讲:携程AI平台及客服机器人-携程于磊

imgimgimgimgimgimgimgimg

第五讲:京东JIMI用户未来意图预测-京东邹波

imgimgimgimg

第六讲:深度学习在智能助理产品中的应用-来也胡一川

imgimgimgimgimgimg

第七讲:阿里小蜜-电商领域的智能助理技术实践-阿里陈海青

imgimgimgimgimgimgimgimgimgimgimgimg

imgimg

imgimg

总结

携程:

针对当前携程这边AI方面的工作,主要由公共BI部门来做,现在主要是于磊带领的部门的40-50个人的规模来做,支持携程的各大产品线。针对当前智能客服的开发进度情况现在还不太清除,实际商用到什么程度?

小诗机主要用到了CNN,RNN, LSTM等各种算法,还调用了第三放的api来获取天气,季节等数据,最终通过LSTM模型来创作,这里着重提到了seq2seq和LSTM结合的方式。

对于智能机器人方面,他们使用了检索 + 意图级别 + 命名实体识别 等方法结合等给出结果。 其中算法方面用到到挺多常用到算法,模块方面主要封装成对话管理,知识图谱和个性化推荐等,在上层封装成各种应用。

京东:

京东讲等相对比较细节一些,将他们现在做等进行了下总结,主要围绕客服咨询和问答的领域,通过清洗,聚类及特种提取,来提高准确度,他们主要用java方向的架构,spring batch还有mapreduce来做。基于用户的意图识别方面,也是用BaseLine,之后用LSTM + Attention的模式来提高预测准确率,这个方面提出率一些模型调优方面的一些经验,通过L2正则化,通过加大样本数量(100w条) ,加入Dropout机制,截断式反向传播,掩模和填令,学习率自动衰减 AdaGrad,权重初始化xavier ,优化方法 sgd/adagrad/momentum ,激活函数 softmax

主要流程: 从数据源日志中– 》 分词,word2vec,去掉停用词,同义词替换,取中心词生成句子向量,聚类生成标准问题 –》 特征收集与建模 –》 建立分类模型

来也:

来也讲的也比较细节方面,主要是针对当前的问答进行技术的处理,从语意方向和问答,实体抽取和知识挖掘,意图识别来进行处理。 提到框架方面主要处理流程,embed (每个词或者句子映射为向量) –> Encode(对一段文本对应的向量进行转换,转换时使用上下文信息,通常使用CNN,RNN –> attend(从编码后的向量中提取对预测由价值的信息,输出为一个固定维度的向量)–> predict(基于输入向量产出最终的预测) 。这里主要聊了下,他们的基于深度学习,完全数据驱动,无需特征工程,效果明显由于传统机器学习模型, 使用 双向LSTM + Attend + softmax 最终输出 意图识别结果,准确率达到95% ,这块有点夸张。

阿里:

阿里的团队比较完善,人也比较多,单单一个客服团队,就由50+的人在做这些, 而且整体系统上看过去做的时间比较就也比较全面,主要他们也是对用户对行为特征进行意图分类的预测。 他们主要结合用户行为序列与Query的意图识别分类,使用词袋 + RNN + CNN 等对文本进行embedding 然后在用DNN 2-channel 针对多标签进行分类。 他们的基于图谱与IR模型相结合的QA Bot 使用 文本预处理 + 分词处理 + 纠错, 基于 搜索召唤模块,从现有的结构化知识库中,通过语料索引构建的索引模块,检索,然后计算模块进行 相似度,情感分析,文本属性识别 等,然后组装答案,在给出回答。他们这块对于语义关系部分的自动挖掘,使用图算法来做, graph, aiml 来做意图关系及意图规则,最后生产特征, 也有通过分类,SM ,LDA2VC, cosine ,WMD 来做特征生成,这块看看由没有现成的我们可以使用的,业务这块特征抽取,目前占用了大量的人力和时间。

后面他们做的,ai boost核心算法技术,主要是在 预处理和特征工程这块,句子向量,相似度计算,聚类等,通过场景及语料,对问题进行处理,而我们现在也比较关注用户回复的答案。

后记

整体主要了解了各大公司在AI语言处理方向及对话机器人方向,基于场景和领域下,技术,算法的使用以及处理的过程,各家公司做的粒度和广度都有差别,但是总体来看,我们能从这边看到算法及处理过程的,对于我们现在的实际进行中的项目还是有很大帮助的。