xinqi's blog

This is xinqiyang

xinqiyang的手记-吐槽人生

携程技术沙龙-人机智能交互AI与客服机器人-总结

时间: 2017-09-23 上海 携程

议题:人机智能交互AI与客服机器人

PDF及录音:https://pan.baidu.com/s/1dFmzRxf 提取密码: vxxw (文件超过插入大小,放到百度网盘上了)

第一讲:微软技术在客户中的应用- 微软 于辉

第二讲:腾讯语音人工智能技术的应用 - 腾讯

第四讲:UNIT:语言理解与交互艺术-百度孙珂

这些偏广告方面,我们先给略过了,下面的三个session深入聊下。

第三讲:携程AI平台及客服机器人-携程于磊

imgimgimgimgimgimgimgimg

第五讲:京东JIMI用户未来意图预测-京东邹波

imgimgimgimg

第六讲:深度学习在智能助理产品中的应用-来也胡一川

imgimgimgimgimgimg

第七讲:阿里小蜜-电商领域的智能助理技术实践-阿里陈海青

imgimgimgimgimgimgimgimgimgimgimgimg

imgimg

imgimg

总结

携程:

针对当前携程这边AI方面的工作,主要由公共BI部门来做,现在主要是于磊带领的部门的40-50个人的规模来做,支持携程的各大产品线。针对当前智能客服的开发进度情况现在还不太清除,实际商用到什么程度?

小诗机主要用到了CNN,RNN, LSTM等各种算法,还调用了第三放的api来获取天气,季节等数据,最终通过LSTM模型来创作,这里着重提到了seq2seq和LSTM结合的方式。

对于智能机器人方面,他们使用了检索 + 意图级别 + 命名实体识别 等方法结合等给出结果。 其中算法方面用到到挺多常用到算法,模块方面主要封装成对话管理,知识图谱和个性化推荐等,在上层封装成各种应用。

京东:

京东讲等相对比较细节一些,将他们现在做等进行了下总结,主要围绕客服咨询和问答的领域,通过清洗,聚类及特种提取,来提高准确度,他们主要用java方向的架构,spring batch还有mapreduce来做。基于用户的意图识别方面,也是用BaseLine,之后用LSTM + Attention的模式来提高预测准确率,这个方面提出率一些模型调优方面的一些经验,通过L2正则化,通过加大样本数量(100w条) ,加入Dropout机制,截断式反向传播,掩模和填令,学习率自动衰减 AdaGrad,权重初始化xavier ,优化方法 sgd/adagrad/momentum ,激活函数 softmax

主要流程: 从数据源日志中– 》 分词,word2vec,去掉停用词,同义词替换,取中心词生成句子向量,聚类生成标准问题 –》 特征收集与建模 –》 建立分类模型

来也:

来也讲的也比较细节方面,主要是针对当前的问答进行技术的处理,从语意方向和问答,实体抽取和知识挖掘,意图识别来进行处理。 提到框架方面主要处理流程,embed (每个词或者句子映射为向量) –> Encode(对一段文本对应的向量进行转换,转换时使用上下文信息,通常使用CNN,RNN –> attend(从编码后的向量中提取对预测由价值的信息,输出为一个固定维度的向量)–> predict(基于输入向量产出最终的预测) 。这里主要聊了下,他们的基于深度学习,完全数据驱动,无需特征工程,效果明显由于传统机器学习模型, 使用 双向LSTM + Attend + softmax 最终输出 意图识别结果,准确率达到95% ,这块有点夸张。

阿里:

阿里的团队比较完善,人也比较多,单单一个客服团队,就由50+的人在做这些, 而且整体系统上看过去做的时间比较就也比较全面,主要他们也是对用户对行为特征进行意图分类的预测。 他们主要结合用户行为序列与Query的意图识别分类,使用词袋 + RNN + CNN 等对文本进行embedding 然后在用DNN 2-channel 针对多标签进行分类。 他们的基于图谱与IR模型相结合的QA Bot 使用 文本预处理 + 分词处理 + 纠错, 基于 搜索召唤模块,从现有的结构化知识库中,通过语料索引构建的索引模块,检索,然后计算模块进行 相似度,情感分析,文本属性识别 等,然后组装答案,在给出回答。他们这块对于语义关系部分的自动挖掘,使用图算法来做, graph, aiml 来做意图关系及意图规则,最后生产特征, 也有通过分类,SM ,LDA2VC, cosine ,WMD 来做特征生成,这块看看由没有现成的我们可以使用的,业务这块特征抽取,目前占用了大量的人力和时间。

后面他们做的,ai boost核心算法技术,主要是在 预处理和特征工程这块,句子向量,相似度计算,聚类等,通过场景及语料,对问题进行处理,而我们现在也比较关注用户回复的答案。

后记

整体主要了解了各大公司在AI语言处理方向及对话机器人方向,基于场景和领域下,技术,算法的使用以及处理的过程,各家公司做的粒度和广度都有差别,但是总体来看,我们能从这边看到算法及处理过程的,对于我们现在的实际进行中的项目还是有很大帮助的。

机器学习入门

AI入门

AI的入门

AI的概念越来越热,各大厂都在深入的使用AI技术来提高各自的业务水平,各种创业公司和团队都在使用这个技术,在东京这块也有很多的机器人公司在尝试使用这个技术来做一些新业务的尝试,自己也不能免俗的加入的AI开发者的行业。对于算法和机器学习都不精的情况下,其实面对应用场景和技术的匹配,还是很难判断,只能一步一步的跟进,从而在真正的产品中,能够把产品做出来,有实际使用才有话语权,也有投入能够把这块做的更好。

机器学习的入门

从AI到机器学习,其实感觉都没撒太大的区别,对于初学者来说,我们也表示下会一些CNN从而可以说明你会点机器学习吧,但是这块地算法真心的不少。

移动设备机器学习的入门

从图片做简单的分类,这个是现在常见的在做的部分,当然也是想在iOS和Android上使用这块地技术来做一些实践的产品。

今天演示用的iOS代码在这里下载:

https://github.com/xinqiyang/iOS-10-Sampler

做个PPT自己学习下

投入的时间不够,只能在现在业务繁忙的情况下,多投入一些时间来吧这块事情做好。

就做一个PPT做一个session,这样有自学有交流,这样能够学习到更多。

下载地址:

http://yangxinqi.com/images/machine_learning_in_mobile.pdf

最后攒钱买机器

最后还是花钱去搞了一台机器了,开始AI的模型训练之旅了。

精彩在最后

在接近尾声的时候,从讨论中擦出了火花,过来的周兄是移动方面的大牛,给了不少推荐,最后有乐天的任兄给我们聊了下机器学习在金融方面的应用,顿时大家兴趣备至啊,终于有和钱相关的话题了,虽然现在还是半自动的,虽然现在AI还只是能给出建议,但是在很多的方面已经能够直接商用了,说明这个方向在未来的2-3年内应该还是很热门的。

AI入门

三年之后

三年之后

“三年后又三年,就快10年了,老大!” — 这个没记错的话,应该是无间道里面梁朝伟饰演的陈永仁说的。

今天是从正式创立公司满三年的子,三年前的今天决心了出来做一个属于自己的公司,有一个梦想,想弯道超车,但是就现在的结果来看,很多时候都未能如愿。

商场上的挣扎,和作为程序员本身的基本追求,又有着很大的冲突。

庆幸我们现在还活着,庆幸现在还没有放弃。

虽然现在大部分的时间不属于自己,但是整体拼杀过来,有一个小小的团队,还是有可能的。

尽人事,听天命,掌握好时间,做好自己该做的事情。

3年之后

下一个三年,还在等着,希望十年后的今天,在来回首看,会感谢现在努力拼搏的自己。

时间管理和情绪管理

好死不如赖活着

活着讲究的是一种境界,死了一切就扯淡了。有的时候发现,有品节的去死不如好好的活着,其实很多时候大中华民族的气节也是这样的,所以面对现在的种种历史问题,新一代的人总是一直的去回避,我们都躲的远远的这样就能规避掉这个问题了。

想要赖活着,这样的状态下,面对生活,必须有自己的时间管理和情绪管理的心态,不然还是做不到的,人改变自己的劣根性是很难的,我们自己改下自己的行为习惯就更难了。

自创业以来,自己就像一个陀螺一样,转的停不下来,N个项目,N个ticket需要去处理,可是时间总是那么那么的平凡,就是这么的24小时。

huozhe

改变应该从时间管理开始

时间及事情的优先级总是这样的,然后协调的好不好,其实重在自己的心态,活都是那么多,愉快的干完和痛苦的干完,心态是完全不一样的,就送你拼尽全力,好多的活还是那些,我们很难能够都面面俱到的处理好。

到这个月过完,创业三周年即将到来,一直没有时间回首复盘下这3年来自己走过的这一切。

看到朋友们的生活,其实3年就可以变很多,现在没有变的是,3年来一直维持着自己的公司,走走停停,好歹还活着吧。 所以解放是很关键的,搞来搞去,不能老是在高压的状态下,面对时间,还有外界的压力,应该用自己的节奏去控制它,而不应该是被别人所控制。

1.周末的休息是必须的,平日的加班是要有效率的

​ 看到很多团队,周末一直在加班,一直在高压的状态,而且持续好几个月,而且经常出现,这个创业团队里面也比较常见,体会过来感觉真的挺没有必要的,技能重在积累,做为一个商业模式必须考虑盈利。 所以留给自己一个充裕的时间,能更有效的来思考。在加上现在有了孩子,更需要多抽时间来陪他了。

​ 平日的加班,其实多数情况下是无效率的,经历下来好多时候都没有啥用,项目在最后的关头,才开始努力的去面对之前未完成的功能,靠加人和加班都是于事无补的感觉,现在来看还是比较难以见效。 所以加班不可避免的要解决问题的情况下,还不如第二天清醒的来快速解决。

2. 团队管理上时间的分配和协调

​ 团队开发,在最后都要避免加班,用一个已经磨合好的团队,做事情自然会快一些,用google日历来管理,大家的每个工作时间,精确到半个小时,效率就自然能上来的了,其次是给大家一些反馈,对于现在存在的问题能够尽快的沟通,当面沟通比聊天来的好,自然就能有效率了。

情绪管理不淡定的情况下如何淡定

自己挖的坑自己填,做错的事情,下次不要在犯错,现在的情况下大家都是这么来处理的。 但是在好多达不到自己的标准下,还是很难的在这个问题上达成一致。

找个不伤害人的方式发泄吧。

还是得发泄掉就好了。当心情极度不佳的时候,如何控制好情绪很关键!

无法两全的情况下,只能选择一个了,做好自己认为的最重要的一个很关键,为自己活一回,还是想为自己而站,这也是一直以来自己的理想。

想想自己,想想自己要做的就好了。

扯到底,扯好了,好吧,扯好了,开始干活去!

Xinqiyang复活

复活

好久以来一直想复活下yangxinqi.com,今天终于买下来了,一看断断续续,从13年之后,来了日本之后就没在咋个写过Blog了,来日本确实是另外一番景象,快5年了,想找回曾经的那个自己,遂又开始写博,对于创业将近3年的老油条来讲,这一路走来的一幕幕,急需复盘,有时候走累了停一停,整理整理思路。

好吧,给自己一个新的开始,复活, 把blog放到github上,github还是很靠谱的,在有生之年应该都还在吧

这个判断应该是对的。

分享出去,为了每篇文章的美观,后续我都会加上图片的:

come back!