Human-like learning在对话机器人中的魔性运用 | 公开课读者问答

编者注:戴帅湘——前百度主任架构师,曾长期担任百度Query理解方向负责人,是自然语言理解方面的技术专家,曾荣获第一个也是迄今为止唯一一个以NLP技术为核心的百度最高奖。2010年提出“Query改写模型”给百度搜索引擎技术带来了跨时代的飞跃,使得搜索相关性和广告收入均大幅提升。该模型比学术界同类模型《Query Rewriting Using Monolingual Statistical Machine Translation》的提出还要早将近1年。此模型迄今为止仍广泛应用于百度所有搜索产品线 。申请了自然语言处理,语义搜索,自动问题求解等领域内20多项专利技术。

本文是戴帅湘在公开课Human-like learning 在对话机器人中的魔性运用中的读者问答内容整理。

  • mor引擎如何来保证数据的可靠性?

你的意思应该指的是数据的准确性,这个暂时还是通过线下的测评,达到一定的准确率后才参与线上运算,这个和大多公司采用的方法一样。

只是我们后面会在对话的环节允许用户通过对话的方式帮助修正,就像我说了某个东西,听着觉得不对,可能会给我一个反馈。

  • 对于用户需求、用户意图的理解和分析,对query做一个简化、分析。请问一下有没有一些开源工具或者算法可以推荐一下。例如以下这些:
  1. 北京附近哪里好玩呀 -> 北京的景点;location : beijing, category : travel。
  2. 上海哪里有好吃的呀 -> 上海的餐馆;location : shanghai, category : restaurant。

这个也是在具体的反馈式增强模型阶段来处理,当然也需要有一些特定的引导。

开源的工具倒没有看到,但是相关方法今年ACL有几篇文章是关于把自然语言转成特定形式化描述的,可以去看一看。其中有的也用到了深度学习,但是需要一些语料支持。

我理解这类开源的很少,毕竟都还不成熟,希望将来有人可以做一些开源的工具出来。

  • Google 的 开源的 tensorflow 有一个seq-to-seq的框架,您觉得怎么样

seq-to-seq是一个非常好的框架,我们也会用到这类工具做线下的一些调研和训练

  • 我现在遇到的问题,就是训练好的聊天机器人,但是有的问题的回答并不理想。

明白,深度学习(DL)有个问题就是不好解释。

这个你只能通过更好的语料及更细致的参数调整才能有所改善,否则就需要加入其它方法。

  • 想请教下深度学习目前在NLP中主要应用在哪个方面?数据还是模型中?

其实现在很多NLP任务都才尝试深度学习(DL),但是看起来效果并不好

至少不会像图像识别和语音识别那样有很大的提升,基本上都是比较微弱的。

深度学习(DL)虽然在特征泛华和分层上有更强的能力,但是NLP问题终归还是一个语言的问题,首先需要针对语言本身有更多的理解和建模,然后才能谈更多语料上的训练。

本文作者:李尊

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-26 18:50:07

Human-like learning在对话机器人中的魔性运用 | 公开课读者问答的相关文章

预告|Human-like learning 在对话机器人中的魔性运用

对话机器人很多,像Siri,小冰,度秘,Allo都能在你有空的时候跟你贫贫嘴,不过随着厂家和用户意识到凭空做出一个高度通用的对话机器人是非常不现实的,对话机器人的姿态也发生细微的变化--厂家们试图从某些垂直领域开始入手深根,并且从纯聊天功能发展到这个对话机器人能为用户完成什么指定的任务功能.一下子为"只说不做" 的对话机器人找到了一个新的场景. 不过,这个全新升级的对话机器人,重心移向代替人决策,并帮用户完成任务. 它如何听懂用户想做什么事情?如何做到聊天过程中都不能达到的Human

Human-like learning在对话机器人中的魔性运用

对话机器人很多,像Siri,小冰,度秘,Allo都能在你有空的时候跟你贫贫嘴,不过随着厂家和用户意识到凭空做出一个高度通用的对话机器人是非常不现实的,对话机器人的姿态也发生细微的变化--厂家们试图从某些垂直领域开始入手深根,并且从纯聊天功能发展到这个对话机器人能为用户完成什么指定的任务功能.一下子为"只说不做" 的对话机器人找到了一个新的场景. 不过,这个全新升级的对话机器人,重心移向代替人决策,并帮用户完成任务. 它如何听懂用户想做什么事情?如何做到聊天过程中都不能达到的Human

Andrew Ng机器学习公开课笔记 -- Generative Learning algorithms

网易公开课,第5课  notes,http://cs229.stanford.edu/notes/cs229-notes2.pdf 学习算法有两种,一种是前面一直看到的,直接对p(y|x; θ)进行建模,比如前面说的线性回归或逻辑回归,这种称为判别学习算法(discriminative learning algorithms) 另外一种思路,就是这里要谈的,称为生成学习算法(generative learning algorithms),区别在于不会直接对p(y|x; θ)进行建模,而是对p(x

Andrew Ng机器学习公开课笔记–Reinforcement Learning and Control

网易公开课,第16课  notes,12 前面的supervised learning,对于一个指定的x可以明确告诉你,正确的y是什么  但某些sequential decision making问题,比如下棋或直升机自动驾驶  无法确切知道,下一步怎么样是正确的,因为这是一个连续和序列化的决策,比如直到最终直升机crash或下棋输了,你才知道之前的选择是不好的,但中间那么多步决策,到底是哪部分出了问题,可见这是个比较复杂的问题 强化学习,基本思路就是,既然不知道怎样是正确的,那就随便try,然

Andrew Ng机器学习公开课笔记 -- Online Learning

网易公开课,第11课  notes,http://cs229.stanford.edu/notes/cs229-notes6.pdf   和之前看到的batch learning算法不一样,batch learning一定是先用训练集进行训练,然后才进行预测 但是online learning,不必要一定有训练的过程,可以一边预测的同时一边训练 这个其实很现实,系统上线前也许很难收集到数据,并且数据也许也是在不断变化的 下面就用perceptron algorithm作为例子看看如何实现onli

这几天 AI 圈都在关注的深度学习库评测

2016 年是雷锋网(公众号:雷锋网) AI 科技评论非常重要的一年,我们围绕人工智能做了一系列的业界.学界.开发者报道,也请了一系列导师大牛过来给我们做技术解读的公开课,在给这些导师大牛提供了一个绝佳展示舞台的同时,也给读者们带来了最深度的公开课内容,下面是雷锋网 AI 科技评论年度盘点之语义识别篇. 深入 NLP---看中文分词如何影响你的生活点滴 嘉宾介绍:徐博士,约翰霍普金斯大学语言和语音实验室博士.2012年毕业后加入微软总部,先后在Bing和微软研究院从事自然语言处理和机器学习相关的

从数据算法到人工智能,带你穿越重重迷雾 | AI科技评论周刊

在通向人工智能的道路上,免不了要经常和数据算法打交道.本周AI科技评论从专业角度,详解最新出炉的科学家最常使用的十大算法,以及分析深度学习在数据革命中到底占据什么位置.另外,本周还有Palm之父Jeff Hawkins.人类简史作者Yuval Harari以及微软亚洲研究院院长洪小文从不同的角度带你穿越人工智能学习过程中的重重迷雾. | 最新出炉--数据科学家最常使用的十大算法 基于调查,KDnuggets总结出了数据科学家最常使用的十大算法,它们分别是: 1. Regression 回归算法

从“连接”到“交互”—阿里巴巴智能对话交互实践及思考

(本文根据孙健/千诀 2017年5月18在中国云计算技术大会上的演讲整理) 从连接的时代到交互的时代 纵观传统互联网时代,如果用一个词来总结和概括的话,"连接"这词再合适不过了,传统互联网时代,我认为主要建立了三种连接:第一,人和信息的连接:第二,人和人的连接:第三,人与商品服务的连接.第一种连接成就了Google和百度这样的互联网巨头:人和人的连接成就了Facebook和腾讯这样的互联网公司,人和商品服务的连接,成就了Amazon.阿里巴巴.京东这样的巨头.所以,从这个意义上看,传统

贤二机器僧二代亮相世界人工智能大会 | 主创团队与10大核心技术解密

贤二机器僧亮相2016世界人工智能大会,贤信法师解读研发宗旨 2016世界人工智能大会上,龙泉寺五位法师携贤二机器僧登台亮相.贤信法师(右一)代表龙泉寺解读贤二机器僧研发宗旨.龙泉寺动漫中心贤帆法师(右二)怀抱贤二机器僧一代. 贤信法师:大家好,感谢主办方的邀请,让我们有机会参加这样一个大会,听到诸位专家对人工智能领域最新发展的分享,让我们感觉非常受益.北京龙泉寺开放到现在十多年以来,我们的方丈学诚大和尚一直非常注重将佛法和现代科技相结合,比如说我们的贤度法师在目前龙泉寺大藏经的编纂工作中,积极