教程 | 看看大神的思路!机器学习界网红 7 分钟教你如何搭建 Chatbot?(中文版)

Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知、无人不晓。

凭借在 Youtube 上的指导视频,Siraj Raval  在全世界吸粉无数,堪称是机器学习界的网红。说他是全球范围内影响力最大的 ML 自媒体人,怕也无异议。

因此,雷锋网 AI 研习社联系到了Siraj 本人,并获得授权将他最精华的 Youtube 视频进行字幕汉化,免费推送给大家。我们将不定期更新,敬请关注!

今天 Siraj 就带领大家做一个自己的 Chatbot!

(建议在Wi-Fi环境下观看视频,土豪随意~)

为了方便流量不足的小伙伴们在路上看,我们特意整理出了文字版和动图~

微信、Skype、Messager以及其他主流通信软件如今都已经搭建了聊天机器人,许多科技巨头纷纷推出各自的聊天助手,各大电商也越来越多地使用聊天机器人参与客服工作。

不过Chatbot可以为你做些什么实实在在的事情呢?你可以和CNN机器人聊天来获取实时新闻,也可以让机器人订花送给女票... ...等等,没有女票?没关系,说出你的要求,让婚恋机器人给你介绍。

看来学会搭建一个Chatbot还是很有必要的。Siraj会带你用TensorFlow建一个聊天机器人,使用递归神经网络算法(RNN),步骤是下载数据集,创建模型,训练模型,聊天测试。

Step1 下载数据集

这里会用到来自康奈尔大学的电影对话数据集。包含了超过600部的好莱坞电影的对话。(恩,可以和女票秀一下深厚的台词功力了。)首先要下载数据集到数据文档中,然后将其切分为两个不同的训练数据集(分别为问和答)进行预处理。

Step2 创建模型

这里用到的模型是 seq2seq,它包含两个 LSTM 递归神经网络,第一个是 encoder 负责处理 input,第二个是 decoder 负责生成 output。使用encoder和decoder作为输入参数,把词汇转为向量形式。

Step3  训练模型

这是很小的数据集,完成整个训练可能也就几个小时。

Step4  聊天测试

随着训练进行,回答会越来越有逻辑。你投入的数据越多,聊得会越开心。

完整代码和数据集请参考Github(链接)。

------------------------------------------------

Siraj Raval 何许人也?

Siraj Raval是YouTube极客网红,曾任职于Twilio和Meetup,客户包括Elon Mask和Google,教大家如何使用机器学习开发聊天机器人、无人驾驶车、AI艺术家等视频点击量累计数百万。

Siraj Raval 为什么这么火?

首先,当然是这位哥伦比亚大学高材生活儿好技术好,用自己特有的方式三言两语就能抛出一个原本晦涩的 ML、DL 概念,让听众细细咀嚼。再者,这家伙幽默逗比、口才便给。兴之所至常手舞足蹈,瞳仁奇光掩映,口吐智慧莲华。深度学习讲师不少,但这么风趣可亲的却不多。

====================================分割线================================

本文作者:AI研习社

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-18 11:30:16

教程 | 看看大神的思路!机器学习界网红 7 分钟教你如何搭建 Chatbot?(中文版)的相关文章

面试爬楼梯算法,每次可以跨一阶或者两阶,每次可以退后一步。求大神提供思路

问题描述 面试爬楼梯算法,每次可以跨一阶或者两阶,每次可以退后一步.求大神提供思路 前面有n节楼梯,每次可以跨一阶或者两阶,每次可以退后一步.求大神提供思路 解决方案 你的题目没有写完整吧.不知道你最终要干什么 是不是这个下面题目? http://blog.sina.com.cn/s/blog_63627b0d0100lcmi.html 解决方案二: 本质上和汉诺塔差不多,用堆栈解决 解决方案三: 每次可以后退一步是在跨1或2步之后还是同时?

c++新手,请大神提供思路

问题描述 c++新手,请大神提供思路 如何获得用户的登录信息,从而获得用户的基本信息:比如如何从教务网登陆界面获得学生登录信息从而查看该生的基本信息? 解决方案 可以用抓包工具抓个包,得到提交的数据,然后可以用CInternetSession类相关的模拟提交即可. 解决方案二: 如果你连socket,wininet等什么都不会的话,建议使用Wireshark等抓包软件抓包并分析,它里面对报文封包分析的很详细的. 解决方案三: C++发送HTTP请求,可以用WInHttp类库等,获取对应的页面返回

mysql-复制一列数据到另一个表,还要在数据前面加字符串,求大神给思路!

问题描述 复制一列数据到另一个表,还要在数据前面加字符串,求大神给思路! 比如查询A表产品id,复制到B表并且统一加入 product_id,最后的效果是 product_id=1 product_id=2 有没有sql语句能做到? 解决方案 SQLServer某个表的数据批量导入到另一个表复制一个库中的表数据到另一个库表中 解决方案二: 创建B表,两个字段( product_id ,设置成主键 自增长,从1开始.),id (来自A表) insert into B(id) select id f

解决方案-求大神提供思路,解决ldap登录密码不区分大小写问题

问题描述 求大神提供思路,解决ldap登录密码不区分大小写问题 ldap的普通用户登录不区分大小写,密码不允许读,该怎么解决,小菜鸟跪求解决方案啊.. 解决方案 已经卡住好几天了....急求... 解决方案二: 你用的是哪个厂商的ldap服务呢 解决方案三: IBM好像是ldap v3 解决方案四: 已解决,只需要解决配置问题,并无代码改动...卡了一个周

c++-C++大神求思路对视频中行走的人的步态以及行走速度的测量

问题描述 C++大神求思路对视频中行走的人的步态以及行走速度的测量 我想做一个对视频中行走的人的步态以及行走速度的测量,用opencv可以实现吗?有没有相关程序demo推荐下呀,简单思路也行,求大神指点~~~ 解决方案 http://wenku.baidu.com/link?url=5lSvJ3EWYJE06XIYpeeTZAvvKlponeQWh5XoV5CtE7YoXibH-GRiD-FYi_jipSqDqPjOJhw0fqDAo9IfpiEUyW2-6BFZ6vQfUigxgOucrkO

“大数据”显然已经成为新一代“网红”

随着"云计算"."互联网"."物联网"的快速发展,大数据(Big Data)也吸引了越来越多的人关注,成为社会热点之一.大街小巷不论是技术人员.咨询人士以及各行各业的精英达人都在探讨着"大数据","大数据"显然已经成为新一代"网红". 本文将从以下几个方面分析大数据及大数据产业: ●大数据是如何成为网红的? ●大数据究竟是什么? ●大数据发展阶段及市场规模 ●大数据主要应用领域 ●大数据

关于compass的一些问题,求大神指导思路

问题描述 最近在学习一些关于compass的东西,出现了一个问题,求大神不吝指导.数据库idnamecolor1三星白色2苹果黑色我想要实现的功能是搜索"三黑"可以把两条数据都检索出来,自己捣鼓了半天还是不行,希望大神们能给个思路.拜谢. 解决方案 解决方案二:你这个问题不好弄,先得分词,再去去数据库匹配,分词算法难度较大解决方案三:引用1楼zhouren1314的回复: 你这个问题不好弄,先得分词,再去去数据库匹配,分词算法难度较大 我用的lucene自带的一元分词,按我的理解,分成

cocos2d x教程-求大神帮忙看看怎么回事,求解决,万分感谢

问题描述 求大神帮忙看看怎么回事,求解决,万分感谢 Microsoft Visual Studio Ultimate 2012在运行C++文件时,总是提示"项目已过期","系统找不到指定文件",总之就是无法运行,请问各位是怎么回事?谢谢各位大神们! 解决方案 把bin obj文件夹都删除,将文件夹中所有文件的只读属性去掉(如果有) 关闭vs,打开,重新编译. 解决方案二: 先修复或者升级Microsoft Visual Studio Ultimate再尝试! 解决方

【深读】网络技术大神庞俊英:网管,网工,Or 网络架构师?你觉得自己是哪一个?

[编者按]曾经听过/看到庞俊英很多的技术分享,在网络方面的实践积累让人欣赏.这篇文章来自这位大神,所表达的观点值得再三品味. 2016-12-14 来源:高效运维 作者:庞俊英 作者简介 庞俊英 大河云联创始人/CEO,也是原来阿里巴巴集团的首席网络架构师.从事网络规划.运维.研发工作近二十年. 曾在Cisco.中国电信等公司任职,是中国获得CCIE认证的最早的女工程师,对网络规划.运维和研发有非常丰富的经验.曾任阿里巴巴集团首席网络架构师,也是集团技术保障部的架构委员会主席,她是阿里云网络基础