如何最有效率地学习机器学习

在过去的两年时间里,我多次迷恋于学习机器学习。 正如你学习大多数的东西一样,每当我决定尝试新事物的时候,我不得不重新学习某些概念和课程。 所以,我编辑了一份包括概念、定义、资源以及工具的知识合集,这对于在这个复杂领域从事工作的我来说非常有用。 希望这些东西对于即将进入机器学习这个精彩(有时是令人沮丧)世界的朋友来说也会起到一定的帮助作用。
如何最有效率地学习机器学习_开发_课课家
  如何最有效率地学习机器学习
  老实说,每个人都有适合自己的学习方法。对我个人而言,最好的方法就是反复把在项目中学到的东西应用到其他地方,直到把它彻底弄明白弄熟练为止。如果你不打算使用它的话,为什么要学习它呢?而且多巴胺会让你在看到学习成果的时候进一步促进你学习的动力。
  在刚开始学习机器学习的时候很容易不知所措。有很多东西要学,即使是对于同一个知识点也有太多的资源可供挑选来学习,而且这些资源可能完全不同,甚至很混乱。学习这种内容繁多并且发展迅速的东西非常困难。在理想情况下,一旦你感觉自己在机器学习方面入了门,就会清楚自己到底想要研究哪些具体的领域。

  我将尝试用足够的篇幅来介绍这些松散的知识,使之适合于任何人阅读。如有疑问,请自行谷歌……
  什么是机器学习(Machine Learning, ML)?
  它是人工智能的一个子领域,它让计算机自己学习,而不需要被明确地编程。机器学习基本的目的是理解大量输入数据中的模式,然后根据其生成的模型来预测输出。

  机器学习的工作流程
  什么是机器学习算法?从本质上讲,机器学习采用了可以从数据中学习和预测数据的算法。这些算法通常来自于统计学,从简单的回归算法到决策树等等。
  想要了解不同机器学习算法及其使用方法方面的内容,可以阅读这篇文章:机器学习算法要点。
  什么是机器学习模型?一般来说,它是指在训练机器学习算法后创建的模型构件。一旦有了一个经过训练的机器学习模型,你就可以用它来根据新的输入进行预测。机器学习的目的是正确训练机器学习算法来创建这样的模型。当我在这篇文章中提到“模型”时,我一般就是指的这个定义。
  但是,机器学习社区中的“模型”这个术语并没有一个统一的定义。这个术语被大量提及,并且可以代表机器学习中使用的统计模型或数据模型中的任何内容。比如列、数据类型和数据源,甚至是神经网络规范。当你在技术或数学读物上学习有关机器学习的文章的时候,需要注意这一点。
  流行的机器学习算法
  机器学习算法有很多,每个人都有一套适合自己的案例。你可以根据学习的种类或相似性对机器学习算法进行分类。下图是通过相似性对目前流行的算法进行的概括。在本文中,我根据学习种类的不同将算法分为:监督学习无监督学习

  监督学习
  这是一种使用样例来进行训练的机器学习算法。训练数据被标上了已知的标签,该算法将基于这些数据来建立模型。一旦模型被训练出来,该算法将能够确定从未见过的实例的标签。
  用监督学习解决的问题可以进一步分解为分类回归问题。
  无监督学习
  与监督学习相反,无监督学习使用未标记的训练数据进行学习。这意味着该算法能够自己确定如何使用这些数据(识别数据的模式)。
  无监督学习可以分为聚类关联问题。
  半监督学习
  这是上述两种方法的混合体,即只有部分输入数据做了标记。
  监督学习的线性回归
  这其实是机器学习的“Hello World”教程。线性回归可用于理解输入(x)和输出(y)变量之间的关系。当只有一个输入变量(x)时,称为简单线性回归。你可能已经在简单统计中看到过这种技术的应用。
  训练线性回归方程最常用的技术是普通最小二乘法。所以,当我们用这个过程训练机器学习中的模型时,通常被称为普通最小二乘线性回归。
  输入(x)和输出(y)的简单回归模型可以被建模为:
  y = B0 + B1*x
  系数B1(β)是回归斜率的估计,附加系数B0是回归截距的估计,它给出了直线的附加自由度。
  请阅读本教程来学习用于线性回归模型的四种技术:简单线性回归、普通最小二乘法、梯度下降和正则化。
  你很快就会注意到,很多的机器学习算法只是使用了基本统计学的不同的曲线拟合方法。机器学习(至少在我看来)只有在深度学习领域中才会让人兴奋。
  深度学习
  这是机器学习的一个子领域,近年来表现出了很大的潜力。它涉及到大脑中神经元结构和功能的算法。

  Andrew Ng版权所有,保留所有权利。
  深度学习中最令人激动的特性之一是它在特征学习上的表现。该算法在从原始数据中检测特征方面表现地特别好。有一个很好的例子,就是通过深度学习技术来识别汽车图片中的车轮。下图说明了典型机器学习与深度学习之间的区别:

  深度学习通常由多个层组成。它们通常将更简单的模型组合在一起,通过将数据从一层传递到另一层来构建更复杂的模型。这是深度学习随着数据量的增加而优于其他学习算法的主要原因之一。
  想进一步了解深度学习方面的知识,请阅读The Deep Learning Book,你可以在麻省理工学院的网站上免费获取。
  TensorFlow简介
  TensorFlow是专门为机器学习而设计的快速数值计算Python库。它由谷歌开源,旨在让世界各地更多的研究人员和开发人员掌握深度学习。
  它的官方教程可能对初学者来说有些杂乱,我建议大家从本系列开始,首先学习Tensflow的相关介绍。
  如何使用TensorFlow
  TensorFlow安装好之后,你就可以用它提供的多个API来训练机器学习模型了。建立在TensorFlow Core(最好控制最底层的API)之上的更高级别的API是最容易学习的,你应该从这里开始学习。
  本文不可能包含完整的TensorFlow教程,网上有数不清的学习资源,首先从官方资源开始吧:
  TensorFlow入门
  TensorFlow简介
  Hello World - 机器学习系列教程之一
  TensorFlow教程 (Sherry Moore, Google Brain)
  虽然TensorFlow是最受欢迎的机器学习库,不过也有其他几个很棒的选择,如Torch(Facebook使用)、Caffe(出自Berkeley AI研究所的深度学习框架)等等。
  这篇文章缺少什么
  很多。本文的目标是为你提供有关机器学习的基础知识,以避免你晕头转向。但是这个话题包含的内容实在太多了,无法全部写下来。
  接下来做什么?
  一旦对基础知识有了一定的了解,你应该知道自己对机器学习的哪些方面比较感兴趣,你想在应用程序中使用机器学习,还是想研究机器学习。
  你可以根据自己的兴趣来阅读本文中嵌入的链接,或通过谷歌来搜索挖掘一些你需要的内容,从而更深入地研究某个领域。
  在学习机器学习的过程中,最困难的部分就是打下一个扎实的基础。紧接着,就是弄清楚你自己想要做什么。
  结语
  “整个世界就是一个大数据问题” - Andrew McAfee
  掌握机器学习就像是驯服一头野兽。但是,如果你已经吃透它,那么它就是你身边一个非常有价值的资源。

时间: 2024-11-01 15:50:14

如何最有效率地学习机器学习的相关文章

你会给想学习机器学习的软件工程师提出什么建议?

本文讲的是你会给想学习机器学习的软件工程师提出什么建议?, 原文地址:What would be your advice to a software engineer who wants to learn machine learning? 原文作者:Alex Smola 译文出自:掘金翻译计划 本文永久链接:github.com/xitu/gold-m- 译者:lsvih 校对者:吃土小2叉,Tina92 你会给想学习机器学习的软件工程师提出什么建议? 这很大一部分都取决于这名软件工程师的背景

11篇深度学习 /机器学习好文推荐!

机器学习--让人工智能触手可及 大规模深度学习优化技术在PAI平台中的应用及实践 阿里云工程师用机器学习破解雾霾成因 大规模数据的分布式机器学习平台 ODPS-MPI机器学习编程框架 阿里云数加(大数据)公开数据集(公测ing) PAI分布式机器学习平台编程模型演进之路 基于MaxCompute平台进行机器学习并展示结果 MaxCompute上你从未体验过的数据分析和机器学习过程 技术创业难?看汇合营销如何玩转大数据与机器学习 如何用大数据开发套件周期调度机器学习算法

从自动驾驶到学习机器学习:解读2017科技发展的15大趋势

科技在明年将会发生巨大的改变.想要了解前沿资讯吗?著名设计公司 frog 做出的这些预测可能会让你了解一些 2017 年的科技发展趋势.每一个领域都有一个设计师解释全部的细节.哪些东西已经出现在你们的视野中了呢? 1. 自动驾驶领域的超凡表现 目前,我们所了解到的信息是:世界上每年有 120 万人死于车祸,自动驾驶汽车(AVs)在这样的背景之下应运而生.其乐观的前景是可以确定的,因为 90% 以上的交通事故都是由于人类过失造成的,但即使是那些对于自动驾驶最热衷的支持者们也知道自动驾驶汽车有时候也

迁移学习——机器学习的下一个前沿阵地

我们越来越善于训练深度神经网络,从大量的标记数据中学习到从输入到输出的非常准确的映射,无论它们是图像,句子,标签预测等. 但,我们的模型所缺乏的是能够概括出不同于训练过程中遇到的情况.当你将模型应用于精心构建的数据集,它表现的总是不错.但,现实世界是混乱的,包含无数的新情景,其中许多是你的模型在训练期间没有遇到过的.将知识迁移到新情景的能力通常被称为迁移学习,这是我们将在本文的其余部分讨论的内容. 在本篇博文中,我将首先将转换学习与机器学习的最普遍和成功的范例 - 监督式学习进行对比.随后,我会

有互动才有效率在线学习就上选课网

在线学习逐渐成为90后.95后们的必备技能:不仅节省了路途时间,降低了学费成本,更可以根据自己的喜好和需求选择相应的课程,因而这一两年来迅速风靡起来.通过搜索引擎.论坛.学习网站等,很容易找到录播课程,数量庞大,随时+随地的方式也易于接受,但问题也非常明显:一是内容陈旧:二是老师单向灌输,学生有疑问却无法提问.什么样的学习才真正有效果?有互动的直播课才行!通过直播课,你可以和老师们实时互动,第一时间答疑解惑:通过直播课,你可以只选择最感兴趣/最薄弱的知识点进行专项学习,而不是看着一堆课程发愁:通

应用机器学习:传道解惑指南

在过去的两年时间里,我多次迷恋于学习机器学习. 正如你学习大多数的东西一样,每当我决定尝试新事物的时候,我不得不重新学习某些概念和课程. 所以,我编辑了一份包括概念.定义.资源以及工具的知识合集,这对于在这个复杂领域从事工作的我来说非常有用. 希望这些东西对于即将进入机器学习这个精彩(有时是令人沮丧)世界的朋友来说也会起到一定的帮助作用. 如何最有效率地学习机器学习 老实说,每个人都有适合自己的学习方法.对我个人而言,最好的方法就是反复把在项目中学到的东西应用到其他地方,直到把它彻底弄明白弄熟练

快速读懂机器学习(附送详细学习资源)

前言: 机器学习作为人工智能中的伟大分支,让我们先来聊聊人工智能把.现在人工智能已经非常普遍了,从之前的阿尔法狗到现在中国人工智能机器人解答北京高考数学卷 考了105分.以及2017.6.6的苹果WWDC大会上宣布开发机器学习API,苹果想通过借此之举,让更过苹果开发者用户开发出更过用户体验好的应用,人工智能的例子真是数不胜数,已经渗透到我们生活的各方各面,比较常见的比如金融以及医疗,而且之前看了一篇文章这样评价金融业:随着人工智能的发展与普遍,以后金融业对求职者的要求需要掌握人工智能相关知识来

机器学习太难?这里有一份详细到周的入门学习计划

编者按:本文首发于 medium,作者 Suff,他在文章中为许多想入门机器学习却苦苦没有开始的读者们提供了一份学习计划,详细到周的规划可以让你更加游刃有余地把握进度.雷锋网整理编译,未经许可不得转载. 哈喽,大家好!如果你点进了这篇文章,那你应该是想要学习一些机器学习的知识的.如果你还没有想好,或者觉得有些困惑,那么我得提前给你打个预防针:学习机器学习的过程其实是比较艰辛的. 如果你始终怀有坚持的信念,并且大胆尝试的话,你就可以从这篇指导中比别人得到更多.因为这篇指导不仅能帮你形成一种全新的思

有了深度学习,传统的机器学习算法没落了吗,还有必要去学习吗?

深度学习在最近两年非常火爆,它迅速地成长起来了,并且以其疯狂的实证结果着实令我们惊奇. 但深度学习是否真的就取代了传统或者其他机器学习算法了呢?那么,传统的机器学习还有必要去学习吗? 首先来看一位同学的心得: Google DeepMind研发工程师Jack 谈及深度学习会导致其他学习算法濒临灭绝,我不赞同,也不反对,因为学习成本和时间是成正比的. 你需要一个自上而下的方法来学习机器学习.一种你想要专注于实际结果的方法:使用现代的方式和"单项最优"的工具与平台来处理实际的端到端的机器学