《实用机器学习》——第1章 引论

第1章 引论

实用机器学习
随着计算机和互联网越来越深入到生活中的方方面面,人们搜集到的数据也呈指数级的增长。在这种情况下,大数据(big data)应运而生。大数据通常体量特别大,而且数据比较复杂,使得无法直接使用传统的数据库工具对其进行存储和管理。大数据带来了很多挑战,如数据的搜集、整理、存储、共享、分析和可视化等。广义的大数据处理涵盖了上述所有领域;狭义的大数据更多是指如何使用机器学习来分析大数据,从海量的数据中分析出有用的信息。

大数据分析的核心是机器学习算法。很多时候,我们有足够的数据,但是对如何利用这些数据缺乏理解。同时,实际问题往往比较复杂,并不能直接套用机器学习算法,我们需要对实际问题进行一些转化,使得机器学习算法可以应用。虽然实际问题表现形式各异,但是在将它们转化为机器学习能够处理的问题时,一般转化为如下4类问题:(1)回归问题;(2)分类问题;(3)推荐问题;(4)排序问题。这4类问题是实际应用中最主要的类型,覆盖了大部分实际问题。在1.3节,我们将详细介绍每类问题的具体例子。

时间: 2024-10-18 06:59:31

《实用机器学习》——第1章 引论的相关文章

《实用机器学习》——导读

前言 实用机器学习本书侧重于数据分析和机器学习的实践,涉及从原始数据搜集到建立模型解决问题再到算法性能评估的全过程.书中主要介绍实践中最常用的4类算法,包括回归算法.分类算法.推荐算法和排序算法.此外,书中还会介绍集成学习.集成学习是一类通过综合多个模型取长补短以取得更好效果的方法,对于回归.分类.推荐和排序问题都适用.在实践中,充分掌握这4类算法和集成学习即可解决相当多的实际问题.由于篇幅所限,聚类分析.关联规则等其他相关内容书中并没有一一介绍. 对于每种算法,本书首先介绍算法的原理.在理解算

【PMP】PMBOK 笔记 第1章 引论

第1章 引论 总结 本章是对整本书的知识体系的前提. 重点在于理解项目组合.项目集和项目之间的关系,以及对应管理的区别. 第一章提到了5个过程组,但是没有深入. 重点不多,在于理解. 1.1 目的 项目管理体系,能够提高很多项目成功的可能性. 1.2 什么是项目 项目是为创造独特的产品.服务或成果而进行的临时性工作. 项目可以在组织的任何层面上开展.一个项目可能只涉及一个人,也可能涉及很多人:可能只涉及一个组织单元,也可能涉及多个组织的多个单元. 持续性工作通常是遵循组织已有流程的重复性过程.

【PMP认证考试之个人总结】第1章 引论

第1章 引论    -- PMP个人学习笔记      <PMP个人备考笔记(全篇)>下载 1.1 PMBOK指南的目的 1.PMBOK指南收录项目管理知识体系中被普遍认可为"良好做法"的那一部分. ①所谓"普遍认可":指这些知识和做法,在大多数的时候,适用于大多数项目,并且其价值和有效性已获得一致认可: ②所谓"良好做法":指人们普遍认为,使用这些知识.技能.工具和技术,能够提高很多项目成功的可能性(但不意味着一成不变的应用于所有项

《实用机器学习》——1.4 本书概述

1.4 本书概述 本书主要从解决实际问题的角度来介绍常用的机器学习算法.在1.3节中我们讨论了机器学习中常见的4类典型问题,基本上覆盖了目前实际中可以使用机器学习算法来解决的主要问题类型.在本书中,我们将主要讨论对应的4类算法,包括: 回归算法: 分类算法: 推荐算法: 排序算法. 其中回归算法和分类算法是两类最常用的算法,也是其他很多算法的基础,因此我们首先予以介绍.推荐系统在目前有了越来越多的应用,而排序算法在搜索引擎等领域也获得了广泛的应用,因此我们也会对常用的推荐算法和排序算法进行介绍.

《编译与反编译技术》——第一章 引论 1.1节编译器与解释器

人类之间的交流是通过语言进行的,但语言不是唯一的,不同的语言之间需要翻译,这就导致了翻译行业的建立.人与计算机之间也是通过语言进行交流的,但人类能理解的语言与机器能理解的语言是不同的,也需要翻译,这就导致了系列编译器的诞生.编译技术所讨论的问题,就是如何把符合人类思维方式的意愿(源程序)翻译成计算机能够理解和执行的形式(目标程序).实现从源程序到目标程序转换的程序,称为编译程序或编译器.反编译技术所讨论的问题,就是如何把计算机能够理解和执行的形式(目标程序)翻译成便于人类理解的形式(高级语言源程

《实用机器学习》——1.3 实际应用

1.3 实际应用 在本节中,我们将会介绍一些可用机器学习解决的实际问题,包括病人住院时间预测.信用分数估计.Netflix上的影片推荐和酒店推荐.每个例子都对应一类不同的机器学习问题.通过这些不同类型的机器学习问题,读者对机器学习可以有更多直观的感受. 1.3.1 病人住院时间预测 机器学习在医疗行业有着广泛的应用.我们以Heritage Health Prize②竞赛作为例子以说明如何使用机器学习来预测病人未来的住院时间. 在美国每年都有超过7000万人次住院.根据相关统计,2006年在护理病

《实用机器学习》——1.2 机器学习算法的分类

1.2 机器学习算法的分类 在机器学习中,常用的算法可以分为监督型学习(supervised learning)和非监督型学习(unsupervised learning)①. 在监督型学习中,除了输入数据x外,我们还知道对应的输出y.我们的目标是构建一个函数f(x),使得f(x)能够预测输出y.在非监督型学习中,我们只有输入数据x,没有对应的输出y.我们的目标是从数据中学习数据本身存在的模式(pattern).例如,聚类分析(cluster analysis)就是一个非监督型学习的典型例子,它

畅销榜上的机器学习、深度学习书单!

机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为.机器学习是人工智能的核心,是使计算机具有智能的根本途径. 近年来,机器学习领域受到越来越多的关注,相关的机器学习算法开始成为热点,知乎上同类问题同样不少,如机器学习该怎么入门?机器学习.数据挖掘 如何进阶成为大神?普通程序员如何向人工智能靠拢?学习人工智能该看什么书? 今天小编整理了一些机器学习.深度学习.人工智能相关图书,涉及到的关键词如下:深度学习.Tensor

机器学习经典书籍介绍

机器学习经典书籍小结 <数学之美>:作者吴军大家都很熟悉.这本书主要的作用是引起了我对机器学习和自然语言处理的兴趣.里面以极为通俗的语言讲述了数学在这两个领域的应用. <Programming Collective Intelligence>(中译本<集体智慧编程>):作者Toby Segaran也是<BeautifulData : The Stories Behind Elegant Data Solutions>(<数据之美:解密优雅数据解决方案背