前言
机器学习项目开发实战
如果你手里拿着这本书,我就可以认定你是对机器学习感兴趣的.NET开发人员了。你可能对编写C#应用程序很熟悉,开发的很有可能是业务线应用程序。以前你可能遇到过F#,也可能没有。而且,你很有可能对机器学习感到好奇。这一主题每天都见诸报端,因为它和软件工程有着很紧密的联系,但是使用的是不熟悉、看似有些抽象的数学概念。简而言之,机器学习看上去是有趣的主题、值得学习的实用技能,但是从哪里入手难以说清。
本书的意图是作为开发人员的机器学习入门书。我的主要目标是使熟悉代码编写的读者(而不是数学家)容易理解书中的主题。对数学的喜爱当然没有坏处,但是本书通过实用的示例学习核心概念,说明其中的工作原理。
什么是机器学习?机器学习是一种编程艺术,所编写的计算机程序随着可用数据越来越多而更好地执行任务,无须开发人员更改代码。
上述定义相当宽泛,反映了机器学习广泛适用于各个领域这一事实。但是,该定义中的一些具体特征值得更详细说明。机器学习是关于程序编写的学科,这些代码运行于生产环境并执行某项任务,这使它不同于统计学。机器学习是一个跨学科的领域,这个主题既和倾向于数学的研究人员相关,也和软件工程师相关。
定义中另一个有趣的部分是数据。机器学习是关于利用可用数据解决实际问题的学科。使用数据是机器学习的关键部分,理解数据、研究如何从中提取有用信息,往往比使用的特定算法更重要。因此,我们将从数据开始了解机器学习。每章都从一个真实的数据集和所要解决的特定问题开始,数据中包含了现实世界中的所有不完善和意外。由此,我们将在这一背景下从头开始构建问题解决方案,在需要的时候介绍思路。在此过程中,我们将创建一个基础,帮助你理解不同思路的组合使用,使你在以后需要的时候更有效率地使用库或者框架。
我们的探索从熟悉的C#和Visual Studio开始,但是在取得进展之后将介绍F#,这是一种特别适合于机器学习问题的.NET语言。正如机器学习,函数式编程一开始令人生畏。然而,一旦掌握了诀窍,F#就会变得很简单且极具效率。如果你完全是F#的初学者,本书将告诉你该语言所需了解的一切,你将在现实、有趣的问题中学习如何高效地使用该语言。
学习过程中,我们将探索各种各样的问题,帮助你理解机器学习能使应用程序变得更好的领域,有些方法可能出人意料。我们将探索图像识别、垃圾邮件过滤器和自我学习游戏以及其他一些问题。而且,在我们共同的旅途上,你将发现机器学习并没有那么复杂,相当简单的模型就能产生令人惊讶的出色结果。最后,你将会发现,机器学习非常有趣!好了,不多啰唆了,让我们一起对付第一个机器学习问题吧!
目录
第1章 256级灰度
1.1 什么是机器学习
1.2 经典的机器学习问题:图像分类
1.3 我们的第一个模型(C#版本)
1.4 那么,如何知道程序有效?
1.5 介绍用于机器学习的F
1.6 改进我们的模型
1.7 我们学到了什么
1.8 更进一步
第1章 256级灰度
2.1 挑战:构建一个垃圾邮件检测引擎
2.2 根据一个单词决定
2.3 组合多个单词
2.4 实现分类器
2.5 训练第一个分类器
2.6 改进分类器
2.7 理解分类错误
[2.8 我们学到了什么?()
第2章 垃圾邮件还是非垃圾邮件?
第3章 类型提供程序的快乐
第4章 自行车与人
第5章 你不是独一无二的雪花
第6章 树与森林
第7章 一个奇怪的游戏
第8章 重回数字
第9章 结语
第2章 垃圾邮件还是非垃圾邮件?
第3章 类型提供程序的快乐
第4章 自行车与人
第5章 你不是独一无二的雪花
第6章 树与森林
第7章 一个奇怪的游戏
第8章 重回数字
第9章 结语