机器学习之——认识机器学习

前段时间,google的alphaGo让大家的眼睛都聚焦到这一“人工智能”上了。那么就当时应景吧,写一写我关于机器学习的一些笔记及认识,内容主要根据在Coursera上Andrew Ng大神的课程来做笔记。

首先,什么是机器学习?

参照百度百科的讲解,“机器学习是一门多领域交叉学科,设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢?也就是说,机器学习是一门跨领域的学科,是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中,提到了几个机器学习的定义:

1,Arthur Samuel (1959) :
Machine Learning is a field of study that gives computers the ability to learn without being explicitly programmed.

塞缪尔亚瑟 : 机器学习是一门给予计算机不需要显式编程而获得学习能力的领域。

2,Tom Mitchell (1998) : Well-posed Learning Problem : A computer program is said to learn from experience E with expect to some tasks T and some performance measure P , if its performance on T , as measured by P ,
improve with experience E
.

汤姆米切尔: 学习程序的问题:计算机程序如果通过一些预期的任务T在一些特定的特征P的标准下学习到经验E,那么就说明这个计算机程序通过经验E获得了提升。(比较抽象)

米切尔的定义,是比较抽象但是又比较准确的,能够大体概括出机器学习的主要方法和目的。通俗点儿讲,当你手上有一堆带有指标的数据,比如一个班级学生的身高(height)、体重(weight)、性别(gender)、成绩排名(rank),看上去这些数据是没有什么必要联系的,但是你想模拟出一个公式来计算或预测一个学生的成绩是和身高、体重、性别有某些必然联系,假设 

rank = ø0+ø1*height + ø2 * weight + ø3 * gender

但是你又无法确定ø0、ø1、ø2、ø3这些参数的值,所以获取这几个参数的值的方法,就是机器学习算法。

那么机器学习有哪些方法呢?

机器学习,大体上分成两个分类:监督学习(supervised learning)和非监督学习(unsupervised learning);细分的话,还有半监督学习(half-supervised learning)和增强学习(reinforcement learning

如何来区分监督学习和非监督学习呢?其实很简单,只要看,你的训练集是有输入有输出,那么通过这样的训练集获取到的算法,就是监督学习算法;反之,如果你的训练集是只有输入没有输出,那么最后得到的算法就是无监督学习算法。半监督学习呢,就是当你的训练集中,有一部分是标记的数据(有input和output),一部分是非标记数据(有input无output),那么就是半监督学习;强化学习,通过其他学习后得到的算法,在你的另外一组数据的刺激下得到的更为精准的算法,这样的方式就是强化学习。

OK,后续的blog会继续做机器学习的笔记及分享。

时间: 2025-01-01 00:24:22

机器学习之——认识机器学习的相关文章

Spark机器学习9· 实时机器学习(scala with sbt)

Spark机器学习 1 在线学习 模型随着接收的新消息,不断更新自己:而不是像离线训练一次次重新训练. 2 Spark Streaming 离散化流(DStream) 输入源:Akka actors.消息队列.Flume.Kafka.-- http://spark.apache.org/docs/latest/streaming-programming-guide.html 类群(lineage):应用到RDD上的转换算子和执行算子的集合 3 MLib+Streaming应用 3.0 build

机器学习 书籍推荐-机器学习 有助提高的书籍推荐

问题描述 机器学习 有助提高的书籍推荐 本人一个刚入学的研究生,方向是机器学习,本科阶段已经算是入了门了,想让各位推荐一下有助提高的书籍 解决方案 的确非常好,而且有课件可以下载,需要的告诉我 解决方案二: 斯坦福大学NG andraw的视频不错 解决方案三: 网易公开课斯坦福大学NG andraw

如何高效运作机器学习团队(机器学习入门第四篇)

本文是机器学习入门教程的第四篇,前三篇分别是: 1.机器学习能为你的业务做什么?有些事情你肯定猜不到 2.关于机器学习算法 你需要了解的东西 3.如何开发机器学习模型? 我们已经讨论了开发机器学习模型的整个过程,现在我们来谈谈谁来实现这个过程,以及团队是如何运作的. 一个欢乐的大家庭 一个"传统"的产品团队由设计师.工程师和产品经理组成,而数据分析师有时也会包含在其中,但大多数情况下是多个团队共享这个稀缺的资源.在数据科学成为公司DNA一部分的时候,数据科学家必须要成为产品团队的一个重

学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退

AI早期成就,相对朴素形式化环境,不要求世界知识.如IBM深蓝(Deep Blue)国际象棋系统,1997,击败世界冠军Garry Kasparov(Hsu,2002).国际象棋,简单领域,64个位置,严格限制方式移动32个棋子.可由简短.完全形式化规则列表描述,容易事先准备.抽象.形式化,是人类最困难脑力任务,但计算机最容易.早期打败人类最好象棋选手,最近识别对象.语音任务达到人类平均水平.日常生活需要世界巨量知识,主观.直观,很难形式化表达.计算机智能需要获取同样知识.关键挑战,非形式化知识

畅销榜上的机器学习、深度学习书单!

机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为.机器学习是人工智能的核心,是使计算机具有智能的根本途径. 近年来,机器学习领域受到越来越多的关注,相关的机器学习算法开始成为热点,知乎上同类问题同样不少,如机器学习该怎么入门?机器学习.数据挖掘 如何进阶成为大神?普通程序员如何向人工智能靠拢?学习人工智能该看什么书? 今天小编整理了一些机器学习.深度学习.人工智能相关图书,涉及到的关键词如下:深度学习.Tensor

【阿里云大学课程】机器学习入门:概念原理及常用算法

AlaphaGo与围棋界的较量,吸引了全世界的目光,也让大家见识到了机器学习与人工智能技术的强大之处.你是不是也想学机器学习了? 机器学习是人工智能的一个分支.人工智能的研究是从以"推理"为重点到以"知识"为重点,再到以"学习"为重点,一条自然.清晰的脉络.显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题. 在维基百科中,机器学习有下面几种定义: 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如

阿里云机器学习——让人工智能触手可及

1.概述 近期,阿里云计划将旗下机器学习平台正式商业化发布.说到机器学习可能有些人会比较迷惑,但是提到人工智能,人们马上就联想到了刷脸支付.人机智能交互.商品智能推荐等场景,机器学习算法就是助力这些人工智能应用的底层算法. 最近几年,机器学习发展趋势火热,主要是我们在深度学习技术上取得了一定的进展,总结起来应该是三大因素: 数据:互联网上每天生成海量的数据,有图像.语音.视频.还有各类传感器产生的数据,例如各种定位信息.穿戴设备:非结构化的文本数据也是重要的组成部分.数据越多,深度学习越容易得到

13个最流行机器学习框架 帮你解决网络安全机器学习的困难问题

在过去的一年中, 机器学习 发展得热火朝天,已成为主流.机器学习的"空降"并非仅仅由廉价的云环境以及 日益强大的GPU硬件驱动 ,同时也受到了开源框架的蓬勃发展的影响.这些开源框架用于提取机器学习中最困难部分,使机器学习可供广泛开发者使用. 用机器学习解决网络安全问题 开源机器学习框架能助力 < 你的机器学习到底解决了什么? >一文中指出 没有什么机器学习厂商,只有应用机器学习解决特定问题的厂商,因为它本身无法独立解决任何问题,只是解决特定问题的手段,至少应该用于事件响应.

《Python机器学习实践指南》——导读

前言 Python机器学习实践指南 机器学习正在迅速成为数据驱动型世界的一个必备模块.许多不同的领域如机器人.医学.零售和出版等,都需要依赖这门技术.在这本书中,你将学习如何一步步构建真实的机器学习应用程序. 通过易于理解的项目,你将学习如何处理各种类型的数据,如何以及何时应用不同的机器学习技术,包括监督学习和无监督学习. 本书中的每个项目都同时提供了教学和实践.例如,你将学习如何使用聚类技术来发现低价的机票,以及如何使用线性回归找到一间便宜的公寓.本书以通俗易懂.简洁明了的方式,教你如何使用机