模式识别与机器学习第一讲(下)

本文接模式识别与机器学习第一讲(上)。关键词:随机变量、条件概率、边际概率、sum rule、product rule、贝叶斯公式、先验概率、后验概率、独立、概率质量函数、概率密度函数、累计分布函数、多元分布、换元、期望、条件期望、方差、协方差。

1.2 Probability Theory

动机:模式识别里的一个关键概念是不确定性。不确定性的来源有两个:测量的噪声以及数据集大小有限。概率论提供了一种量化和操作不确定性的工具,是模式识别的根基之一。当我们同时运用概率论和决策论,我们可以基于给定信息做出最优预测,无论信息是否完整、明确。

如没有特别强调,以下均表示随机变量。严格地说一个随机变量是一个从样本空间(sample space, 潜在结果的集合)到可测空间(measurable space)的可测函数(measurable function)。这涉及到测度论的知识,远远超出了本书对读者数学知识的假设。鉴于我们这里不追求严格的定义,可以认为一个随机变量是一个可以从一个集合中取不同值的变量。

条件概率表示已知的情况下,发生的概率,被称为给定,的条件概率。我们可以把这一定义拓展到给定多于一个条件的情况下如

sum rule, 这里的常被称为边际概率(marginal probability),因为它可经由取便其它变量(如)的所有可能值时,计算与它们的联合分布的概率的总和来得到。

product rule

symmetry property

基于product rule和symmetry property,我们可以得到大名鼎鼎的贝叶斯定理/公式(Bayes' theorem):。由sum rule, product rule和symmetry property可得。因此上式中可被看做使左边取所有可能值的条件概率之和为1 的归一化常数。

sum rule,product rule以及symmetry property像条件概率一样可以被拓展到多于两个随机变量的情况。

贝叶斯定理的一个重要解释涉及先验概率(prior probability)和后验概率(posterior probability)。通俗地讲,先验概率是我们一无所知的情况下根据经验、常规情况计算的,后验概率是在我们得到了新的信息情况下对先验概率进行的修正,更加准确。我们可以考虑的先验概率而为知道的后验概率。

独立为两个随机变量,如果,我们称独立于独立于或者彼此独立。注意这种情况下。我们还会经常见到两两独立(pairwise independence,一个随机变量的集合中任取两个随机变量都彼此独立)和彼此独立(mutually independence,对于一个随机变量的集合,它们一起的联合分布概率等于它们各自的分布概率之积: )。

1.2.1 Probability densities

随机变量有离散型和连续性两种。离散型随机变量定义在事件的离散集合上(如筛子的点数,硬币的正反等等),连续型随机变量定义在事件的连续集合上(如区间)。就像离散型随机变量与概率质量函数(probability mass function)相关联一样,连续型随机变量与概率密度函数(probability density function)相关联。

a. 概率密度函数具有以下特点:

  • ;
  • ;
  • 的概率为

b. 换元/变量选择

给定的概率密度函数,令,则有。一个相关的结果是概率密度函数的最大值取决于变量的选择。

c. 累积分布函数(cumulative distribution function)

的概率为,被称为累积分布函数。

d.多元分布

考虑多个连续型随机变量的联合分布。假设我们有个连续型随机变量,我们可以用一个向量把它们“封装”起来:使得。如此得到的概率密度函数仍然要满足 a 部分的特点。我们同样也可以考虑离散型随机变量和连续型随机变量的联合分布。

1.2.2 期望(expectation)和协方差(covariance)

期望:函数在概率分布下的平均值被称为的期望,用表示。

  • 对于离散型随机变量,
  • 对于连续型随机变量,

给定概率分布采集到的个数据点: ,我们可以近似计算的值为。由大数定理可知,随着,这一近似逼近

当我们考虑多变量函数的期望时,我们可以在右下角加一个下标表示关于哪个随机变量取期望,如表示关于的期望。

条件期望(conditional expectation)在条件概率分布下的平均值被称为的条件期望,用表示。

  • 对于离散型随机变量,
  • 对于连续型随机变量,

方差(variance)的方差为。可以认为方差衡量了附近的变化性。

协方差(covariance):对于任意两个随机变量,它们之间的协方差定义为,它反映了一起变化的程度。

  • 一个随机变量与其本身之间的协方差等于其方差。
  • 彼此独立时,
  • 为两个随机变量的向量时,设含有个元素,含有个元素,此时实际上是一个的矩阵,并且矩阵中第行的第个元素代表了之间的协方差。
  • 对于任意一个随机变量的向量

1.2.3 Bayesian probabilities

这一节可以用一个问题来概括:什么是概率?之前知乎上也有类似的讨论:概率(Probability)的本质是什么? - 知乎

  • 庞加莱说,“概率仅仅是我们无知程度的度量,据定义,我们不晓得其定律的现象,都是偶然现象”。
  • 不少数学家说,概率是定义在-代数上,值域为[0, 1]的测度。
  • 频率论者(frequentist古典统计学者)说,概率是随机、可重复事件的出现频率。
  • 贝叶斯论者(Bayesian)说,概率提供了一种对不确定性的量化。

本文作者:Non

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-03 20:25:21

模式识别与机器学习第一讲(下)的相关文章

模式识别与机器学习第一讲(上)

关键词:有监督学习.无监督学习.强化学习.回归.分类.误差函数.泛化.正则化.超参数.验证集. 序言 从去年5月入坑以来,线上线下都上过机器学习的课(线上是看了Coursera的课入门,线下上了DS-GA 1003 Machine Learning and Computational Statistics),但从没有完整读过一本书. 暑假和小伙伴们约好一起读Pattern Recognition and Machine Learning(模式识别与机器学习,下简称PRML).初步打算每周读一章,

Android 开发者如何通过运动视觉 API 进行机器学习 - 第一部 - 人脸检测

本文讲的是Android 开发者如何通过运动视觉 API 进行机器学习 - 第一部 - 人脸检测, 在计算机科学中,机器学习是一个非常有意思的领域,它已经在我的最想学习的愿望清单中驻留已久.因为有太多来自于RxJava, Testing, Android N, Android Studio 以及其他 Android 相关的技术更新,所以我都每能花时间来学习这个.甚至在 Udacity 还专门有一个有关机器学习的课程. . 让我非常激动的发现是,目前任意一个开发人员都能基于运动视觉(Mobile

计算机视觉与图像处理、模式识别、机器学习学科之间的关系

在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分.纵观一切关系,发现计算机视觉的应用服务于机器学习.各个环节缺一不可,相辅相成. 计算机视觉(computer vision),用计算机来模拟人的视觉机理获取和处理信息的能力.就是是指用摄影机和电脑代替人眼对目标进行识别.跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像.计算机视觉研究相关的理论和技术

第一讲 Java语言概述

★ 第一讲 Java语言概述 [课前思考] 1. 一门新的语言的产生是否需要借鉴以前的编程语言? 2. 在java语言出现之前是否存在其它跨平台的语言? 3. 有哪些编程语言是面向对象的?而哪些编程语言是面向过程的?从编程思路上存在着哪些本质差别?C++语言是面向对象的还是面向过程的? 4. 一段优秀的程序代码是否应该是可读性极强的?程序员之间是否应该遵循相同的编程规范? 5. 一个程序员编好的代码如果需要让别的程序员使用,如何提供该代码的使用说明? 1.1 java语言的发展史 1.1.1 j

LFCS 系列第一讲:如何在 Linux 上使用 GNU sed 等命令来创建、编辑和操作文件

LFCS 系列第一讲:如何在 Linux 上使用 GNU sed 等命令来创建.编辑和操作文件 Linux 基金会宣布了一个全新的 LFCS(Linux 基金会认证系统管理员Linux Foundation Certified Sysadmin)认证计划.这一计划旨在帮助遍布全世界的人们获得其在处理 Linux 系统管理任务上能力的认证.这些能力包括支持运行的系统服务,以及第一手的故障诊断.分析,以及为工程师团队在升级时提供明智的决策. Linux 基金会认证系统管理员--第一讲 请观看下面关于

JQuery从头学起第一讲_jquery

JQuery的重要性对一个coder来说应该是不言而喻的, 多少次在应聘的时候被问及是否会JQuery:多少次在写脚本的时候因为浏览器的不兼容而吐血:多少次因为需要用脚本做一个简单的效果而写到手抽筋.JQuery出现后,很多问题都被轻易解决了. 每学一样东西的时候,我们总是喜欢去了解下它的历史.既然是从头学起,我们也来稍微了解下它的历史. jQuery由美国人John Resig创建,至今已吸引了来自世界各地的众多javascript高手加入其team,包括来自德国的Jörn Zaefferer

BrnShop开源网上商城第一讲:架构设计

原文:BrnShop开源网上商城第一讲:架构设计 首先在此感谢大家对BrnShop项目的支持和鼓励!我们在发布BrnShop以前曾推测项目会受到不少园友的支持,但没想到园友们的支持大大超过我们的预测.4天6000次浏览,140个推荐,170个评论,8000次下载.看到这些数据后我们内心除了激动外,更多了一份责任.无论将来遇到多大的困难,我们一定要坚持把BrnShop坚持到底!! 如果你还不知道BrnShop是什么或还没有下载源码的可以点此下载,如果下载源码后发现商城有bug,也可以点此下载(什么

jquery基础知识第一讲之认识jquery_jquery

jQuery是一个优秀的JavaScript库,它凭借简洁地语法和跨平台的兼容性,极大地简化了开发人员遍历HTML文档,操作DOM,处理事件,执行动画和开发Ajax操作. jQuery优势: 1.轻量级 2.强大的选择器 3.出色的DOM操作的封装 4.可靠的事件处理机制 5.完善的Ajax 6.不污染顶级变量 7.出色的浏览器兼容性 8.链式操作方式 9.隐式迭代 10.行为层与结构层分离 11.丰富的插件支持 12.完善的文档 13.开源 (1)编写简单的jQuery代码: 注:$ 就是jQ

c++-哪位大师可以给我讲下给一维对象数组赋值的问题吗???谢谢

问题描述 哪位大师可以给我讲下给一维对象数组赋值的问题吗???谢谢 哪位大师可以给我讲下给一维对象数组赋值的问题吗???就比如给Employee emp[5]emp的五个元素赋值 解决方案 Employee emp[5]只是声明了5个对象,没有实例全是空的,赋值的时候要new新的对象实例出来.@caozhy给的代码不正确,没有加new.修改为:for (int i=0;i<5;i++)emp[i]=new Employee(构造函数的参数); 解决方案二: 循环,一个一个赋值.这个又什么好讲的.