《模式识别原理及工程应用》——2.2 贝叶斯决策理论

2.2 贝叶斯决策理论

2.2.1 贝叶斯决策理论的概念

贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。贝叶斯决策就是在不完全情况下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。

1.贝叶斯决策理论分析

1)如果我们已知被分类类别概率分布的形式和已经标记类别的训练样本集合,那我们就需要从训练样本集合中来估计概率分布的参数。在现实世界中有时会出现这种情况。(如已知为正态分布了,根据标记好类别的样本来估计参数,常见的是极大似然率和贝叶斯参数估计方法。)

2)如果我们不知道任何有关被分类类别概率分布的知识,已知已经标记类别的训练样本集合和判别式函数的形式,那我们就需要从训练样本集合中来估计判别式函数的参数。在现实世界中有时会出现这种情况。(如已知判别式函数为线性或二次的,那么就要根据训练样本来估计判别式的参数,常见的是线性判别式和神经网络。)

3)如果我们既不知道任何有关被分类类别概率分布的知识,也不知道判别式函数的形式,只有已经标记类别的训练样本集合,那我们就需要从训练样本集合中来估计概率分布函数的参数。在现实世界中经常出现这种情况。(如首先要估计是什么分布,再估计参数。常见的是非参数估计。)

4)只有没有标记类别的训练样本集合。这是经常发生的情形。我们需要对训练样本集合进行聚类,从而估计它们概率分布的参数。(这是无监督的学习。)

5)如果我们已知被分类类别的概率分布,那我们不需要训练样本集合,利用贝叶斯决策理论就可以设计最优分类器。但是,在现实世界中从没有出现过这种情况。

结论:对于任何给定问题,可以通过似然率测试决策规则得到最小的错误概率。这个错误概率称为贝叶斯错误率,且是所有分类器中可以得到的最好结果。最小化错误率的决策规则就是最大化后验概率判据。

2.贝叶斯决策判据

贝叶斯决策理论方法是统计模式识别中的一个基本方法。贝叶斯决策判据既考虑了各类参考总体出现的概率大小,又考虑了因误判造成的损失大小,判别能力强。

贝叶斯决策理论方法适用于下列场合:

1)样本数量不充分大,因而样本统计理论不适宜的场合。

2)试验具有继承性,反映在统计学上就是要具有在试验之前已有先验信息的场合。

用这种方法进行分类时要求两点:

1)要决策分类的参考总体的类别数是一定的。例如两类参考总体(正常状态D1和异常状态D2)或L类参考总体D1,D2,…,DL(如良好、满意、可以、不满意、不允许……)。

2)各类参考总体的概率分布是已知的,即每一类参考总体出现的先验概率p(Di)和各类概率密度函数p(xDi)是已知的。显然,0≤p(Di)≤1(i=1,2,…,L),Σp(Di)=1。

对于两类故障诊断问题,就相当于在识别前已知正常状态D1的概率p(D1)和异常状态D2的概率p(D2),它们是由先验知识确定的状态先验概率。如果不做进一步的仔细观测,仅依靠先验概率去作决策,那么就应给出下列决策规则:若p(D1)>p(D2),则做出状态属于D1类的决策;反之,则做出状态属于D2类的决策。例如,某机器设备在365天中,有故障是少见的,无故障是经常的,有故障的概率远小于无故障的概率。因此,若无特别明显的异常状况,就应判断为无故障。显然,这样对某一实际的待检状态根本达不到诊断的目的,这是由于只利用先验概率提供的分类信息太少了。为此,我们还要对系统状态进行状态检测,分析所观测到的信息。

2.2.2 基于最小错误率的贝叶斯决策与实现

1.两类情况

两类情况是多类情况的基础,多类情况往往是用多个两类情况解决的。

1)用wi,i=1,2表示样本x(一般用列向量表示)所属的类别。

2)假设先验概率p(w1),p(w2)已知。这个假设是合理的,因为如果先验概率未知则可以从训练特征向量中估算出来,即如果N是训练样本总数,其中有N1,N2个样本分别属于w1,w2,则相应的先验概率为:

3)假设(类)条件概率密度函数p(xwi),i=1,2已知,用来描述每一类中特征向量的分布情况。如果类条件概率密度函数未知,则可以从可用的训练数据中估计出来。

贝叶斯判别规则的两类情况描述为:

2.多类情况

1)w1,w2,…,wm表示样本x所属的m个类别。

2)先验概率p(wi),i=1,2,…,m。

3)假设类条件概率密度函数p(xwi),i=1,2,…,m已知,计算后验概率后,若

则x∈wi类。这样的决策可使分类错误率最小,因此叫做基于最小错误率的贝叶斯决策。

R1和R3的分界点是p(xw1)p(w1)=p(xw3)p(w3)的交点。

R2和R3的分界点是p(xw2)p(w2)=p(xw3)p(w3)的交点。



2.2.3 基于最小风险的贝叶斯决策与实现

有时最小错误率准则并不一定是最重要的或最好的指标。但对语音识别、文字识别来说可能这是最重要的指标。

有些情况下,宁可扩大一些总错误率,也要使损失减小,减小产生的后果的严重性。因此引入与损失有关联、比损失更广泛的概念——风险。

1.最小风险贝叶斯决策规则

2.最小风险贝叶斯决策的步骤

3.最小错误率与最小风险的贝叶斯决策规则的联系


时间: 2024-08-17 15:01:37

《模式识别原理及工程应用》——2.2 贝叶斯决策理论的相关文章

《模式识别原理及工程应用》——第2章 基于贝叶斯决策理论的分类器 2.1 分类器的描述方法

第2章 基于贝叶斯决策理论的分类器 2.1 分类器的描述方法 分类器是一种计算机程序,它的设计目标是在通过学习后,可自动将数据分到已知类别.分类器常应用在搜索引擎以及各种检索程序中,同时也大量应用于数据分析与预测领域.分类器是一种机器学习程序,因此归为人工智能的范畴.人工智能的多个领域,包括数据挖掘.专家系统.模式识别,都用到此类程序.对于分类器,其实质为数学模型.针对模型的不同,目前有多种分支,包括:贝叶斯网络分类器.决策树算法.SVM(支持向量机)算法等. 解决分类问题的方法很多,单一的分类

《模式识别原理及工程应用》一1.5 本书的主要内容

1.5 本书的主要内容 全书共分为12章. 第1章为模式识别概述,讲述模式识别的基本概念.主要方法.系统的构成及其应用. 第2章为基于贝叶斯决策理论的分类器,重点讲述作为监督模式识别理论基础的贝叶斯决策理论及统计判别. 第3章为概率密度函数的估计,主要介绍概率密度函数的基本估计方法,包括参数估计方法及非参数估计方法. 第4章为判别函数分类器的设计,详细介绍线性判别函数及非线性判别函数. 第5章为近邻法,介绍几种常见的近邻法,包括最近邻法.k-近邻法.剪辑近邻法和压缩近邻法. 第6章为特征选择,介

《模式识别原理及工程应用》一1.4 模式识别系统的应用举例

1.4 模式识别系统的应用举例 从20世纪末到21世纪初,随着模式识别理论和技术自身的发展及计算机数据处理能力的飞速提高,模式识别技术的应用已经开始进入各行各业.这里,我们列举几个典型的例子来说明模式识别系统的一般构成,同时从这些例子也可以看出模式识别技术广阔的应用前景. 1.4.1 指纹识别 人的指纹具备唯一性.终身不变性.易获取和难以复制等特点,这使得指纹识别很早就成为身份识别中的一种技术手段.随着科学技术的发展,指纹识别已经成为目前应用最为广泛的生物识别技术,尤其在民用 图1-4-1 指纹

《模式识别原理及工程应用》一1.3 模式识别系统

1.3 模式识别系统 模式识别系统由两个过程组成,即设计和实现.设计是指用一定数量的样本进行分类器的设计,实现是指用所设计的分类器对要识别的样本进行分类决策.本书只讨论决策理论方法,基于决策理论的模式识别系统主要由4个部分组成:数据获取,预处理,特征提取和选择,分类决策,如图1-3-1所示. 下面我们对这几个部分作简单的说明.1.数据获取 为了使计算机能够对各种现象进行分类识别,要用计算机可以运算的符号来表示所研究的对象,通常输入对象的信息有以下3种类型: 1)二维图像:如文字.指纹.地图.照片

《模式识别原理及工程应用》一第1章 模式识别概述

第1章 模式识别概述 1.1 模式识别的基本概念 模式识别(pattern recognition)是人类的一项基本智能,在日常生活中,人们经常进行"模式识别".例如,在见到认识的人时,人们能辨别出他是张三还是李四,这是对人的形体及其他生物特征的识别行为:儿童在认读识字卡上的字母时,将它们区分为A~Z中的一个,这是对字母符号的识别:在与人交流时,人们能听出对方说话的意思,这是对语言的识别.随着人类社会活动及生产科研广泛而深入的发展,需要识别的对象种类越来越多,内容越来越复杂和深入,要求

《模式识别原理及工程应用》——2.3 判别函数和决策面

2.3 判别函数和决策面

美国宇航局尝试验证超光速曲速引擎原理,或将扭曲“爱因斯坦理论”中的时空

class="post_content" itemprop="articleBody"> 据英国<每日邮报>报道,美国宇航局约翰逊航天中心的科研人员们确信,他们可以将科幻世界中的技术变成现实,并证明曲率飞行是真正可能的.为了达到这一目标,他们将必须要打破,或者至少要扭曲爱因斯坦理论中的时空-- 哈罗德·怀特(Harold G. White)博士和他的研究组已经开始利用极小的光子开展实验,从而为未来的太空旅行奠定基础.今年43岁的怀特博士正试图操纵.

[置顶]白话贝叶斯理论及在足球比赛结果预测中的应用和C#实现

  离去年"马尔可夫链进行彩票预测"已经一年了,同时我也计划了一个彩票数据框架的搭建,分析和预测的框架,会在今年逐步发表,拟定了一个目录,大家有什么样的意见和和问题,可以看看,留言我会在后面的文章中逐步改善:彩票数据框架与分析预测总目录.同时这篇文章也是"[彩票]彩票预测算法(一):离散型马尔可夫链模型C#实现"的兄弟篇.所以这篇文章还有一个标题,应该是:[彩票]彩票预测算法(二):朴素贝叶斯分类器在足球胜平负预测中的应用及C#实现 . 以前了解比较多的是SVM,R

分词原理运用之行业网站如何策划大量长尾词

这篇文章我们将继续探索百度分词技巧的seo运用,对于百度分词原理还并不是很清楚的可以先看点水上一篇关于百度分词原理的介绍:百度分词理论运用之标题的写法实例解析(上篇)先给大家看几个数据(用chinaz查询): 1,1听音乐网 www.1ting.com 全球综合排名第 1,808 位,中文排名第 259 位 日均 IP 访问量≈438,000 2,中关村 www.zol.com.cn 全球综合排名第 183 位,中文排名第 32 位日均 IP 访问量≈ 3,066,000 这个是站长网根据ale