贝叶斯推断及其互联网应用（一）定理简介

一年前的这个时候，我正在翻译Paul Graham的《黑客与画家》。

那本书的第八章，写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件（英文版）。

我没完全看懂那一章。当时是硬着头皮，按照字面意思把它译出来的。虽然译文质量还可以，但是心里很不舒服，下决心一定要搞懂它。

一年过去了，我读了一些概率论文献，逐渐发现贝叶斯推断并不难。原理的部分相当容易理解，不需要用到高等数学。

下面就是我的学习笔记。需要声明的是，我并不是这方面的专家，数学其实是我的弱项。欢迎大家提出宝贵意见，让我们共同学习和提高。

=====================================

贝叶斯推断及其互联网应用

作者：阮一峰

一、什么是贝叶斯推断

贝叶斯推断（Bayesian inference）是一种统计学方法，用来估计统计量的某种性质。

它是贝叶斯定理（Bayes' theorem）的应用。英国数学家托马斯·贝叶斯（Thomas Bayes）在1763年发表的一篇论文中，首先提出了这个定理。

贝叶斯推断与其他统计学推断方法截然不同。它建立在主观判断的基础上，也就是说，你可以不需要客观证据，先估计一个值，然后根据实际结果不断修正。正是因为它的主观性太强，曾经遭到许多统计学家的诟病。

贝叶斯推断需要大量的计算，因此历史上很长一段时间，无法得到广泛应用。只有计算机诞生以后，它才获得真正的重视。人们发现，许多统计量是无法事先进行客观判断的，而互联网时代出现的大型数据集，再加上高速运算能力，为验证这些统计量提供了方便，也为应用贝叶斯推断创造了条件，它的威力正在日益显现。

时间： 2025-01-21 06:43:37

贝叶斯推断及其互联网应用（一）定理简介的相关文章

贝叶斯推断及其互联网应用（一）：定理简介

一年前的这个时候,我正在翻译Paul Graham的<黑客与画家>. 那本书的第八章,写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版). 我没完全看懂那一章.当时是硬着头皮,按照字面意思把它译出来的.虽然译文质量还可以,但是心里很不舒服,下决心一定要搞懂它. 一年过去了,我读了一些概率论文献,逐渐发现贝叶斯推断并不难.原理的部分相当容易理解,不需要用到高等数学. 下面就是我的学习笔记.需要声明的是,我并不是这方面的专家,数学其实是我的弱项.欢迎大家提出宝贵意见,让我们

贝叶斯推断及其互联网应用（二）过滤垃圾邮件

上一次,我介绍了贝叶斯推断的原理,今天讲如何将它用于垃圾邮件过滤. ======================================== 贝叶斯推断及其互联网应用作者:阮一峰 (接上文) 七.什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户. 正确识别垃圾邮件的技术难度非常大.传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等.前者的过滤依据是特定的词语:后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比.它们的

贝叶斯推断及其互联网应用（二）：过滤垃圾邮件

贝叶斯推断及其互联网应用（三）拼写检查

(这个系列的第一部分介绍了贝叶斯定理,第二部分介绍了如何过滤垃圾邮件,今天是第三部分.) 使用Google的时候,如果你拼错一个单词,它会提醒你正确的拼法. 比如,你不小心输入了seperate. Google告诉你,这个词是不存在的,正确的拼法是separate. 这就叫做"拼写检查"(spelling corrector).有好几种方法可以实现这个功能,Google使用的是基于贝叶斯推断的统计学方法.这种方法的特点就是快,很短的时间内处理大量文本,并且有很高的精确度(90%以上).

贝叶斯推断及其互联网应用（三）：拼写检查

浅谈贝叶斯推断

一.什么是贝叶斯推断贝叶斯推断(Bayesian inference)是一种统计学方法,用来估计统计量的某种性质.它是贝叶斯定理(Bayes' theorem)的应用.英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理. 贝叶斯推断与其他统计学推断方法截然不同.它建立在主观判断的基础上,也就是说,你可以不需要客观证据,先估计一个值,然后根据实际结果不断修正.正是因为它的主观性太强,曾经遭到许多统计学家的诟病. 贝叶斯推断需要大量的计算,因此历史

《贝叶斯方法：概率编程与贝叶斯推断》——导读

前言贝叶斯方法:概率编程与贝叶斯推断贝叶斯方法是一种常用的推断方法,然而对读者来说它通常隐藏在乏味的数学分析章节背后.关于贝叶斯推断的书通常包含两到三章关于概率论的内容,然后才会阐述什么是贝叶斯推断.不幸的是,由于大多数贝叶斯模型在数学上难以处理,这些书只会为读者展示简单.人造的例子.这会导致贝叶斯推断给读者留下"那又如何?"的印象.实际上,这曾是我自己的先验观点. 最近贝叶斯方法在一些机器学习竞赛上取得了成功,让我决定再次研究这一主题.然而即便以我的数学功底,我也花了整整3天时间

《贝叶斯方法：概率编程与贝叶斯推断》——第1章　贝叶斯推断的哲学 1.1　引言

第1章贝叶斯推断的哲学贝叶斯方法:概率编程与贝叶斯推断 1.1 引言尽管你已是一个编程老手,但bug仍有可能在代码中存在.于是,在实现了一段特别难的算法之后,你决定先来一个简单的测试用例.这个用例通过了.接着你用了一个稍微复杂的测试用例.再次通过了.接下来更难的测试用例也通过了.这时,你开始觉得也许这段代码已经没有bug了. 如果你这样想,那么恭喜你:你已经在用贝叶斯的方式思考!简单地说,贝叶斯推断是通过新得到的证据不断地更新你的信念.贝叶斯推断很少会做出绝对的判断,但可以做出非常可信的判

《贝叶斯方法：概率编程与贝叶斯推断》——1.1　引言

1.1 引言尽管你已是一个编程老手,但bug仍有可能在代码中存在.于是,在实现了一段特别难的算法之后,你决定先来一个简单的测试用例.这个用例通过了.接着你用了一个稍微复杂的测试用例.再次通过了.接下来更难的测试用例也通过了.这时,你开始觉得也许这段代码已经没有bug了. 如果你这样想,那么恭喜你:你已经在用贝叶斯的方式思考!简单地说,贝叶斯推断是通过新得到的证据不断地更新你的信念.贝叶斯推断很少会做出绝对的判断,但可以做出非常可信的判断.在上面的例子中,我们永远无法100%肯定我们的代码是无缺

猜你喜欢

ppt2007怎么隐藏重叠图片

ppt2007怎么隐藏重叠图片 ppt2007 首先单击"开始"选项卡,找到"编辑"功能组,再点击"选择→选择窗格",在工作区域的右侧会 ...

魔图的制作过程

过程 1.新建2*2图像,如图填充,全选定义为图案呵呵,当然是在PHOTOSHOP里打开了!这两步就不行截图了吧! 2.打开要混合的两张图片.图1 3.打开要混合的两张图片.图2 4.两个图层,风景 ...

include文件的利弊及其安全性

include|安全|安全性|include|安全|安全性 Include的利弊何在? 你知道Include 可以包含文件自身吗?是的.你甚至可以包含几次.唯一的限制是:你不能让A包含B,而B又包含A ...

jQuery ajax：将类AJAX方法包装起来

上一篇文章,将jQuery.ajax中的一些细节补充完.这篇文章讲解如果将类AJAX方法都包装进jQuery.ajax 中.下篇文章则讲解各预过滤器和分发器的细节. 为什么要包装起来? 我们知道,古老 ...

MySQL统计函数GROUP_CONCAT报错的原因及解决方法

今天在执行下面这条sql语句时,结果报错了. CREATE table car_user_content select addr_id,comm_userid,GROUP_CONCAT(comm_co ...

通过异步程序调用(APC)实现的定时功能

定时器是一个在特定时间或者规则间隔被激发的内核对象.结合定时器的异步程序调用可以允许回调函数在任何定时器被激发的时候执行.本文的例子代码显示了如何实现. 使用本定时器时,你需要把常量_WIN32_W ...

黑金刚DDRII1066512M内存性能参数

型号 DDRII1066 512M 适用类型台式机内存类型 DDR II 内存容量 512M 插脚数目 240pin 性能参数芯片分布单面八颗内存主频 DDR2 1066 颗粒封装 BGA ...

hibernate的事务和spring事务的区别

对于传统的基于特定事务资源的事务处理而言(如基于JDBC的数据库访问),Spring并不会对其产生什么影响,我们照样可以成功编写并运行这样的代码.同时,Spring还提供了一些辅助类可供我们选择使用, ...

jquery插件validation实现验证身份证号等

这篇文章主要介绍了jquery插件validation实现验证身份证号.护照.电话号码.email十分的简单实用,有需要的小伙伴可以参考下. 先推荐一个基于bootstrap的jQuery val ...

美图拍拍MM最喜欢的7个自拍姿势大盘点

美图拍拍大盘点:MM最喜欢的7个自拍姿势,大家可以使用美图拍拍多多练习咯,让你的拍照时游刃有余,令人羡慕不已,你还在等势面? 一.剪刀手这个是最大众也是最经典的招式了,通过一只"剪刀手&q ...

由一场DDoS攻防”引发“的安全公益计划

DDoS防护向来被认为是一场钞票的战争,那么,这场战争的买单者应该是企业还是云服务商? 一次客户投诉引发的思考阿里云首席安全研究员吴翰清是安全圈内数得上的白帽子,前不久因为一个客户的投诉,他对谁来为 ...

《UNIX/Linux 系统管理技术手册（第四版）》——导读

前言当我们在20世纪80年代撰写本书的第一版时,我们就急于把我们的手稿与其他讲述系统管理技术的书籍做个比较.令我们高兴的是,我们当时只找到了三本同类的书.现如今,读者可以有数以百计的不同选择.下面是 ...

Android性能优化以及数据优化方法_Android

Android性能优化-布局优化今天,继续Android性能优化一编码细节优化. 编码细节,对于程序的运行效率也是有很多的影响的.今天这篇主题由于技术能力有限,所以也不敢在深层去和大家分享.我将 ...

named-Linux下配置DNS服务器，报错“has no address records (A or AAAA)”，怎么解决，求大师指导

问题描述 Linux下配置DNS服务器,报错"has no address records (A or AAAA)",怎么解决,求大师指导我搞不懂这段报错,怎么解决,您会吗?Ma ...

南通市区将新增18个免费WiFi区域

记者昨天从市经信委获悉,在去年市区20个重要公共场所成功推出免费WiFi的基础上,今年市区将新增18个免费WiFi覆盖区域,市区主要公共场所将基本实现免费WiFi服务全覆盖. 按照统筹规划.分步实施的 ...

Java约瑟夫问题

12345678910111213141516171819202122232425262728293031323334353637383940414243 package josephus; impo ...

asp.net中怎么配置IIS?

问题描述 asp.net中怎么配置IIS? 解决方案解决方案二:http://msdn2.microsoft.com/zh-cn/library/6hy1xzbw(VS.80).aspx解决方案三: ...

Ramdisk文件系统的制作与调试运行

开发环境:Fedora 9交叉编译工具链:arm-linux-gcc 4.3.2 with EABI嵌入式Linux内核版本:2.6.29.4-FriendlyARM.昨天写贴子的时候具体记不清了,今 ...

extjs-Extjs5怎么获取grid分页中当前的页数

问题描述 Extjs5怎么获取grid分页中当前的页数获取grid分页中当前的页数,将值传到后台图片中的当前页解决方案 ext会自动发送但前页到服务器,键名称为page

事务-android sqlite onUpgrade 中执行了 CREATE TABLE 失败

问题描述 android sqlite onUpgrade 中执行了 CREATE TABLE 失败 android sqlite onUpgrade 中执行了 CREATE TABLE if not ...

《云数据管理：挑战与机遇》2.1.5　基于广播和多播的组通信

基于广播和多播的组通信如果数据被复制到多个节点上进行存储,数据更新操作需要发送给所有的副本.广播或多播操作是一种简单的通信原语.一般来说,广播方式把同一条消息发送给系统中的所有站点,而多播只发送给部 ...

普京签订反恐法：互联网公司将增加数十亿美元成本

北京时间7月9日早间消息,俄罗斯总统普京本周签订了一项充满争议的反恐修正案,这可能导致互联网公司额外增加数十亿美元成本. 俄罗斯政府周四发布了新规定,使国家安全机构能获得更大的监控权力.根据新规,通信 ...

光载无限助力全国大规模区块链应用项目首次落地

2017年6月22日--由光载无限集团和佛山市禅城区政府联合举办的智信城市与区块链创新应用(禅城)发布会在广东佛山举行,正式发布智信城市计划并启动IMI数字身份平台,宣布全国大规模区块链应用项目首次落 ...

大数据痛点 |《财经》封面报道

在政府和市场的双重催动下,那些原本封存在服务器里的陈年数据,成为一座座蕴藏丰富的"金矿".然而,能真正做深度挖掘的企业并不多,这一领域正在等待着"杀手级"应用的 ...

北京公交一卡通开通手机充值暂不支持苹果

[摘要]充值所用手机须为安卓系统手机.有NFC功能.北京公交一卡通开通手机充值暂不支持苹果京华时报讯(记者黄海蕾)昨天,记者从市政一卡通e乐充官方网站获悉,继一卡通实现在网上充值后,又开通了手机直接 ...

《高阶Perl》——1.3　汉诺塔

1.3 汉诺塔目前这两个例子都不是真需要递归的,它们都可以用简单的循环重写. 这类重写总是可能的,因为毕竟计算机的机器语言可能不支持递归,那么在某种程度上,它必然是非必需的.重写阶乘函数是简单的,但 ...

PHP定时任务获取微信access_token的例子

最近开发微信公众平台,公众号调用各接口时都需使用access_token,access_token是公众号的全局唯一接口调用凭据,开发时需要进行妥善保存. access_token有效期为7200秒 ...

PHP采集静态页面并把页面css,img,js保存的方法_php技巧

本文实例讲述了PHP采集静态页面并把页面css,img,js保存的方法.分享给大家供大家参考.具体分析如下: 这是一个可以获取网页的html代码以及css,js,font和img资源的小工具,主要用来 ...

聚焦城市公共服务物联网

3月30日,中国电信与华为公司在广东深圳联合举办"智慧城市公共服务领域物联网应用研讨会".双方表示,将抓住NB-IoT(窄带物联网)发展契机,以"开放.共建.共赢&quo ...

雷军发力游戏:另一条生态链

等风来,风真的来了.冒着凛冽的寒风,小米董事长兼CEO雷军来到了天马时空的办公室,虽然这次雷军十分低调,但从他快速进入庆功场地的步伐中,已经能听出他内心的喜悦. 作为尚进执掌小米互娱投资的第一家公司, ...

热搜