《LDA漫游指南》——2.5　狄利克雷分布(Dirichlet Distribution)

2.5　狄利克雷分布(Dirichlet Distribution)

Dirichlet分布是Beta分布在多项情况下的推广，也是多项分布的共轭先验分布（共轭先验分布将在2.6节进行介绍）。Dirichlet分布的概率密度函数如下：

二项分布和多项分布很相似，Beta分布和Dirichlet 分布很相似，至于“Beta分布是二项式分布的共轭先验概率分布，而Dirichlet分布是多项式分布的共轭先验概率分布”这点会在下文中进行说明。

另一个重要的公式是

为了简便表达，公式中引入了希腊字母∆代表B函数的多项版本。这个公式的结构和证明相似于上文中“β函数和gamma函数的关系——见式(2.6)”，这个证明留给读者来完成。从此，公式中凡是出现积分中连乘时，就要像巴甫洛夫试验中“流着口水的狗”一样警觉，建立起“可以换成gamma函数”的条件反射。

时间： 2024-08-07 13:05:32

《LDA漫游指南》——2.5　狄利克雷分布(Dirichlet Distribution)的相关文章

《LDA漫游指南》——第1章背景

第1章背景 LDA漫游指南 LDA算法使用的全部知识的渊源可以追溯到18世纪的欧拉.欧拉(Leonhard Euler ,1707年4月15日-1783年9月18日),瑞士数学家,如图1-1所示.欧拉一生贡献颇丰,1734年,欧拉因解决巴塞尔问题而出名,巴塞尔问题见式(1.1)的值是多少. (1.1) 这个问题困扰了数学家长达几个世纪的,当时的数学家只知道该级数的值小于2,但不知道精确值,欧拉准确的推导出该式的值等于π^2/6.欧拉的方法聪明而新颖,他创造性地将有限多项式的观察推广到无穷级数,

《LDA漫游指南》——第2章前置知识

第2章前置知识 LDA漫游指南本章所描述的工具和线索在后期LDA算法的采样公式推导中会全部明了.关于为什么需要使用这些知识要素,这里面有很长的一段历史渊源,比如在概率论和数理统计中,gamma函数被广泛使用,而在最终的LDA采样公式中,你会发现,gamma函数被神奇地消失了.我们在后面的章节中可以看到,LDA算法的精妙之处在于用令人屏息的洞察力作为纽带,将零散的部件全部组合在一起. 2.1 gamma函数所谓的gamma函数其实就是阶乘的函数形式,即n!=1⋅2⋅3-n.如果我问你3的阶乘

《LDA漫游指南》——2.6　共轭先验分布(conjugacy prior)

2.6 共轭先验分布(conjugacy prior) In Bayesian probability theory, if the posterior distributions p(θ |x) are in the same family as the prior probability distribution p(θ), the prior and posterior are then called conjugate distributions, and the prior is ca

《LDA漫游指南》——2.3　Beta分布（Beta distribution）

2.3 Beta分布(Beta distribution) 在概率论中,Beta分布是指一组定义在区间(0,1)的连续概率分布,有两个参数alpha 和beta ,且alpha ,beta > 0. Beta分布的概率密度函数是 (2.5) 随机变量X服从参数为的Beta分布通常写作:Xsim Beta(alpha ,beta ). 这个式子中分母的函数B(alpha ,beta )称为beta函数. 两种证明方法这里我们来证明一个重要的公式,该公式中的关系在LDA算法Gibbs Samplin

《LDA漫游指南》——2.4　多项分布(multinomial distribution)

2.4 多项分布(multinomial distribution) 多项分布[1]是二项分布的推广扩展,在n次独立试验中每次只输出k种结果中的一个,且每种结果都有一个确定的概率p.多项分布给出了在多种输出状态的情况下,关于成功次数的各种组合的概率. 举个例子,投掷n次骰子,这个骰子共有6种结果输出,且1点出现概率为p_1,2点出现概率p_2,--多项分布给出了在n次试验中,骰子1点出现x_1次,2点出现x_2次,3点出现x_3次,-,6点出现x_6次.这个结果组合的概率为式(2.8)为多项分

《LDA漫游指南》——2.7　总结

2.7 总结 1．贝叶斯学派采用给参数赋予先验分布,并使得先验与后验共轭,通过求后验均值来得到参数的估计,频率学派通过某个优化准则,比如最大化似然函数来求得参数的估计:不管是哪个学派思想,都要用到似然函数.注意到似然函数有所不同,这点在极大似然估计(MLE)和最大后验概率估计(MAP)体现得尤其明显. 2．当拥有无限数据量时(Beta分布式中的s和f都趋向于无穷,Dirichlet分布式中的m趋向于无穷),贝叶斯方法和频率学派方法所得到的参数估计是一致的.当在有限的数据量下,贝叶斯学派的参数后

《LDA漫游指南》——2.2　二项分布（Binomial distribution）

2.2 二项分布(Binomial distribution) 在概率论中,二项分布即重复n次独立的伯努利试验.在每次试验中只有两种可能的结果(成功/失败),每次成功的概率为p,而且两种结果发生与否互相对立,并且相互独立,与其他各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布就是伯努利分布. 在给出二项分布之前,我们来做一个例子,假设你在玩CS这个游戏,你拿着狙击枪,敌人出现,你打中敌人的概率是p,打不中敌人的概率是

用机器学习研究UFO目击报告！数据科学之魅：隐含狄利克雷分布

更多深度文章,请关注:https://yq.aliyun.com/cloud 本篇文章是讨论热门机器学习算法的文章合集中的一篇.如果你想了解更加详尽的背景知识以及我的写作初衷,请阅读这篇文章. 背景隐含狄利克雷分布(LDA)算法曾被"提出"过两次,第一次提出是在2000年,用来根据遗传信息将人群划分至K个种族,到了2003年,LDA又一次被提出,用来在文本语料库中构建主题模型.而在本篇文章中,我将专注于主题建模部分的介绍.但是LDA在众多领域有着极为广泛的应用,遗传应用也是其中非常有

《计算机视觉：模型、学习和推理》一3.4　狄利克雷分布

3.4 狄利克雷分布狄利克雷分布(见图3-4)定义在K个连续值λ1,-,λK上,其中λk∈［0,1］,因此狄利克雷分布适合于定义分类分布中参数的分布.在K维空间中,狄利克雷分布有K个参数α1,-,αK,每个参数都取正值,参数的相对值决定期望值E［λ1］,-,E［λk］.参数的绝对值决定期望值两侧的集中程度.可以写成:也可以简写为正如伯克利分布是仅有两个输出结果的特殊分类分布一样,贝塔分布是一个二维的特殊狄利克雷分布.图3-4 根据λ1,λ2,-,λK值定义的一个K维的狄利克雷分布,其中∑kλk

猜你喜欢

HTML颜色

颜色由红色.绿色.蓝色混合而成. 颜色值颜色由一个十六进制符号来定义,这个符号由红色.绿色和蓝色的值组成(RGB).每种颜色的最小值是0(十六进制:#00).最大值是255(十六进制:#FF). 颜 ...

RedhatAS3.0上安装Apache2+PHP5+MySQL+Resin+SSL+GD+weba

apache|mysql|php5|web 中国IT动力,最新最全的IT技术教程最新100篇 | 推荐100篇 | 专题100篇 | 排行榜 | 搜索 | 在线API文档首页 | 程序开发 | 操 ...

用户体验设计:可复用的写作方法

不管你是做什么媒体的,你最好只是为你的读者和他们的目标写作.对于传统媒体,读者的目标是很清晰明了的,从获得娱乐(读神话小说)到获取投资建议(读华尔街日报市场版). 可是,在Web上的写作是不同的,因为 ...

解读Google+为Google 搜索结果带来的4个直观影响

Google+是google自己推出的社交网络,我们都很清楚其对于Google seo的影响,但是具体具体细节很多站长并没有认真的分析.我们目前具体还不了解Google+在Google排名算法中所起的 ...

pga异常消耗分析

os: aix 6 db:10205 ------使用os 命令观察oracle 进程内存消耗情况 #ps gv ...... ...

Web前端优化最佳实践之Cookie篇

Web 前端优化最佳实践第三部分面向 Cookie .目前只有 2 条实践规则. 1. 缩小 Cookie (Reduce Cookie Size) Cookie 是个很有趣的话题.根据 RFC 21 ...

html无刷新分页前端代码

<!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <m ...

Linux下使用python自动修改本机网关代码分享

这篇文章主要介绍了Linux下使用python自动修改本机网关代码分享,本文直接给出实现代码,需要的朋友可以参考下 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ...

三招如何让IE10向下兼容

花了248块大洋,我将电脑中的Windows7升级到了Windows8.但接下来,用IE10浏览器浏览某网页时,屏幕上出现"对象不支持'selectNodes'属性或方法"的提 ...

HTTP状态代码大全

不知道大家上网是是否碰到过打开网页后报 303,403等错误,让侯IE会给出一大堆的提示告诉你如何处理这些事,但是最后还是不能打开网页,有的人都认为是自己网络问题,其实不然,有时候网页的服务器负载也会 ...

有道云笔记回收站中笔记怎么恢复？

Windows版:在回收站中选择一篇笔记,点击右键,选择"恢复". Web版:在回收站中选择一篇笔记,点击右侧上方的"恢复笔记".

itools安卓模拟器怎么备份shsh？

itools安卓模拟器怎么备份shsh? 打开iTools3.0后点击"工具箱"--"超级备份"; itools备份shsh 选择需要备份的 ...

使用U盘安装Ubuntu的详细图文

1.首先我们要来下载Ubuntu操作系统,操作系统的下载可以到Ubuntu的中文官方网站进行下载,也可以到其他的软件网站进行下载,但是到其他地方下载的时候一定要注意到大型的软件网站,以免中毒,下载 ...

win8系统桌面背景快速设置方法

设置Win8系统的桌面背景,可以从桌面右键个性化来操作,也有更简单的操作方法,直接在文件夹中完成.下面小编为大家介绍这一操作方法. 步骤 1.打开背景图片所在的文件夹. 2.点击管理工具下面的管理标签 ...

android systemui-小弟修改systemUI遇到个问题

问题描述小弟修改systemUI遇到个问题在修改systemUI代码遇到个很奇怪的问题在我删除 layout 和 layout-sw600dp 里面的 super_status_bar.xml这时 ...

asp+sql

问题描述谁有用asp+sql做的教学网站哟~~~~最好是针对某一个专业科目的~~~给我发一个~~~谢谢QQ:956987051邮箱:danzheng226@sina.com

仿listBox写了一个Control控件为item的列表集合

仿listBox写了一个Control控件为item的列表集合,由于最近做个项目要用,微软提供的控件实现起来不行,但自己写了一个,效果如下: 代码 1using System; 2using ...

database-如何创建一个 android 程序升级机制?

问题描述如何创建一个 android 程序升级机制? 我开发了一个android 程序,然后在平板电脑上安装了 apk. 现在我想修改一些代码行和SQLite 数据库中的一个表格,但是我不想重新安装 ...

mesos和marathon搭配使用，marathon无法启动

问题描述 mesos和marathon搭配使用,marathon无法启动下面是版本信息: mesos version : mesos-0.25.0-0.2.70.centos701406.x86_6 ...

十大让你富不起来的原因

金融危机.物价飞涨,让每一位工薪族胆颤.再看看人家"股神"巴菲特,一周财富缩水一百多亿美元,但仍面不改色心不跳.实在是因为太有钱了.甭说巴菲特,就是在你身边,一掷千金的富翁富婆富哥 ...

《ADOBE FIREWORKS CS5标准培训教材》——第1章基础知识和基本操作1.1 关于Adobe Fireworks CS5

第1章基础知识和基本操作学习要点: 认识Fireworks CS5,并了解Fireworks CS5的新功能熟练掌握在Fireworks CS5中创建.打开和保存Fireworks文档的操作熟 ...

出现未定义与 &amp;#39;double&amp;#39; 类型的输入参数相对应的函数 &amp;#39;Rastrigin&amp;#39;，请问怎样修改

问题描述出现未定义与 'double' 类型的输入参数相对应的函数 'Rastrigin',请问怎样修改 function DrawRastrigin() % 绘制Rastrigin函数图形 sym ...

什么样的企业更需要管理咨询？

问题描述什么情况下寻求帮助第一.公司高层之间存在层级矛盾,且矛盾较为突出时.尤其在股份制公司,多头股东共同参与发表意见中,存在不同的意见,高层之间容易出现互相不信任,互相猜疑的现象,在这种情况下, ...

“山寨高校”的网站内容有板有眼，看似十分“正规”

就像手机.服装一样,大学网站也有山寨版.高仿版?日前,读者小秦向记者报料,近日网上出现一个名为"上海建筑工业学院"的网站,该网站看起来很正规,各类正规高校网站的常设分类一应俱全.经 ...

java累加和校验实现方式16进制(推荐)_java

已知一个字符串,求该字符串的16进制累加和,已知一段字符串和校验码,校验和累加是否合法,话不多说了直接上代码 public static String makeChecksum(String data ...

Android中Matrix开发汇总

开发中遇到一些涉及到Matrix的地方,现在此归纳,便于日后查阅. 通过对ImageView设置Matrix来实现ImageView中图片的单指拖动和两指缩放核心方法: imageView.setI ...

联想手机无法接打电话怎么办

1.我们尝试重启一下手机看看可不可以打电话了 2.看看手机所在位置是不是有信号了 3.就看是不是SIM卡接入有问题了 4.确保手机不是飞行模式(也称离线模式),此模式下网络是断开的,自然也打不了电话 ...

大型网站优化策略

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅本人做站3年,没有什么技巧,做就可 ...

MSN Messenger正式退出中国用户数据迁入Skype

域名城(domain.cn)10月31日消息,MSN Messenger今日正式退出中国市场.微软官方表示,Mes-senger只是MSN品牌下的一款即时通讯产品,其关闭之后与Messenger账 ...

微软部分新款Lumia禁将谷歌设为默认搜索

[摘要]此前,诺基亚设备支持Windows Phone用户更换谷歌搜索.微软部分新款Lumia禁将谷歌设为默认搜索腾讯科技讯微软日前对旗下部分新Lumia机型搜索设置进行调整,禁止将谷歌设为默认搜 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.019 s.