2.3 Beta分布(Beta distribution)
在概率论中,Beta分布是指一组定义在区间(0,1)的连续概率分布,有两个参数alpha 和beta ,且alpha ,beta > 0。
Beta分布的概率密度函数是
(2.5)
随机变量X服从参数为的Beta分布通常写作:Xsim Beta(alpha ,beta )。
这个式子中分母的函数B(alpha ,beta )称为beta函数。
两种证明方法
这里我们来证明一个重要的公式,该公式中的关系在LDA算法Gibbs Sampling采样公式中也有使用,这个关系也就是mathbf {beta}函数和gamma函数的关系(该公式也被称为第一型欧拉积分):
(2.6)
下面我们给出这个关系式的两种证明方法。
证明方法1:
图2-1为积分区域。
在图 2-1的上半部分(阴影部分)为积分区域,则交换积分次序为
再令x = tmu ,则x = t,mu = 1;当x = 0,则mu = 0。
第二种证明方法不涉及多重积分,因此颇为简洁,具体如下:
这个方法的关键之处在于应用分部积分法,
换元之后再使用分部积分法可得
我们思如泉涌,如同多米诺骨牌,很快便发现一个规律,
这个证明过程使用了分部积分法,在最后又利用了gamma函数的阶乘特性,显得非常巧妙和简洁。
Beta分布的期望
化简后
这说明,Beta分布的均值可以用frac{alpha }{{alpha + beta }}来估计。
对于后面2.6节提到的Dirichlet分布也有相似结论:
这个结论在LDA算法做完Gibbs sampling后,估计vec theta 和vec varphi时会用到。
时间: 2024-08-30 07:31:51