最后更新于
最后更新于
均匀生成20个[0,1]之间的随机数, 同时第7大和第13大的数是什么?
数学表达:
, 排序后对应的顺序统计量
问的联合分布是什么
这就是一般形式的3维Dirichlet分布, 从形式上我们也能看出, Dirichlet分布是Beta分布在高维度上的推广, 和Beta分布一样也是一个百变星君, 密度函数可以展现出多种形态:
一般形式的Dirichlet分布定义如下:
数学表示如下:
以上贝叶斯分析过程的简单直观的表述就是:
这个结论很重要, 例如在LDA数学推导中就需要使用到这个结论.
取满足, 如下:
于是我们得到的联合分布是:
上面这个分布其实就是3维形式的Dirichlet分布, 令, 分布密度可以写为:
调整一下游戏, 从魔盒中生成个随机数, 且知道和相比谁大谁小, 再求上面的联合分布(后验分布).
, 排序后对应的顺序统计量
令, 猜测
, 中落到三个区间的个数分别为
问后验分布的分布是什么
记, 由游戏中的信息, 我们可以推理得到在这个数中分别成为了第大的数, 于是后验分布应该是:
即. 按照贝叶斯推理的逻辑, 同样可以把以上过程整理如下:
要猜测参数, 其先验分布为
数据落到三个区间的个数分别为, 服从多项分布
在给定了来自数据提供的知识, 的后验分布变为
令, 把从整数集合延拓到实数集合, 更一般的可以证明有如下关系:
以上式子实际上描述的就是Dirichlet-Multinomial共轭, 从以上过程可以看到, Dirichlet 分布中的参数可以理解为物理计数, 类似于Beta分布.
对于给定的和, 多项分布定义为:
和这两个分布是共轭关系.
类似于Beta分布, 如果, Dirichlet分布的期望/均值为: