最后更新于
最后更新于
期望最大值(Expectation Maximization, EM)算法, 是一种求解含有隐变量(Latent Variable)的概率模型其参数的极大似然估计(Maximum Likelihood Estimation)方法, 或称为极大后验概率估计. EM算法可以说是一种框架或方法论.
许多算法都以EM算法作为基础, 如:
隐马尔科夫算法(HMM)
LDA主题模型
等. 首先准备EM算法的基础知识
假设函数在区间上连续, 且对于和, 有:
则称为凸函数, 若不等号严格成立, 则称为严格凸函数.
相反, 若:
则称为凹函数, 若不等号严格成立, 则称为严格凹函数.
凸函数与凹函数的直观图像如下图所示.
以上两个不等式均为詹森不等式(Jensen Inequation).
已知为定义域上的连续函数, 是区间内的任意一组实数, 为满足条件的一组非负有理实数, 那么:
如果为凸函数, 下面的不等式恒成立:
如果为凹函数, 下面的不等式恒成立:
因此如果服从概率分布, 即, 则詹森不等式等价于:
若为凸函数, 不等式恒成立
若为凹函数, 不等式恒成立