机器学习08:概率图模型(PGM)2
上一篇博客介绍了有关概率图模型表示的基本内容,本篇博客介绍有关推断的内容。
推断的主要目的是求各种概率分布,包括边缘概率,条件概率,以及使用 MAP 来求得参数。本篇博客介绍三种算法
推断-变量消除(VE)
变量消除的方法是在求解概率分布的时候,将相关的条件概率先行求和或积分,从而一步步地消除变量,例如在马尔可夫链中:
graph LR; a((a))-->b((b)); b-->c((c)); c-->d((d))
变量消除的缺点很明显:
- 计算步骤无法存储
- 消除的最优次序是一个 NP-hard 问题
推断-信念传播(BP)
为了克服 VE 的第一个缺陷-计算步骤无法存储。我们进一步地对上面的马尔可夫链进行观察:
graph LR; a((a))-->b((b)); b-->c((c)); c-->d((d)); d-->e((e));
要求
一般地,对于图(只对树形状的图):
graph TD; a((a))---b((b)); b---c((c)); b---d((d));
这四个团(对于无向图是团,对于有向图就是概率为除了根的节点为1),有四个节点,三个边:
- 任取一个节点
作为根节点 - 对这个根节点的邻居中的每一个节点,收集信息(计算入信息)
- 对根节点的邻居,分发信息(计算出信息)
推断-Max-Product 算法
在推断任务中,MAP 也是常常需要的,MAP 的目的是寻找最佳参数: