机器学习07:概率图模型(PGM)1
先总结了随机变量分布的一些规则,接着介绍了有向图/贝叶斯网络和无向图/马尔可夫随机场。
概率知识
概率图模型使用图的方式表示概率分布。为了在图中添加各种概率,首先总结一下随机变量分布的一些规则:
有向图-贝叶斯网络
已知联合分布中,各个随机变量之间的依赖关系,那么可以通过拓扑排序(根据依赖关系)可以获得一个有向图。而如果已知一个图,也可以直接得到联合概率分布的因子分解:
head to tail
graph TB; A((A))-->B((B)); B-->C((C));
tail to tail
graph TB; B((B))-->A((A)); B-->C((C));
head to head
graph TB; A((A))-->B((B)); C((C))-->B
对这种结构,
不与 条件独立。
从整体的图来看,可以引入 D 划分的概念。对于类似上面图 1和图 2的关系,引入集合A,B,那么满足
更加详细的说,对于集合
,若 ,使得 满足上面head to tail的情况,则 ,若 ,使得 满足上面head to head的情况,则 ,且B的后继、后继的后继……都不属于集合
这一结论也被称为全局Markov性
D 划分应用在贝叶斯定理中:
与
无向图-马尔可夫网络(马尔可夫随机场)
无向图没有了类似有向图的局部不同结构,在马尔可夫网络中,也存在 D 划分的概念。直接将条件独立的集合
有了这个条件独立性的划分,还需要因子分解来实际计算。引入团的概念:
团,最大团:图中节点的集合,集合中的节点之间相互都是直接连接的叫做团,如果一个团不能再添加节点,那么叫最大团。
利用这个定义进行的
对于变量集合
其中
其中