机器学习11:高斯混合模型(GaussianMixtureModel)(1)

为了解决高斯模型的单峰性的问题,我们引入多个高斯模型的加权平均来拟合多峰数据: 引入隐变量 ,这个变量表示对应的样本 属于哪一个高斯分布,这个变量是一个离散的随机变量: 作为一个生成式模型,高斯混合模型通过隐变量 的分布来生成样本。

用概率图来表示:

graph LR;
    z((z))-->x((x))

其中,节点 就是上面的概率, 就是生成的高斯分布。于是对 因此:

极大似然估计

样本为 为完全参数,参数为 。我们通过极大似然估计得到 的值: 这个表达式直接通过求导,由于连加号的存在,无法得到解析解。因此使用 EM 算法求解参数。