为了解决高斯模型的单峰性的问题,我们引入多个高斯模型的加权平均来拟合多峰数据: 引入隐变量 ,这个变量表示对应的样本 属于哪一个高斯分布,这个变量是一个离散的随机变量: 作为一个生成式模型,高斯混合模型通过隐变量 的分布来生成样本。
用概率图来表示:
graph LR;
z((z))-->x((x))
其中,节点 就是上面的概率, 就是生成的高斯分布。于是对 : 因此:
极大似然估计
样本为 , 为完全参数,参数为 。我们通过极大似然估计得到 的值: 这个表达式直接通过求导,由于连加号的存在,无法得到解析解。因此使用 EM 算法求解参数。