高斯混合模型

发布时间：2023年12月25日

高斯混合模型

假设有k个簇，每一个簇服从高斯分布，以概率 $\pi_k$ 随机选择一个簇k ，从其分布中采样出一个样本点，如此得到观测数据
$p\left(\boldsymbol{x}\right)=\sum_{k=1}^{K}\pi_{k}N(\boldsymbol{x}|\boldsymbol{\mu}_{k},\boldsymbol{\Sigma}_{k})\text{ 其中}\sum_{k=1}^{K}\pi_{k}=1,\quad0\leq\pi_{k}\leq1$
其中模型参数为: $\theta=(\pi_1,\ldots,\pi_K,\mu_1,\ldots,\mu_K,\Sigma_1,\ldots,\Sigma_K)^\mathrm{T}$

若样本 $x$ 关联K维的隐含变量为 $z=(z_1,z_2,\dots,z_K)$ ，其对应的随机向量用大写字母Z表示
$P(Z_k=1)=\pi_k$
若 $x$ 属于第 $k$ 簇，则
$p(x|Z_k=1)=N(x|\mu_k,\Sigma_k)$

$\begin{gathered} p(x)=\sum_{\mathbf{z}}p(x,\mathbf{z})=\sum_{\mathbf{z}}p(x|\mathbf{z})p(\mathbf{z})=\sum_{k=1}^{K}p(x|Z_{k}=1)P(Z_{k}=1) \\ =\sum_{k=1}^K\pi_kN(x|\mu_k,\Sigma_k) \end{gathered}$

采用EM算法求解

Е步:基于当前参数值 $\theta^{old}$ ,推断隐含变量 $z_i$ 的信息(后验概率/期望)
$\begin{gathered} r_{i,k}=\mathbb{E}\big(Z_{i,k}\big)=P\big(Z_{i,k}=1\big|x^{i},\boldsymbol{\theta^{old}}\big)=\frac{P\big(Z_{i,k}=1\big)p(\boldsymbol{x^{i}}|Z_{i,k}=1)}{\sum_{k^{\prime}=1}^{K}P\big(Z_{i,k^{\prime}}=1\big)p(\boldsymbol{x^{i}}|Z_{i,k^{\prime}}=1\big)} \\ =\frac{\pi_k^{old}\mathcal{N}(x^i|\boldsymbol{\mu}_k^{old},\boldsymbol{\Sigma}_k^{old})}{\sum_{k^{\prime}=1}^K\pi_{k^{\prime}}^{old}\mathcal{N}(\boldsymbol{x}^i|\boldsymbol{\mu}_{k^{\prime}}^{old},\boldsymbol{\Sigma}_{k^{\prime}}^{old})} \end{gathered}$
$r_{i,k}$ 可以看做是对 $x^i$ 从属于第 $k$ 个簇的一种估计
M步：基于当前的期望 $r_{i,k}$ 重新估计参数的值 $\pi_k$ 、 $\mu_k$ 、 $\Sigma_k$

$\pi_k^{new}=\frac{\sum_ir_{i,k}}N,\quad\mu_k^{new}=\frac{\sum_ir_{i,k}\boldsymbol{x}^i}{\sum_ir_{i,k}},\quad\Sigma_k^{new}=\frac{\sum_ir_{i,k}(\boldsymbol{x}^i-\boldsymbol{\mu}_k)(\boldsymbol{x}^i-\boldsymbol{\mu}_k)^\mathrm{T}}{\sum_ir_{i,k}}$

文章来源:https://blog.csdn.net/qq_43309286/article/details/135191958
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！