Dirichlet Process 4

发布时间:2024年01月23日

每一个样本都有自己对应的\theta,有多少个样本就有多少个\theta

x_{1},x_{2},...,x_{n}\newline \theta _{1},\theta _{2},...,\theta _{n}

如果有a个\theta相等,那么我们能够相信这a个对应的样本x属于同一类的

要保证\theta能够相等,所以\theta要从一个离散的分布,即G中产生

所以有如下关系

G\sim DP(\alpha ,H)

\theta _{1},\theta _{2},...,\theta _{n}\sim G

x_{i}\sim F(\theta _i)

图模型如下:

P(G|\theta _{1},...,\theta_{n}) \propto P(\theta_{1},...,\theta_{n} | G) *P(G),这里面G=\Sigma \pi _{i}\delta _{i},直接将G带入有些困难,这里面使用了狄利克雷分布和多项式分布共轭的性质

P(G(a_{1}), ...,G(a_{k})|n_{1},...,n_{k}) \propto \\Multi(n_{1},...,n_{k}|G(a_1),...,G(a_k))DIR(\alpha H(a_1),...,\alpha H(a_k))\\ =DIR(\alpha H(a_1) +n_1,...,\alpha H(a_k) + n_k) \\ =DP(\alpha + n, \frac{\alpha H + \Sigma \delta \theta_i}{\alpha + n})

可以看到新的DP的base measure?\frac{\alpha }{\alpha+n} H + \frac{\Sigma \delta \theta_i}{\alpha + n},和之前的H相比,新加了一个离散的项。

文章来源:https://blog.csdn.net/zhangsj1007/article/details/130992626
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。