每一个样本都有自己对应的,有多少个样本就有多少个
如果有a个相等,那么我们能够相信这a个对应的样本x属于同一类的
要保证能够相等,所以要从一个离散的分布,即G中产生
所以有如下关系
图模型如下:
,这里面,直接将G带入有些困难,这里面使用了狄利克雷分布和多项式分布共轭的性质
可以看到新的DP的base measure?,和之前的H相比,新加了一个离散的项。