这里承接上篇笔记【从池化的角度看GNN(包含PR-GNN,EdgePool等7篇论文)中篇】继续后面几篇论文的笔记:
这里为了方便大家阅读,我把总结部分同步到每一篇笔记中
原创笔记,未经同意请勿转载
上篇笔记链接:从池化的角度看GNN(包含PR-GNN,EdgePool等7篇论文)上篇
中篇笔记链接:从池化的角度看GNN(包含PR-GNN,EdgePool等7篇论文)中篇
现有图池化操作主要可以分为全局池化(如SortPool)、分层池化,分层池化中还可以分为基于聚类(如DiffPool,StructPool)和基于重要性排序(如TopK Poolig,SAGPool,GSAPool等)的池化操作,同时也可以衍生出基于频谱上处理的池化操作(如EigenPool,LaPool,HaarPool等)。
下篇放最后三篇。
来源: ICLR2020
数据任务:
(1)数据任务:图分类、节点分类
(2)数据集:在八个数据集上进行评估STRUCTPOOL,包括五个生物信息学蛋白质数据集,ENZYMES,PTC,MUTAG,PROTEINS,D&D以及三个社交网络数据集,COLLAB,IMDB-B,IMDB-M。
参考阅读的博客:
STRUCTPOOL via CRF,ICLR2020_五月的echo的博客-CSDN博客
STRUCTPOOL: STRUCTURED GRAPH POOLING VIA CONDITIONAL RANDOM FIELDS - 知乎
主要的出发点: 存目前一些性能比较好的图池化方法,如SORTPOOL,TOPKPOOL,DIFFPOOL和SAGPOOL都未显式地对不同节点之间关系建模,因此可能会忽略重要的结构信息,即没有显式的考虑图的结构信息,并将Graph Pooling的过程转化为节点聚类的问题(如基于聚类的分层池化操作)。然而,对于一个节点的分类,其分类的结构不仅与其自身的节点特征相关,还与其他节点的分类结果存在关联关系。因此,StructPool作者次啊用条件随机场(CRF)方法来模拟这种节点之间的高阶的关联关系,并结合图的结构信息来设计Gibbs能量方程。【以往基于聚类的图池化方法的目标是学习一个聚类分配矩阵,但该分配矩阵只考虑到节点本身的特征。而StrcutPool则在其基础上利用CRF来综合考虑节点自身的特征矩阵和不同节点的分配关系来生成对应的聚类分配矩阵。】
亮点:利用CRF来综合考虑节点自身的特征矩阵和不同节点的分配关系来生成对应的聚类分配矩阵,并结合图的结构信息来设计Gibbs能量方程。
内容:
(1)一些概率图模型知识
(2)论文原理
实验结果:
来源: AAAI2020
原文链接: https://www.aaai.org/Papers/AAAI/2020GB/AAAI-RanjanE.8336.pdf
数据任务:
(1)任务:图分类任务
(2)数据集:
主要的出发点: 全局池化与层次池化的局限性:
全局池化(Global Pooling)
层次池化(Hierarchical Pooling)
亮点: 提出了一种自适应结构感知的池化操作ASAP
(1)一种能够分层捕获局部子图信息的稀疏池化算子,该池化方法能够根据池化图的边连接更好的学习全局特征;
(2)一种新的更适合与像池化这种全局任务的自注意力机制;
(3)一种新的图卷积方法LEConv,用来自适应的学习图子结构中的局部极值(local extremas)。
总体而言,ASAP是对层次化池化方法的综合和优化,解决了DiffPool中非稀疏的问题,同时利用聚类的思想进行了采样。而且ASAP实际上利用了两次自注意力机制打分,一次作用在簇内,一次作用在簇间,即在丢弃节点前进行注意力机制的聚合,保留了丢弃节点的信息,同时用节点的增量来改进注意力机制。
内容: 结构与SAGPool的分层池化结构相类似
ASAP首先对graph进行分层聚类,从而有效地学习图结构中存在的层级信息等。论文在此基础上提出了Master2Token自注意机制,该机制使该模型更好地捕获Cluster中每个节点的重要性,进一步根据该Score计算整个Cluster的表示。根据Cluster的表示计算Graph的表示,为了选择哪些Cluster比较重要,论文提出了LEConv,一种改进的GNN公式,该公式可以根据对cluster进行评分。有了得分就可以选择Topk得到Graph的表示。这样可以确保在整个图形中选择代表性的cluster。ASAP为所选的cluster计算了边的权重,并有效地捕获边的连通性信息,该方法比较容易扩展大型图形。
(a)向ASAP输入图表。
(b)ASAP initial clustering 1-hop neighborhood,考虑所有节点为medoid1。为简便起见,我们仅将节点2和6的簇形成表示为medoid。使用M2T attention计算簇隶属度。
(c)使用LEConv对集群进行评分。颜色越深表示分数越高。
(d)在合并图中选择得分最高的集群的一部分。利用所选簇成员节点之间的边权重新计算邻接矩阵。
(e) ASAP的输出。
(f)层次图分类架构概述。
实验结果
上面这里介绍了从池化的角度来看GNN,其实关于这篇笔记还没有结束,因为这篇笔记我当时记录的适合是把当时看的几篇论文都汇总到一起,分为3个角度来看待GNN。在下篇笔记中再更新这篇笔记的后继吧。
这里当时实验室组会汇报的时候我一般是把其中一篇笔记做成组会汇报的PPT,下面再放上来吧。