近日,我校大数据与计算机科学学院欧卫华教授团队在人工智能领域TOP期刊Expert Systems with Applications(中科院一区,IF=7.5)上发表了题为“Heterogeneous graph completion collaborative network for attribute-missing heterogeneous graph representation learning ”的研究论文。

异构图表征学习是人工智能国际前沿研究领域,已引起高度关注,并在各种实际场景中得到了广泛应用。由于各种不可控因素,异构图数据经常存在属性缺失的问题,从而影响异构图表征学习模型的性能。现有的补全方法忽略了节点的高阶语义信息,导致高阶语义信息的利用不充分,另外异构图之间缺乏有效的信息协同交互,最终导致下游任务的性能不佳。

HGCCN模型
针对上述问题,本研究提出了一种用于属性缺失异构图表征学习的异构图补全协作网络(简称为HGCCN)。该网络首先利用高阶扩散补全方法补全缺失属性,然后引入具有多头自注意力机制的图变换器,自适应地在多个已补全语义属性之间进行异构图信息的协作交互。 具体来说,首先构建多个元路径子图,在补全过程中探索节点的高阶语义信息;其次提出一种新颖的扩散补全方法,利用探索到的高阶语义信息更有效地实现高阶扩散,补全缺失属性;接着引入图变换器实现异构图的高阶语义信息的协作交互,进一步获得增强的节点补全属性;最后将节点补全属性输入到下游的异构图神经网络进行下游任务的表征学习。与现有方法相比,HGCCN的优势在于能够利用来自不同元路径子图的高阶语义信息与所提出的扩散补全方法实现高阶扩散补全,并通过异构图的协同交互增强节点补全属性。HGCCN在节点分类任务上进行评估,并在三个基准数据集上进行了大量的实验,证明了其在实际应用中有效性和可靠性。

HGCCN与SOTA异构图神经网络在节点分类实验上的性能比较
本研究为异构图属性补全学习提供了新的研究思路,对促进异构图表征学习及应用具有重要理论意义和应用价值。
该论文第一作者系欧卫华教授(通讯作者)指导的2023级硕士研究生杨远军。本研究得到国家自然科学基金(No.62262005)、贵州省高层次创新人才项目“百”层次人才(No. GCC[2023]033)、贵州省教育厅自然科学研究项目(No.QJJ[2023]011,QJJ[2024]009)、贵州省科技厅项目(QKHCG-DXGA[2025]-ZD002)以及微纳与智能制造教育部工程研究中心(No. WZG-202506)的资助。
论文全文链接:https://doi.org/10.1016/j.eswa.2025.128402