-
题名融合转移概率矩阵的多阶最近邻图聚类算法
- 1
-
-
作者
徐童童
解滨
张春昊
张喜梅
-
机构
河北师范大学计算机与网络空间安全学院
河北省网络与信息安全重点实验室(河北师范大学)
供应链大数据分析与数据安全河北省工程研究中心(河北师范大学)
-
出处
《计算机应用》
CSCD
北大核心
2024年第5期1527-1538,共12页
-
基金
国家自然科学基金资助项目(62076088)
河北师范大学研究生创新项目(XCXZZSS202317)。
-
文摘
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。
-
关键词
共享近邻
趋密性
转移概率
多阶最近邻
分层聚类
-
Keywords
shared neighbor
densification
transition probability
multi-order nearest neighbor
hierarchical clustering
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名双路自编码器的属性网络表示学习
- 2
-
-
作者
王静红
周志霞
王辉
李昊康
-
机构
河北师范大学计算机与网络空间安全学院
河北省网络与信息安全重点实验室(河北师范大学)
供应链大数据分析与数据安全河北省工程研究中心(河北师范大学)
河北工程技术学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第8期2338-2344,共7页
-
基金
中央引导地方科技发展资金资助项目(226Z1808G)
河北省自然科学基金资助项目(F2021205014)
+1 种基金
河北省高等学校科学技术研究项目(ZD2022139)
河北师范大学重点项目(L2023J05)。
-
文摘
属性网络表示学习的目的是在保证网络中节点性质的前提下,结合结构和属性信息学习节点的低维稠密向量表示。目前属性网络表示学习方法忽略了网络中属性信息的学习,且这些方法中的属性信息与网络拓扑结构的交互性不足,不能高效融合网络结构和属性信息。针对以上问题,提出一种双路自编码器的属性网络表示学习(DENRL)算法。首先,通过多跳注意力机制捕获节点的高阶邻域信息;其次,设计低通拉普拉斯滤波器去除高频信号,并迭代获取重要邻居节点的属性信息;最后,构建自适应融合模块,通过结构和属性信息的一致性及差异性约束来增加对重要信息的获取,并通过监督两个自编码器的联合重构损失函数训练编码器。在Cora、Citeseer、Pubmed和Wiki数据集上的实验结果表明,与DeepWalk、ANRL(Attributed Network Representation Learning)等算法相比,DENRL算法在3个引文网络数据集上聚类准确率最高、算法运行时间最少,在Cora数据集上聚类准确率为0.775和运行时间为0.460 2 s;且DENRL算法在Cora和Citeseer数据集上链路预测精确率最高,分别达到了0.961和0.970。可见,属性与结构信息的融合及交互学习可以获得更强的节点表示能力。
-
关键词
属性网络
网络表示学习
自编码器
交互学习
注意力机制
-
Keywords
attribute network
network representation learning
auto-encoder
interactive learning
attention mechanism
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-