为进一步优化重叠社区检测算法,提出了一种新的基于度和节点聚类系数的节点重要性定义,按照节点重要性降序更新节点,固定节点更新策略,提高社区检测的稳定性。在此基础上,提出了一种基于图嵌入和多标签传播的重叠社区检测算法(overlappi...为进一步优化重叠社区检测算法,提出了一种新的基于度和节点聚类系数的节点重要性定义,按照节点重要性降序更新节点,固定节点更新策略,提高社区检测的稳定性。在此基础上,提出了一种基于图嵌入和多标签传播的重叠社区检测算法(overlapping community detection based on graph embedding and multi-label propagation algorithm,OCD-GEMPA)。该算法结合node2vec模型对节点进行低维向量表示,构建节点之间的权重值矩阵,根据权重值计算标签归属系数,据此选择标签,避免了随机选择问题。在真实数据集和人工合成数据集上对该算法进行实验验证。实验结果表明,与其他重叠社区检测算法相比,OCD-GEMPA在EQ和NMI这两个指标都有明显提升,具有更好的准确性和稳定性。展开更多
由于传统的LPA算法,在节点标签更新的顺序以及标签传播过程中存在较大的随机性,给社区发现的准确性和稳定性造成了很大的影响.本文提出LRDC(Leader Rank algorithm considered degree and clustering coefficient)算法并用其来衡量节点...由于传统的LPA算法,在节点标签更新的顺序以及标签传播过程中存在较大的随机性,给社区发现的准确性和稳定性造成了很大的影响.本文提出LRDC(Leader Rank algorithm considered degree and clustering coefficient)算法并用其来衡量节点的重要性,然后按照节点的重要性大小排序作为LPA算法中初始化节点标签的依据,并在标签传播过程中综合考虑节点重要性以及邻居标签的数量提出LPA_LRDC(Label Propagation Algorithm based on LRDC)标签传播社区发现算法.通过在人工和真实的网络数据集上的实验结果表明,本文提出的标签传播社区发现算法能够显著的提高社区发现的准确性和稳定性.展开更多
近年来,高质量社区的挖掘和发现已经成为社会网络研究一个热点.其中,基于标签传播的社区挖掘算法(Label Propagation Algorithm,简称LPA)由于具有近似线性时间复杂度且无须预先定义目标函数和社区数量等优点而得到广泛关注.但是,LPA算...近年来,高质量社区的挖掘和发现已经成为社会网络研究一个热点.其中,基于标签传播的社区挖掘算法(Label Propagation Algorithm,简称LPA)由于具有近似线性时间复杂度且无须预先定义目标函数和社区数量等优点而得到广泛关注.但是,LPA算法的标签传播过程存在不确定性和随机性,影响了社区发现的准确性和稳定性.提出一种新的基于标签传播的社区发现算法LPA_SI(Label Propagation Algorithm based on Significance and Influence).首先,采用新的节点重要性度量方法对节点进行排序;其次,提出一种新的标签影响力计算方法更新每个节点的标签;最后,在真实数据集和人工数据集上的实验表明,LPA_SI在复杂度相近的情况下能够显著提高社区发现的质量,并具有较好的稳定性.展开更多
文摘为进一步优化重叠社区检测算法,提出了一种新的基于度和节点聚类系数的节点重要性定义,按照节点重要性降序更新节点,固定节点更新策略,提高社区检测的稳定性。在此基础上,提出了一种基于图嵌入和多标签传播的重叠社区检测算法(overlapping community detection based on graph embedding and multi-label propagation algorithm,OCD-GEMPA)。该算法结合node2vec模型对节点进行低维向量表示,构建节点之间的权重值矩阵,根据权重值计算标签归属系数,据此选择标签,避免了随机选择问题。在真实数据集和人工合成数据集上对该算法进行实验验证。实验结果表明,与其他重叠社区检测算法相比,OCD-GEMPA在EQ和NMI这两个指标都有明显提升,具有更好的准确性和稳定性。
文摘由于传统的LPA算法,在节点标签更新的顺序以及标签传播过程中存在较大的随机性,给社区发现的准确性和稳定性造成了很大的影响.本文提出LRDC(Leader Rank algorithm considered degree and clustering coefficient)算法并用其来衡量节点的重要性,然后按照节点的重要性大小排序作为LPA算法中初始化节点标签的依据,并在标签传播过程中综合考虑节点重要性以及邻居标签的数量提出LPA_LRDC(Label Propagation Algorithm based on LRDC)标签传播社区发现算法.通过在人工和真实的网络数据集上的实验结果表明,本文提出的标签传播社区发现算法能够显著的提高社区发现的准确性和稳定性.
文摘近年来,高质量社区的挖掘和发现已经成为社会网络研究一个热点.其中,基于标签传播的社区挖掘算法(Label Propagation Algorithm,简称LPA)由于具有近似线性时间复杂度且无须预先定义目标函数和社区数量等优点而得到广泛关注.但是,LPA算法的标签传播过程存在不确定性和随机性,影响了社区发现的准确性和稳定性.提出一种新的基于标签传播的社区发现算法LPA_SI(Label Propagation Algorithm based on Significance and Influence).首先,采用新的节点重要性度量方法对节点进行排序;其次,提出一种新的标签影响力计算方法更新每个节点的标签;最后,在真实数据集和人工数据集上的实验表明,LPA_SI在复杂度相近的情况下能够显著提高社区发现的质量,并具有较好的稳定性.