期刊文献+
共找到198篇文章
< 1 2 10 >
每页显示 20 50 100
基于改进标签传播算法的舆情社交网络社区发现
1
作者 钱晓东 王卓 《计算机应用研究》 北大核心 2025年第1期48-55,共8页
通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点... 通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点影响力的大小更新标签。实验结果表明,该方法在最好情况下(k=0.9)相较于原算法,在稳定性和模块度指标两方面分别提高了31%和78%,并且优于其他几种改进算法。由此可见,该算法相较于原算法及其他改进算法在舆情社交网络的主题社区发现中表现更好。 展开更多
关键词 标签传播算法 舆情社交网络 HK模型 主题社区发现
在线阅读 下载PDF
一种用于社区检测的局部全局融合标签传播算法
2
作者 于海龙 杨云云 王力 《现代电子技术》 北大核心 2025年第11期101-108,共8页
社区检测对于分析复杂社交网络结构至关重要。现有的社区检测方法不能够充分考虑网络局部与全局结构之间的复杂关系,检测社区结构的稳定性和准确性有待提高。为此,文中提出用于社区检测的局部全局融合标签传播算法(LGI-LPA)。首先,提出... 社区检测对于分析复杂社交网络结构至关重要。现有的社区检测方法不能够充分考虑网络局部与全局结构之间的复杂关系,检测社区结构的稳定性和准确性有待提高。为此,文中提出用于社区检测的局部全局融合标签传播算法(LGI-LPA)。首先,提出将节点间的相似性与节点的总体影响力结合确定初始社区结构,进行标签初始化;其次,根据影响力排序从社区内部和外部采用一种新的分类交替标签传播方法;最后,对小社团进行识别处理。在真实世界网络和兰奇基内蒂-福图纳托-拉迪奇(LFR)仿真网络上的实验结果表明,相较于次优的标签传播算法(LSMD),LGI-LPA在Polbooks和Football网络上的归一化互信息(NMI)分别提高了8.47%和2.20%,在LFR人工网络上的归一化互信息(NMI)相较于其他四种算法,也有着优势,随着网络拓扑参数变大,也表现出了较强的稳定性,该算法具有优秀的社区检测性能。 展开更多
关键词 社交网络 社区检测 节点影响力 相似度 标签初始化 标签传播
在线阅读 下载PDF
基于图嵌入和多标签传播的重叠社区检测算法 被引量:7
3
作者 高兵 宋敏 +1 位作者 邹启杰 秦静 《计算机应用研究》 CSCD 北大核心 2024年第5期1428-1433,共6页
为进一步优化重叠社区检测算法,提出了一种新的基于度和节点聚类系数的节点重要性定义,按照节点重要性降序更新节点,固定节点更新策略,提高社区检测的稳定性。在此基础上,提出了一种基于图嵌入和多标签传播的重叠社区检测算法(overlappi... 为进一步优化重叠社区检测算法,提出了一种新的基于度和节点聚类系数的节点重要性定义,按照节点重要性降序更新节点,固定节点更新策略,提高社区检测的稳定性。在此基础上,提出了一种基于图嵌入和多标签传播的重叠社区检测算法(overlapping community detection based on graph embedding and multi-label propagation algorithm,OCD-GEMPA)。该算法结合node2vec模型对节点进行低维向量表示,构建节点之间的权重值矩阵,根据权重值计算标签归属系数,据此选择标签,避免了随机选择问题。在真实数据集和人工合成数据集上对该算法进行实验验证。实验结果表明,与其他重叠社区检测算法相比,OCD-GEMPA在EQ和NMI这两个指标都有明显提升,具有更好的准确性和稳定性。 展开更多
关键词 标签传播 图嵌入 重叠社区检测 节点重要性 节点更新策略
在线阅读 下载PDF
基于动态图注意力与标签传播的实体对齐 被引量:3
4
作者 莫少聪 陈庆锋 +2 位作者 谢泽 刘春雨 邱俊铼 《计算机工程》 CAS CSCD 北大核心 2024年第4期150-159,共10页
实体对齐是多源数据库融合的有效方法,旨在找出多源知识图谱中的共指实体。近年来,图卷积网络(GCN)已成为实体对齐表示学习的新范式,然而,不同组织构建知识图谱的目标及规则存在巨大差异,要求实体对齐模型能够准确发掘知识图谱之间的长... 实体对齐是多源数据库融合的有效方法,旨在找出多源知识图谱中的共指实体。近年来,图卷积网络(GCN)已成为实体对齐表示学习的新范式,然而,不同组织构建知识图谱的目标及规则存在巨大差异,要求实体对齐模型能够准确发掘知识图谱之间的长尾实体特征,并且现有的GCN实体对齐模型过于注重关系三元组的结构表示学习,忽略了属性三元组丰富的语义信息。为此,提出一种实体对齐模型,引入动态图注意力网络聚合属性结构三元组表示,降低无关属性结构对实体表示的影响。同时,为缓解知识图谱的关系异构问题,引入多维标签传播对实体邻接矩阵的不同维度进行压缩,将实体特征根据压缩后的知识图谱邻接关系进行传播以获得关系结构表示,最后通过线性规划算法对实体表示相似度矩阵进行迭代以得到最终的对齐结果。在公开数据集ENFR-15K、EN-ZH-15K以及中文医学数据集MED-BBK-9K上进行实验,结果表明,该模型的Hits@1分别为0.942、0.926、0.427,Hits@10分别为0.963、0.952、0.604,MRR分别为0.949、0.939、0.551,消融实验结果也验证了模型中各模块的有效性。 展开更多
关键词 数据库融合 图卷积网络 实体对齐 标签传播 线性规划
在线阅读 下载PDF
多项正则化约束的伪标签传播优化脑电信号聚类 被引量:1
5
作者 代成龙 李光辉 +2 位作者 李栋 申佳华 皮德常 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期156-171,共16页
作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题... 作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题,也在一定程度上限制了无标签脑电信号这类新型数据的应用拓展.为了解决无标签脑电信号的无监督分析问题,提出了一种基于多项正则化约束的伪标签传播优化聚类模型.该模型通过同时优化学习伪标签传播矩阵、脑电信号相似度邻接矩阵、标签分类器的方式实现聚类.将提出的脑电信号聚类模型转化为一个多目标优化问题,并提出了一种基于梯度下降策略的聚类算法EEGapc(electroencephalogram clustering with pseudo label propagation).该算法不仅充分考虑了脑电信号之间的相关性及脑电信号间的信息传递,还能快速收敛到局部最优.在14个真实脑电信号数据集上的实验结果表明,提出的EEGapc脑电信号聚类算法比现有的8种聚类算法性能更好,且在平均NMI(normalized mutual information),ARI(adjusted rand index),F-score,kappa这4个指标上,EEGapc与现有的8种聚类算法相比,分别至少提升了86.88%,58.01%,6.29%,61.17%. 展开更多
关键词 脑电信号聚类 标签传播 邻接矩阵优化 标签分类器 多目标优化
在线阅读 下载PDF
基于节点影响值的社区网络稳定标签传播算法
6
作者 韩永印 王侠 王志晓 《沈阳工业大学学报》 CAS 北大核心 2024年第2期184-190,共7页
针对社区网络标签传播准确性差的问题,提出基于节点影响值的社区网络稳定标签传播算法。该算法重设社区网络相邻节点相似度,结合链路加权思想将其变换为链路无向带权图;利用节点K-shell分解值判断节点影响力,计算种子节点的中心性度量值... 针对社区网络标签传播准确性差的问题,提出基于节点影响值的社区网络稳定标签传播算法。该算法重设社区网络相邻节点相似度,结合链路加权思想将其变换为链路无向带权图;利用节点K-shell分解值判断节点影响力,计算种子节点的中心性度量值,升序排列节点更新顺序;根据越重要节点标签影响越大的规则,修正高频数标签,获取最佳社区网络划分结果。结果表明:该算法模块度在0.320以上,准确率达到99%,因此,经该方法划分后的网络结构清晰、准确,稳定性高。 展开更多
关键词 节点影响值 社区网络 标签传播算法 局部特征 相邻节点相似度 中心性度量 随机排序 标签修正
在线阅读 下载PDF
基于节点中心性和标签传播算法的社区检测 被引量:4
7
作者 许星舟 《计算机应用与软件》 北大核心 2024年第3期290-296,344,共8页
在复杂网络的探索过程中,关键节点的识别和社区结构的检测受到广泛关注,有助于人们更好地理解和利用复杂网络的结构特征,揭示节点之间的关系。提出库仑力中心性(CFC),并将其应用到标签传播算法(LPA)中设计了社团检测算法(CFCLPA),消除了... 在复杂网络的探索过程中,关键节点的识别和社区结构的检测受到广泛关注,有助于人们更好地理解和利用复杂网络的结构特征,揭示节点之间的关系。提出库仑力中心性(CFC),并将其应用到标签传播算法(LPA)中设计了社团检测算法(CFCLPA),消除了LPA中的随机性,具有较高的社团结构识别能力。在真实网络和LFR基准网络下进行了一系列测试和比较,实验结果表明,该算法具有更优秀的社团检测性能。 展开更多
关键词 复杂网络 社团检测 中心性指标 标签传播算法
在线阅读 下载PDF
基于标签传播增强的多通道图卷积网络
8
作者 袁立宁 冯文刚 刘钊 《计算机科学》 CSCD 北大核心 2024年第8期304-312,共9页
多数图卷积网络(GCN)模型通过设计高效的信息传递和保留方式提升节点分类任务的实验表现,忽略了节点标签信息在拓扑空间和属性空间的传播。针对上述问题,提出了一种基于标签传播算法(LPA)增强的多通道图卷积模型MGCN-LPA,同时增大同类... 多数图卷积网络(GCN)模型通过设计高效的信息传递和保留方式提升节点分类任务的实验表现,忽略了节点标签信息在拓扑空间和属性空间的传播。针对上述问题,提出了一种基于标签传播算法(LPA)增强的多通道图卷积模型MGCN-LPA,同时增大同类节点在属性和拓扑空间的关系权重,改善节点间特征和标签信息的传播。首先,计算不同节点的属性相似度值,并采用k近邻算法生成属性关系图;然后,利用结合了GCN和LPA的图卷积层GCN-LPA提取属性图和属性关系图的潜在特征,生成拓扑节点表示和属性节点表示;最后,将拓扑和属性表示进行融合,并将生成的最终表示用于节点分类任务。在3个基准图数据集上进行实验,MGCN-LPA的实验表现能够匹配当前较为先进的基线模型,其在Cora和Citeseer数据集上的分类结果相比表现最优的基线模型提升了9.3%和12%。上述实验结果表明,MGCN-LPA能够增大同类节点间路径的权重,从而增强同类节点间的信息传递,提升节点分类任务的实验表现。此外,消融实验结果表明,与仅使用拓扑空间或者属性空间信息的变体相比,融合两类信息的MGCN-LPA能够充分提取和保留原始图中蕴含的潜在特征,提升模型的表征能力和泛化性。 展开更多
关键词 图卷积网络 标签传播算法 属性图 属性关系图 节点分类
在线阅读 下载PDF
基于反向标签传播的多生成器主动学习算法及其在离群点检测中的应用研究 被引量:1
9
作者 邢开颜 陈文 《计算机科学》 CSCD 北大核心 2024年第4期359-365,共7页
当前正负类训练样本分布不均衡的问题已极大地限制了离群检测模型的性能。基于主动学习的离群点检测算法能够通过对样本分布的主动学习,自动合成离群点以平衡训练数据分布。然而,传统的基于主动学习的检测方法缺乏对合成离群点的质量评... 当前正负类训练样本分布不均衡的问题已极大地限制了离群检测模型的性能。基于主动学习的离群点检测算法能够通过对样本分布的主动学习,自动合成离群点以平衡训练数据分布。然而,传统的基于主动学习的检测方法缺乏对合成离群点的质量评估和过滤筛选,导致通过主动学习过程合成的训练样本点中存在样本噪声,并降低了分类模型的性能。针对上述问题,提出了基于反向标签传播的多生成器主动学习算法(Multi-Generator Active Learning Algorithm Based on Reverse Label Propagation,MG-RLP),其包括多个神经网络生成器和一个用于离群点边界检测的鉴别器。MG-RLP通过多个子生成器生成多分布特征的样本数据,以防止单生成器合成的训练样本过于聚集而导致的模式崩塌问题。同时,MG-RLP利用反向标签传播过程对神经网络生成的样本点进行质量评估,以筛选出可信的合成样本。筛选后的样本被保留在训练样本中用于对鉴别器进行迭代训练,以提升对离群点的检测性能。基于5个公共数据集,对比验证了MG-RLP与6种典型的离群点检测算法的性能,结果表明,MG-RLP在AUC和检测精度指标上分别提高了15%和22%,结果验证了MG-RLP的有效性。 展开更多
关键词 离群点检测 主动学习 生成对抗网络 标签传播
在线阅读 下载PDF
基于方向权值标签传播的微学习单元聚类算法
10
作者 胡志远 张月琴 陈健 《科学技术与工程》 北大核心 2024年第10期4189-4196,共8页
为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微... 为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微学习单元序列簇群。该算法对标签传播算法进行两个改进:根据单元节点的利用度确定标签的更新顺序,降低在节点更新顺序上的随机性;利用当前单元节点的前置邻居和后置邻居的有向边权累加值进行标签更新,并将标签权重引入标签更新策略,既可降低标签更新的随机性,也可避免形成巨型簇群。实验结果表明,LPADEW算法在微学习真实数据集和人工数据集中均取得了较好的结果。 展开更多
关键词 微学习 有向图 图聚类 有向边权值 标签传播
在线阅读 下载PDF
基于成对约束的多标签传播重叠社区发现方法 被引量:1
11
作者 丁建立 邵酉辰 《计算机工程与设计》 北大核心 2020年第3期689-694,共6页
针对多标签传播重叠社区发现算法(COPRA)存在的社区划分结果准确性低和鲁棒性差的问题,提出一种基于成对约束的多标签传播重叠社区发现方法(PCMLPA)。以主动查找、扩展的方式引入成对约束指导社区发现,提高社区划分结果的准确性。在标... 针对多标签传播重叠社区发现算法(COPRA)存在的社区划分结果准确性低和鲁棒性差的问题,提出一种基于成对约束的多标签传播重叠社区发现方法(PCMLPA)。以主动查找、扩展的方式引入成对约束指导社区发现,提高社区划分结果的准确性。在标签传播的过程中,根据节点影响力大小确定节点更新顺序,根据节点的相似性度量确定邻居节点的遍历顺序,解决COPRA鲁棒性差的问题。与其它基准算法的对比实验结果表明,PCMLPA方法鲁棒性强且社区划分结果具有更高的准确性。 展开更多
关键词 重叠社区发现 标签传播 标签传播重叠社区发现算法 成对约束 半监督学习 节点影响力
在线阅读 下载PDF
基于改进标签传播算法的电力系统并行恢复分区方法 被引量:24
12
作者 和敬涵 李长城 +2 位作者 张沛 王小君 冯丽 《电网技术》 EI CSCD 北大核心 2018年第6期1776-1782,共7页
制定合理有效的分区方案是并行恢复的首要任务。由于电网运行的潮流分布能够反映系统内节点之间联系的紧密程度,为了达到更有效的分区目的,结合复杂网络社区发现理论和潮流信息,提出一种基于改进标签传播算法的电网并行恢复分区方法。... 制定合理有效的分区方案是并行恢复的首要任务。由于电网运行的潮流分布能够反映系统内节点之间联系的紧密程度,为了达到更有效的分区目的,结合复杂网络社区发现理论和潮流信息,提出一种基于改进标签传播算法的电网并行恢复分区方法。首先给黑启动电源分配不同的子区标签,再根据停电前支路潮流信息构建电网节点的标签传播矩阵。反复将节点标签的信息在电网中传播,直至各节点标签信息不再发生变化,则具有相同标签的节点被划分到同一个子区。针对传统标签传播算法可能出现的标签振荡现象,提出了同时考虑邻接节点标签和自身历史标签的节点标签影响策略。通过IEEE 39节点系统的仿真表明,所提方法得到的分区结果在区间功率交换、最大子区规模和模块度方面效果显著。最后利用某省级电网的实际数据进行仿真分析,验证了所提方法用于实际系统的有效性。 展开更多
关键词 并行恢复 分区方法 潮流分布 标签传播算法
在线阅读 下载PDF
基于双语信息和标签传播算法的中文情感词典构建方法 被引量:38
13
作者 李寿山 李逸薇 +1 位作者 黄居仁 苏艳 《中文信息学报》 CSCD 北大核心 2013年第6期75-81,共7页
文本情感分析是目前自然语言处理领域的一个热点研究问题,具有广泛的实用价值和理论研究意义。情感词典构建则是文本情感分析的一项基础任务,即将词语按照情感倾向分为褒义、中性或者贬义。然而,中文情感词典构建存在两个主要问题:1)许... 文本情感分析是目前自然语言处理领域的一个热点研究问题,具有广泛的实用价值和理论研究意义。情感词典构建则是文本情感分析的一项基础任务,即将词语按照情感倾向分为褒义、中性或者贬义。然而,中文情感词典构建存在两个主要问题:1)许多情感词存在多义、歧义的现象,即一个词语在不同语境中它的语义倾向也不尽相同,这给词语的情感计算带来困难;2)由国内外相关研究现状可知,中文情感字典建设的可用资源相对较少。考虑到英文情感分析研究中存在大量语料和词典,该文借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。在四个领域的实验结果显示我们的方法能获得一个分类精度高、覆盖领域语境的中文情感词典。 展开更多
关键词 情感分析 双语信息 情感字典 标签传播
在线阅读 下载PDF
基于标签传播概率的重叠社区发现算法 被引量:59
14
作者 刘世超 朱福喜 甘琳 《计算机学报》 EI CSCD 北大核心 2016年第4期717-729,共13页
发现高质量的社区有助于理解真实的复杂网络,尤其是动态地分析社区重叠结构,对社区管理和演化具有重要意义.文中提出一种基于标签传播概率的LPPB(Label-Propagation-Probability-Based)重叠社区发现算法,该算法首先为每个结点赋予一个... 发现高质量的社区有助于理解真实的复杂网络,尤其是动态地分析社区重叠结构,对社区管理和演化具有重要意义.文中提出一种基于标签传播概率的LPPB(Label-Propagation-Probability-Based)重叠社区发现算法,该算法首先为每个结点赋予一个独立的标签,然后根据结点的影响力大小将结点进行排序;在标签传播的过程中,综合网络的结构传播特性和结点的属性特征计算标签传播的概率,同时利用结点的历史标签记录修正标签更新结果;最后将传播后具有相同标签的结点划分为同一社区,社区间的重叠结点构成了社区重叠结构.作者在基准数据集和带时间维度的C-DBLP网络上进行实验,结果验证了该算法具有较高的准确性和稳定性,并且通过对重叠结构的动态分析,揭示了社区重叠结点的行为特性和C-DBLP网络处于高"耦合度"的发展趋势. 展开更多
关键词 重叠社区 标签传播概率 结点影响力 社区演化 社交网络 数据挖掘 社会媒体
在线阅读 下载PDF
标签传播算法理论及其应用研究综述 被引量:44
15
作者 张俊丽 常艳丽 师文 《计算机应用研究》 CSCD 北大核心 2013年第1期21-25,共5页
介绍了标签传播算法理论,分析了标签传播算法的特点,总结了其在多媒体信息检索、分类、标注、处理和社区发现等方面的应用研究,最后探讨了标签传播算法未来的研究方向。
关键词 标签传播算法 半监督学习 多媒体 社区发现
在线阅读 下载PDF
基于多核心标签传播的复杂网络重叠社区识别方法 被引量:12
16
作者 邓琨 李文平 +1 位作者 余法红 张健沛 《通信学报》 EI CSCD 北大核心 2017年第2期53-66,共14页
针对传统基于标签传播的重叠社区识别方法存在较强的随机性,以及需要预设相关阈值来辅助完成社区识别等缺陷,提出基于多核心标签传播的重叠社区识别方法(OMKLP)。在分析节点度以及节点与邻居节点的局部覆盖密度后提出核心节点评价模型,... 针对传统基于标签传播的重叠社区识别方法存在较强的随机性,以及需要预设相关阈值来辅助完成社区识别等缺陷,提出基于多核心标签传播的重叠社区识别方法(OMKLP)。在分析节点度以及节点与邻居节点的局部覆盖密度后提出核心节点评价模型,并在此基础上给出局部核心节点识别方法;基于局部核心节点,提出新的面向重叠社区的异步标签传播策略,该策略能够快速地识别出社区内部节点与边界节点,以获得重叠社区结构;提出重叠节点分析方法,进一步提高识别重叠节点准确度。OMKLP算法无需掌握任何先验知识,仅在掌握网络基本信息(点、边)基础上,便能够准确识别出重叠社区结构,从而有效解决了传统标签传播算法所存在的缺陷。在基准网络和真实网络上进行测试,并与多个经典算法进行对比分析,实验结果验证了所提算法的有效性和可行性。 展开更多
关键词 复杂网络 社区识别 标签传播 重叠节点
在线阅读 下载PDF
用于社区发现的LPA_LRDC标签传播算法 被引量:7
17
作者 徐成林 陈志刚 +4 位作者 黄瑞 龙增艳 李博 周清清 邓伊琴 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1746-1750,共5页
由于传统的LPA算法,在节点标签更新的顺序以及标签传播过程中存在较大的随机性,给社区发现的准确性和稳定性造成了很大的影响.本文提出LRDC(Leader Rank algorithm considered degree and clustering coefficient)算法并用其来衡量节点... 由于传统的LPA算法,在节点标签更新的顺序以及标签传播过程中存在较大的随机性,给社区发现的准确性和稳定性造成了很大的影响.本文提出LRDC(Leader Rank algorithm considered degree and clustering coefficient)算法并用其来衡量节点的重要性,然后按照节点的重要性大小排序作为LPA算法中初始化节点标签的依据,并在标签传播过程中综合考虑节点重要性以及邻居标签的数量提出LPA_LRDC(Label Propagation Algorithm based on LRDC)标签传播社区发现算法.通过在人工和真实的网络数据集上的实验结果表明,本文提出的标签传播社区发现算法能够显著的提高社区发现的准确性和稳定性. 展开更多
关键词 标签传播 LEADER RANK 节点重要性 社区划分 社区发现
在线阅读 下载PDF
一种基于节点密度分割和标签传播的Web页面挖掘方法 被引量:13
18
作者 张乃洲 曹薇 李石君 《计算机学报》 EI CSCD 北大核心 2015年第2期349-364,共16页
获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法忽略了Web页面中... 获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法忽略了Web页面中文本和链接的内在语义关系,同时降低了页面处理的效率.文中提出了一种Web页面重要内容挖掘的统一框架,该框架主要由3个部分组成:第一,先将Web页面转换为DOM树表示,然后采用节点密度熵为度量将DOM树分割为不同的页面块;第二,采用基于K最近邻标签传播的半监督方法自动扩展页面块训练集;第三,在扩展的页面块训练集上对SVM分类器进行训练,并用来对页面块进行分类.采用该框架可以将Web页面块区分为多种类型,并且该框架独立于Web页面的类型和布局.我们在真实的Web环境下进行了广泛的实验,实验结果表明了该方法的有效性. 展开更多
关键词 页面分割 节点密度 标签传播 DOM树 块分类 社会计算 社交网络
在线阅读 下载PDF
基于三支标签传播的半监督属性约简 被引量:15
19
作者 胡声丹 苗夺谦 姚一豫 《计算机学报》 EI CAS CSCD 北大核心 2021年第11期2332-2343,共12页
属性约简是粗糙集理论的重要应用之一.为了对部分标记的数据进行属性约简,一些基于粗糙集的半监督属性约简方法相继被提出,但这些方法在数据信息利用、运行代价、约简质量等方面仍然存在挑战.本文针对混合型分类数据,提出了一种新的基... 属性约简是粗糙集理论的重要应用之一.为了对部分标记的数据进行属性约简,一些基于粗糙集的半监督属性约简方法相继被提出,但这些方法在数据信息利用、运行代价、约简质量等方面仍然存在挑战.本文针对混合型分类数据,提出了一种新的基于三支标签传播的半监督属性约简(3WLPME)方法.该方法包括两个过程:三支标签传播(3WLP)和基于混合熵的启发式属性约简(MEHAR).其中,3WLP在经典标签传播算法的基础上,结合三支决策和主动学习思想,对无标签数据进行标注,并更新有标签集和无标签集.迭代执行上述过程直至收敛,可以提升最终的伪标签准确率.在MEHAR中,属性重要度由混合熵度量.基于依赖度和条件熵定义的混合熵,融合了粗糙集的代数表示和信息表示,能更深刻地反映属性的分类能力.本文对3WLP算法和MEHAR算法的有效性进行了理论分析.在UCI数据集上进行了以下仿真实验:3WLP与随机标签传播在伪标签准确率上的对比;不同属性约简算法在约简质量上的对比;3WLPME与其他基于粗糙集的半监督属性约简方法,在约简质量上的对比.实验结果验证了3WLP能获得较高的伪标签准确率;MEHAR在不降低分类准确率的前提下,能获得较小的约简;3WLPME在半监督约简过程中具有更高的效率和稳定性,说明本文所提方法是有效的. 展开更多
关键词 半监督学习 属性约简 三支决策 标签传播 邻域粗糙集 混合熵
在线阅读 下载PDF
采用PageRank和节点聚类系数的标签传播重叠社区发现算法 被引量:12
20
作者 马健 刘峰 +1 位作者 李红辉 樊建平 《国防科技大学学报》 EI CAS CSCD 北大核心 2019年第1期183-190,共8页
基于标签传播的社区发现算法可以检测出复杂网络的重叠社区结构,因此提出了一种基于PageRank和节点聚类系数的重叠社区发现算法。该算法使用PageRank算法对节点的影响力进行排序,可以稳定社区发现结果,节点的聚类系数是一个与节点相关的... 基于标签传播的社区发现算法可以检测出复杂网络的重叠社区结构,因此提出了一种基于PageRank和节点聚类系数的重叠社区发现算法。该算法使用PageRank算法对节点的影响力进行排序,可以稳定社区发现结果,节点的聚类系数是一个与节点相关的值,使用节点聚类系数修改算法的参数并限制每个节点拥有最多标签的数量值,可以提高社区挖掘的质量。在人工网络和真实世界的网络上测试,实验验证了该算法能够有效地检测出重叠社区,并具有可接受的时间效率和算法复杂度。 展开更多
关键词 社区发现 重叠社区 标签传播 聚类系数 PAGERANK算法 节点影响力
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部