-
题名一种结合LPA半监督学习的排序学习算法
被引量:3
- 1
-
-
作者
奚凌然
王小平
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用与软件》
CSCD
2016年第1期286-290,共5页
-
文摘
针对有监督排序学习所需训练集的大量标注数据不易获得的情况,引入基于图的标签传播半监督学习。利用有限的已标记数据和大量未标记数据来完成训练数据的自动标注工作,解决大量训练数据集标注工作耗时耗力的难题。首先以训练数据为节点建立εNN图模型实现标签传播算法进行训练数据的自动标注,再基于得到的训练集使用Ranking SVM实现排序学习,在OHSUMED数据集上衡量该方法在MAP和NDCG@n评价准则下的性能。实验结果表明,该方法的性能优于普通pointwise排序学习方法,略低于普通pairwise排序学习方法,能够在达到可用性要求的前提下节省接近60%的训练集标注工作量。
-
关键词
排序学习
lpa标签传播算法
图的半监督学习
排序支持向量机
-
Keywords
Ranking learning lpa (label propagation algorithm) Graph based semi-supervised learning RankingSVM
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于Jaccard和LPA的社团划分算法
被引量:4
- 2
-
-
作者
崔海涛
李玲娟
-
机构
南京邮电大学计算机学院
-
出处
《南京邮电大学学报(自然科学版)》
北大核心
2019年第6期79-85,共7页
-
基金
国家重点研发计划专项(2017YFB1401302,2017YFB0202200)
国家自然科学基金(61572260、61872196)资助项目
-
文摘
社会网络记录网络中各个实体间的关联,社团划分是对社会网络中的节点关系的区分归纳。为了提高社团划分的准确率和效率,基于Jaccard相似度算法和标签传播算法LPA,设计了一种适用于非重叠社团的划分算法JLCD。该算法首先针对Jaccard相似度算法的计算结果中存在较多关联性的节点但相似度为零或无法计算的情况,引入了SimRank算法的思想对Jaccard相似度算法进行了改进,并用改进的Jaccard算法来计算节点相似度从而得到初始社团;然后用LPA算法基于初始社团来完成最终的社团划分,以此解决LPA在初始标签分配上消耗资源大的问题,并提高社团划分的稳定性。海豚社会网络、足球队赛事网络和人工生成数据集的社团划分结果表明:JLCD方法能够有效地对社团结构进行划分,并且具有较高的准确度和较低的时间复杂度。
-
关键词
社团划分
Jaccard相似度
lpa
-
Keywords
community division
Jaccard similarity
label propagation algorithm(lpa)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名标签传播算法理论及其应用研究综述
被引量:44
- 3
-
-
作者
张俊丽
常艳丽
师文
-
机构
南京大学信息管理学院
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第1期21-25,共5页
-
基金
国家社科基金重大资助项目(10&ZD134)
-
文摘
介绍了标签传播算法理论,分析了标签传播算法的特点,总结了其在多媒体信息检索、分类、标注、处理和社区发现等方面的应用研究,最后探讨了标签传播算法未来的研究方向。
-
关键词
标签传播算法
半监督学习
多媒体
社区发现
-
Keywords
label propagation algorithm(lpa)
semi-supervised learning(SSL)
multimedia
community discovery
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一种局部强化的多标签传播社区发现算法
被引量:3
- 4
-
-
作者
马千里
张俊浩
-
机构
华南理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
2014年第6期171-174,179,共5页
-
基金
中央高校基本科研业务费专项基金资助项目(2012ZZ0064)
教育部高等学校博士学科点专项科研基金资助项目(20110172120027)
+3 种基金
国家大学生创新性实验计划基金资助项目(111056155)
广东省自然科学基金资助项目(S2012010009961)
广东省教育部产学研结合基金资助项目(2011B090400032)
广东省电子商务市场应用技术重点实验室开放基金资助项目(2011GDEC0F01)
-
文摘
在社交网络中,社区和圈子均表现为一组内部连接相对紧密的节点,但后者规模较小。圈子是重要的局部社区信息,利用这一特点有助于进行社区发现。然而,现有的大部分基于标签传播的社区发现算法并没有考虑圈子的信息。为此,提出一种基于局部强化的多标签传播(LSMLP)社区发现算法。给出圈子的定义,提出一种基于圈子信息的迭代多标签传播策略,并从每个节点的多个标签中选择归属系数最大的标签作为其从属的临时社区。采用两步优化方法使模度最大化。在真实网络的数据实验结果表明,与已有的社区发现算法相比,LSMLP算法能更高效地发现社区。
-
关键词
社区发现
标签传播算法
局部强化
圈子
模度优化
-
Keywords
community detection
labei propagation algorithm(lpa)
local strengthening
circle
modulor optimization
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于标签影响力的半同步社区发现算法
被引量:6
- 5
-
-
作者
汪焱
黄发良
元昌安
-
机构
福建师范大学软件学院
科学计算与智能信息处理广西高校重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2016年第6期1573-1578,1587,共7页
-
基金
国家自然科学基金资助项目(61363037)
教育部人文社会科学研究青年基金资助项目(12YJCZH074)
福建省教育厅A类项目(JA13077)~~
-
文摘
微博网络与社交网络等的交互式社会信息网络规模的快速增长对社区发现提出巨大挑战。标签传播算法(LPA)虽然在时间复杂度上具有很大的优势,但是其内在的多种随机策略使得算法稳定性不高。针对LPA的随机问题,提出了一种基于影响力的半同步标签传播算法(ISLPA),能有效地避免振荡问题,巧妙地实现了相邻节点之间的同步更新,并结合影响力从初始标签、选择邻居节点和更新顺序三方面进行了改进,摒弃了原有的随机策略。真实网络和人工网络的实验结果表明,ISLPA具有较高的稳定性与有效性,与其他LPA相关算法相比存在明显的优势。
-
关键词
社区发现
标签传播法
半同步
节点影响力
振荡
-
Keywords
community detection
Label propagation algorithm(lpa)
semi-synchronization
node influence
oscillation
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于随机游走的改进标签传播算法
被引量:4
- 6
-
-
作者
郑文萍
岳香豆
杨贵
-
机构
山西大学计算机与信息技术学院
计算智能与中文信息处理教育部重点实验室(山西大学)
-
出处
《计算机应用》
CSCD
北大核心
2020年第12期3423-3429,共7页
-
基金
山西省自然科学基金资助项目(201801D121123)
山西省回国留学人员科研基金资助项目(2017-014)。
-
文摘
社区发现是挖掘社交网络隐藏信息的一个有用的工具,而标签传播算法(LPA)是社区发现算法中的一种常见算法,不需要任何的先验知识,且运行速度快。针对标签传播算法有很强的随机性而导致的社区发现算法结果不稳定的问题,提出了一种基于随机游走的改进标签传播算法(LPARW)。首先,根据在网络上进行随机游走确定了节点重要性的排序,从而得到节点的更新顺序;然后,遍历节点的更新序列,对每个节点将其与排序在其之前的节点进行相似性计算,若该节点与排序在其之前的节点是邻居节点且它们之间的相似性大于阈值,则将排序在其之前的节点选为种子节点;最后,将种子节点的标签传播给其余的节点,得到社区的最终划分结果。将所提算法与一些经典的标签传播算法在4个有标签的网络和5个无标签的真实网络上进行比较分析,实验结果表明所提算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度等经典的评价指标上的性能均优于其余对比算法,可见该算法具有很好的社区划分效果。
-
关键词
复杂网络
社区发现
标签传播算法
随机游走
种子扩展策略
-
Keywords
complex network
community detection
Label propagation algorithm(lpa)
random walk
seed expansion strategy
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于势函数的标签传播社区发现算法
被引量:3
- 7
-
-
作者
石立新
张俊星
-
机构
大连民族学院信息与通信工程学院
-
出处
《计算机应用》
CSCD
北大核心
2014年第3期738-741,共4页
-
基金
国家自然科学基金资助项目(61201418)
中央高校自主基金资助项目(DC120101133)
-
文摘
针对标签传播算法(LPA)存在大量随机性、算法稳定性差的问题,提出了基于数据场势函数的标签传播算法(LPAP)。该算法计算所有节点的势值,搜索势值极值点。初始化时仅赋予势值极值点以标签,迭代过程中根据邻接节点中相同标签节点势值之和更新标签,所有节点标签不再改变时迭代结束。实验结果表明:该算法得到的社区划分方式平均是LPA的4.0%,是平衡传播算法(BPA)的12.9%;信息变化参数平均是LPA的45.1%,是BPA的73.3%。具有更好的稳定性,适用于大型网络的社区发现。
-
关键词
社区发现
标签传播算法
数据场
势函数
稳定性
-
Keywords
community detection
Label propagation algorithm (lpa)
data field
potential function
robustness
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于节点中心性和社区相似性的快速标签传播算法
被引量:3
- 8
-
-
作者
顾军华
霍士杰
王守彬
田喆
-
机构
河北工业大学计算机科学与软件学院
河北省大数据实验室(河北工业大学)
-
出处
《计算机应用》
CSCD
北大核心
2018年第5期1320-1326,共7页
-
基金
天津市科技计划项目(16ZXHLSF0023)
河北省科技计划项目(17210305D)~~
-
文摘
为了减少标签传播算法(LPA)中不必要的更新、解决算法准确率低且稳定性差的问题,提出了基于节点中心性和社区相似性的快速标签传播算法(FNCS_LPA)。按照节点中心性度量对网络的节点从低到高进行排序后加入节点信息列表,利用节点信息列表来指导更新过程,提高社区发现的稳定性并避免不必要的更新;采取基于社区相似性的更新规则,提高了社区发现的准确率。在真实社会网络和LFR基准网络上进行实验:相比LPA和三种较好的LPA改进算法,FNCS_LPA在执行速度方面提升了几十倍,真实社会网络的模块度也相对较高,在社区结构比较模糊的LFR基准网络上的归一化互信息有明显的优势。实验结果表明FNCS_LPA在提高执行速度的基础上,提高了算法的稳定性和准确率。
-
关键词
社区发现算法
标签传播算法
节点信息列表
节点中心性
社区相似性
-
Keywords
community detection algorithm
Label propagation algorithm (lpa)
node information list
node centrality
community similarity
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于LeaderRank的标签传播社区发现算法
被引量:15
- 9
-
-
作者
石梦雨
周勇
邢艳
-
机构
中国矿业大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2015年第2期448-451,455,共5页
-
基金
国家863计划项目(2012AA0622022
2012AA011004)
+2 种基金
国家自然科学基金资助项目(50674086)
教育部高等学校博士学科点专项科研基金项目(20110095110010)
江苏省研究生科研创新计划项目(CXZZ12_0934)
-
文摘
针对标签传播算法(LPA)结果的不稳定性,提出一种改进的基于标签传播的社区发现算法。该算法引入LeaderRank的概念来量化网络节点的影响力和重要性;然后按照节点重要程度从高到低选择若干核心节点;最后按照顺序分别以每个核心节点为中心向外逐层进行标签更新,直到不再出现标签变化为止,从而解决了原始算法对节点随机排序造成的结果不稳定性。以LFR基准网络和真实网络为实验数据,与几个现有标签传播算法进行比较,社区划分结果的标准化互信息(NMI)和模块度(Modularity)均高于对比算法。理论分析和实验结果表明所提算法不仅有效地增强了社区发现结果的稳定性,同时提高了准确率。
-
关键词
标签传播算法
不稳定性
社区发现
LeaderRank
节点重要性
-
Keywords
Label propagation algorithm (lpa)
instability
community detection
LeaderRank
importance of nodes
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于标签权重系数的社团发现算法
- 10
-
-
作者
滕彬
李玲娟
-
机构
南京邮电大学计算机学院
-
出处
《南京邮电大学学报(自然科学版)》
北大核心
2016年第6期74-80,共7页
-
文摘
为了提高社团发现的准确性和稳定性,文中提出了一种基于标签权重系数(label weight coefficient,LWC)的社团发现算法。该算法参考了标签传播算法(label propagation algorithm,LPA)的基本思想,并针对LPA中随机策略导致的结果不稳定问题做了改进。LWC算法按照节点度由高到低的顺序,依据节点之间的局部相似度和邻居节点度来计算标签权重系数,再依据标签权重系数进行节点标签的更新。当节点具有多个满足条件的候选标签时,依据标签连接度、相同标签的节点度之和选出标签,避免标签的随机选择。在人工合成网络数据集和真实网络数据集上的实验结果都表明,LWC算法不仅提高了社团发现结果的质量和准确率,而且具有较高的稳定性。
-
关键词
社团发现
标签传播算法
标签权重系数
-
Keywords
community detection
label propagation algorithm (lpa)
label weight coefficient ( LWC )
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于标签传播的数据分块算法
- 11
-
-
作者
冉德彤
游宏梁
-
机构
中国国防科技信息中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第9期51-55,61,共6页
-
文摘
数据分块有助于降低大规模数据中实体分辨的计算复杂度,但现有算法存在效能和效率难以平衡的问题。为此,在标签传播的基础上设计数据分块算法,以实现两者的平衡。根据记录间相同词项的数量估计记录相似度,通过标签传播算法发现潜在相似重复记录,降低时间复杂度。在通用测试数据中的实验结果表明,该算法能有效提高F-Measure值,减少运行时间,实现大规模数据中的数据分块。
-
关键词
数据质量
数据清洗
实体分辨
相似重复记录
数据分块
标签传播算法
-
Keywords
data quality
data cleaning
Entity Resolution(ER)
approximately duplicated record
data blocking
Label propagation algorithm(lpa)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-