期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于字形特征的中文医学命名实体识别方法 被引量:2
1
作者 孟伟伦 郭景峰 +3 位作者 邢珂萱 魏宁 王巧梭 刘滨 《电子学报》 EI CAS CSCD 北大核心 2024年第6期1945-1954,共10页
作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特... 作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特征工程来提升模型在医疗领域上的性能.这些模型大部分源自在通用数据集上表现较好的模型,没有考虑中文医学数据集的语言特性.通过在多个医学数据集上进行统计分析,发现部分类型的医学实体在字形上具有共性,如在汉字中大部分表示疾病含义的字符都包含“疒”,大部分表示身体器官的字符都包含“月”.针对这些问题,本文提出了一种基于字形特征的中文医学命名实体识别方法,该方法通过在文本表示向量上融合字形向量以及进一步利用数据集中负样本来提升模型的准确度和泛化能力.在多个公共的中文医学数据集上的实验结果表明,该方法获得了比其他模型更好的效果,并且通过消融实验证明了融合字形特征和从负样本中学习对于该任务是有效的. 展开更多
关键词 字形 负样本 两阶段 医学信息 命名实体识别 深度学习
在线阅读 下载PDF
基于多核心节点的增量式动态社区发现算法 被引量:1
2
作者 陈晶 刘志君 +2 位作者 杨新宇 刘洺辛 刘苗苗 《通信学报》 EI CSCD 北大核心 2024年第3期66-80,共15页
针对动态社区发现算法通常基于社区结构平稳变化的假设,而难以应对演化过程中可能出现的大量社区消亡或涌现等突发事件的问题,提出了一种基于多核心节点的增量式动态社区发现算法MCNIDCD。首先,将核心节点分为扩散型和内聚型,制定4种增... 针对动态社区发现算法通常基于社区结构平稳变化的假设,而难以应对演化过程中可能出现的大量社区消亡或涌现等突发事件的问题,提出了一种基于多核心节点的增量式动态社区发现算法MCNIDCD。首先,将核心节点分为扩散型和内聚型,制定4种增量更新策略。其次,通过局部更新调整节点社区归属,并采用增量模块度方法优化社区结构。最后,实现社区合并。在人工和真实网络上对该算法的性能进行了评估,实验结果表明,在对比目前相关动态社区检测算法时,在人工网络仿真环境中,MCNIDCD算法表现出与社区演化规律的高度契合性;在真实网络实验中,MCNIDCD算法在模块度性能指标上平均提升了28%,并且在稳定性方面具有良好的优势,其优势对于研究动态社区演化过程具有重要的意义。 展开更多
关键词 核心节点 增量式 网络演化 社区发现
在线阅读 下载PDF
引入词汇信息的中文医学命名识别模型研究
3
作者 陈晶 孙亚轩 邢珂萱 《高技术通讯》 CAS 北大核心 2024年第10期1058-1069,共12页
医学领域文本存在大量的专业词汇,相比于通用领域更容易出现分词错误和未登录词的问题,其结果会导致上下文语义缺失,并影响命名实体识别(NER)的准确率。为了解决上述问题,本文提出了引入词汇信息的基于门控循环单元的中文医学命名实体... 医学领域文本存在大量的专业词汇,相比于通用领域更容易出现分词错误和未登录词的问题,其结果会导致上下文语义缺失,并影响命名实体识别(NER)的准确率。为了解决上述问题,本文提出了引入词汇信息的基于门控循环单元的中文医学命名实体识别模型WI-NER。首先,基于中文医学数据集的特点,描述了中文医学领域的命名实体识别的任务定义、实体位置和实体类别标签,并将模型在嵌入层对匹配专业词的字符进行特征嵌入与向量融合;其次,在上下文编码层添加词汇门控单元,利用循环神经网络的记忆与遗忘机制,自动提取实体识别所需的特征,并通过引入词汇信息和先验知识,实现了中文医学命名实体识别效果的提升;最后,对本模型在3个数据集上进行了实验验证,结果表明,本文提出的中文医学命名实体识别模型在准确率方面优于基线模型,达到了预期的医学领域特性。 展开更多
关键词 中文医学命名识别 先验知识 嵌入层 门控单元 词汇信息
在线阅读 下载PDF
加权网络中基于多路径节点相似性的链接预测 被引量:9
4
作者 郭景峰 刘苗苗 罗旭 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第7期1347-1352,共6页
鉴于现有大多数链接预测算法仅考虑了图的局部或全局特性,在预测准确率和计算复杂度上难以均衡,且有关加权网络的链接预测研究相对较少,提出新的加权社会网络链接预测算法(STNMP).引入节点对边权强度的概念,用于度量邻居节点间的局部相... 鉴于现有大多数链接预测算法仅考虑了图的局部或全局特性,在预测准确率和计算复杂度上难以均衡,且有关加权网络的链接预测研究相对较少,提出新的加权社会网络链接预测算法(STNMP).引入节点对边权强度的概念,用于度量邻居节点间的局部相似度.提出路径相似性贡献的概念,定义多路径传输节点相似性,用于描述步长为2和3的所有路径及这些路径上的中间节点对于所连接的两个节点的相似性总贡献.在多个真实网络中对算法的有效性进行验证,以AUC作为评价指标,与经典相似性算法CN、Jaccard、AA等进行预测准确率的对比分析.结果显示,针对小规模社会网络,STNMP算法的预测准确率高于现有算法. 展开更多
关键词 链接预测 加权社会网络 边权强度 路径相似性贡献 多路径传输节点
在线阅读 下载PDF
物联网语义关联和决策方法的研究 被引量:8
5
作者 冯建周 宋沙沙 孔令富 《自动化学报》 EI CSCD 北大核心 2016年第11期1691-1701,共11页
物联网系统包含大量的感知设备,产生大量孤立和异构的感知数据,形成数据孤岛.如何将不同感知设备产生的数据进行有效的语义关联、构建跨域的数据关联模型、屏蔽数据异构性、实现综合智能决策是物联网研究的关键问题.本文以物联网系统为... 物联网系统包含大量的感知设备,产生大量孤立和异构的感知数据,形成数据孤岛.如何将不同感知设备产生的数据进行有效的语义关联、构建跨域的数据关联模型、屏蔽数据异构性、实现综合智能决策是物联网研究的关键问题.本文以物联网系统为研究对象,从语义入手,构建以环境–资源–行为为核心的物联网本体模型;基于关联数据方法构建以行为关联模型和资源关联模型为核心的物联网语义关联网络;提出一种基于事件的推理算法实现语义推理,从而更好地实现对物联网系统的智能决策;最后,通过两个智能家居系统的实例验证了本文方法的可行性,通过构建不同方法的查询实例验证了本文方法的优越性. 展开更多
关键词 物联网 数据孤岛 领域本体 语义关联 数据推理
在线阅读 下载PDF
社交网络中基于模块度最大化的标签传播算法的研究 被引量:10
6
作者 陈晶 万云 《通信学报》 EI CSCD 北大核心 2017年第2期25-33,共9页
提出了一种利用模块度最大化与社区结构属性相结合的社区发现方法。首先,针对基于模块度最大化的标签传播算法中存在的时间复杂度高的问题,引入传播距离参数,依据"先传播,后合并"的原则,降低了社区合并导致整个网络需要更新... 提出了一种利用模块度最大化与社区结构属性相结合的社区发现方法。首先,针对基于模块度最大化的标签传播算法中存在的时间复杂度高的问题,引入传播距离参数,依据"先传播,后合并"的原则,降低了社区合并导致整个网络需要更新带来的较高时间复杂度;其次,结合社区结构的概念提出了基于模块度最大化的标签传播算法(CDMM-LPA);最后,基于网络数据集,验证并分析了CDMM-LPA算法的可行性。实验结果表明,CDMM-LPA算法在降低了时间复杂度的同时,获得了较高的模块度值和更加稳定的强社区结构。 展开更多
关键词 模块度 传播距离 社区结构 标签传播 社区发现
在线阅读 下载PDF
集对社会网络α关系社区及动态挖掘算法 被引量:13
7
作者 张春英 郭景峰 《计算机学报》 EI CSCD 北大核心 2013年第8期1682-1692,共11页
针对Web社会网络中存在确定-不确定关系,提出一种给定阈值的α关系社区概念,该社区是用集对分析方法构建的集对社会网络,并且其中任意结点之间关系强度大于给定阈值α;根据Web社会网络的动态性,分别设计静态和动态α关系社区的挖掘算法... 针对Web社会网络中存在确定-不确定关系,提出一种给定阈值的α关系社区概念,该社区是用集对分析方法构建的集对社会网络,并且其中任意结点之间关系强度大于给定阈值α;根据Web社会网络的动态性,分别设计静态和动态α关系社区的挖掘算法;通过收集DBLP数据集,对其进行抽取、分类、社区挖掘、关系分析等实验,验证了算法的高效性,证明了α关系社区的挖掘更能体现社区存在的动态性,可进一步对其潜在关系社区进行挖掘. 展开更多
关键词 α关系社区 集对社会网络 动态挖掘
在线阅读 下载PDF
基于信息偏好的影响最大化算法研究 被引量:7
8
作者 郭景峰 吕加国 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期533-541,共9页
实证研究表明,社会个体对于不同主题的信息有着不同的偏好,这对于社会网络中的信息传播过程起着非常重要的作用.影响最大化是社会网络信息传播领域中关于影响结点集挖掘的热点课题.它会从社会网络中寻找最具影响力的结点子集,以这些结... 实证研究表明,社会个体对于不同主题的信息有着不同的偏好,这对于社会网络中的信息传播过程起着非常重要的作用.影响最大化是社会网络信息传播领域中关于影响结点集挖掘的热点课题.它会从社会网络中寻找最具影响力的结点子集,以这些结点为目标进行影响传播时会获得最大的影响范围.以前关于影响最大化算法研究的大部分工作没有考虑社会个体的信息偏好,这大大降低了结果的准确性.为了提高影响最大化算法的效率和种子集的影响范围,提出一种基于信息偏好的2阶段启发式影响结点挖掘策略L_GAUP:第1阶段,基于网络中各结点对于信息主题的偏好程度,得到易感染结点网络;第2阶段,在易感染网络中,基于贪心策略进行影响结点的挖掘.实验中,在数据集douban上实现了L_GAUP,GAUP和CELF算法.实验结果表明,与基准算法GAUP相比,L_GAUP不仅在影响范围指标ISST和IS上有着更好的表现,在效率上也有大幅度的提高. 展开更多
关键词 信息主题 用户偏好 信息传播 影响最大化 社会网络
在线阅读 下载PDF
一种节点相似度和参与度符号网络社区发现算法 被引量:3
9
作者 胡心专 郭景峰 +1 位作者 贺释千 陈晓 《小型微型计算机系统》 CSCD 北大核心 2017年第10期2275-2280,共6页
基于节点相似度的层次聚类算法被广泛应用于无符号网络的社区发现研究中,但不适用于符号网络,而典型符号网络社区发现算法存在从不同节点出发社区划分准确率低的问题.本文从节点相似度出发提出一种适用于符号网络的算法CDSNNSP(Communit... 基于节点相似度的层次聚类算法被广泛应用于无符号网络的社区发现研究中,但不适用于符号网络,而典型符号网络社区发现算法存在从不同节点出发社区划分准确率低的问题.本文从节点相似度出发提出一种适用于符号网络的算法CDSNNSP(Community Detection in Signed Netw orks Based on Node Similarity and Node Participation Degree).算法首先提出适合符号网络的节点影响力和聚集系数,并根据其选取初始节点,依据节点相似度计算公式从邻居节点中选取与初始节点相似度最大的节点形成初始社区,通过邻居节点的参与度和相对贡献增量确定节点划分到社区的顺序以及是否划分到社区.最后,通过模拟和真实社会网络数据集的实验证明了CD-SNNSP算法的正确性和有效性. 展开更多
关键词 社区发现 符号网络 节点相似度 节点参与度
在线阅读 下载PDF
标签零模型及子图分布算法应用研究 被引量:1
10
作者 邹晓红 郭景峰 +2 位作者 贺释千 陈晶 刘院英 《小型微型计算机系统》 CSCD 北大核心 2018年第5期1038-1045,共8页
目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Locat... 目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Location Index)和子图分布ESGS(Estimate Sub Graph on Spark)算法.首先,标签零模型能同时考虑图的拓扑结构信息和图中顶点和边标签信息,增加图分类的特征,并证明和验证了标签零模型用于图分类的有效性.其次,在标签零模型基础上提出两个算法,一个是用于构建图索引的BGLI算法,另一个是在BGLI算法基础上提出的计算子图分布ESGS算法,降低时间复杂度,提高计算速度.最后,通过实验验证,基于标签零模型的ESGS算法提取的子图作为分类特征可以提高图分类的准确性. 展开更多
关键词 数据挖掘 图挖掘 图分类 零模型 子图分布
在线阅读 下载PDF
基于符号网络的两阶段融合社区发现算法 被引量:1
11
作者 胡心专 郭景峰 +1 位作者 赵月 梁浩 《小型微型计算机系统》 CSCD 北大核心 2016年第5期915-920,共6页
目前针对符号网络社区发现研究越来越受到重视,CRA(Clustering Re-clustering Algorithm)算法代表比较流行的一种思路,即将社区划分过程分为两个阶段:第一步先删除负边,对剩余网络用传统社区发现算法进行社区划分;第二步再用符号网络特... 目前针对符号网络社区发现研究越来越受到重视,CRA(Clustering Re-clustering Algorithm)算法代表比较流行的一种思路,即将社区划分过程分为两个阶段:第一步先删除负边,对剩余网络用传统社区发现算法进行社区划分;第二步再用符号网络特定社区质量评价函数调整分区.此类算法由于没有充分考虑负边信息而导致了划分不正确的问题.本文通过引入网络正密度,提出一种两阶段融合算法TFCRA(Two-stage Fusion Clustering Re-clustering Algorithm),在社区划分过程中,不再删除负边,通过网络正密度和社区正密度的比较调整带负边的顶点的归属.实验证明,TFCRA能解决CRA算法存在的对某些网络无法划分和从不同顶点出发可能导致划分出错的问题. 展开更多
关键词 社区发现 符号社会网络 社区正密度 聚类
在线阅读 下载PDF
主题关注模型下的影响最大化算法研究 被引量:2
12
作者 郭景峰 范超智 陈晓 《小型微型计算机系统》 CSCD 北大核心 2017年第9期2113-2118,共6页
目前,社会网络大多以社交关系为基础进行信息传播,影响最大化是信息传播领域挖掘有影响力的顶点集的热点.随着大型社交网络的兴起,将主题偏好作为网络中实体的属性进行研究的影响最大化研究越来越多,较为缺少主题关注模型(融合社交关系... 目前,社会网络大多以社交关系为基础进行信息传播,影响最大化是信息传播领域挖掘有影响力的顶点集的热点.随着大型社交网络的兴起,将主题偏好作为网络中实体的属性进行研究的影响最大化研究越来越多,较为缺少主题关注模型(融合社交关系和主题关注关系的新型社交网络模型)上的影响最大化研究.针对这种情况,本文在此模型基础上,首先,在集对联系度基础上,结合随机游走计算各步内顶点主题偏好度,得到候选种子集;其次,在候选种子集上,基于贪心策略挖掘有影响力顶点;最后,在豆瓣数据集上,实现算法TA_CELF,L_GAUP和CELF,从ISST,ISRT,ISRNT三个指标评价实验结果,实验结果表明,基于主题关注模型下进行的算法TA_CELF影响范围有较好的表现. 展开更多
关键词 主题偏好 主题关注模型 信息传播 影响最大化
在线阅读 下载PDF
一种利用非对称相似度强化信任用户关系的推荐算法 被引量:1
13
作者 郭景峰 张济龙 +1 位作者 章德斌 刘院英 《小型微型计算机系统》 CSCD 北大核心 2015年第9期1943-1947,共5页
为提高推荐算法的准确率,针对Social MF中用户将其信任用户同等对待的问题,提出一种在评分数据稀疏情况用于计算信任用户相似度的方法—非对称相似度方法(AC-Sim),通过AC-Sim来判别存在信任关系用户间是否有共同偏好,并将此偏好信息融... 为提高推荐算法的准确率,针对Social MF中用户将其信任用户同等对待的问题,提出一种在评分数据稀疏情况用于计算信任用户相似度的方法—非对称相似度方法(AC-Sim),通过AC-Sim来判别存在信任关系用户间是否有共同偏好,并将此偏好信息融合到已有的用户关系网中,达到强化信任网络的目的;其次将强化后的信任网络应用到PMF算法中,评分矩阵在分解过程中,用户特征向量受信任用户影响的同时,也受到与其有共同偏好用户的影响.实验结果表明,与目前较为流行的算法相比,新算法在RMSE和MAE上均取得更好的推荐效果. 展开更多
关键词 推荐系统 协同过滤 概率矩阵分解 非对称相似度 信任网络
在线阅读 下载PDF
基于联系度的主题关注网络社区发现方法研究 被引量:2
14
作者 陈晓 郭景峰 范超智 《计算机工程与应用》 CSCD 北大核心 2017年第17期85-93,共9页
目前,以兴趣或主题分享等为目的的兴趣型社交网络则引领着社交网络改革的浪潮。融合社交关系和兴趣爱好关系构建一个新型社交网络模型——主题关注模型。在此模型基础上,采用集对联系度刻画顶点间相似性度量指标,该度量方法可以更好地... 目前,以兴趣或主题分享等为目的的兴趣型社交网络则引领着社交网络改革的浪潮。融合社交关系和兴趣爱好关系构建一个新型社交网络模型——主题关注模型。在此模型基础上,采用集对联系度刻画顶点间相似性度量指标,该度量方法可以更好地刻画网络结构特征,提高传统局部相似性度量指标对某些顶点间相似性值的计算精度,降低全局相似性度量指标的计算复杂度。综合考虑主题影响和社交关系,将集对联系度与凝聚型聚类算法相结合,提出一种新的主题社区发现方法。在Karate网络和豆瓣数据集上进行主题社区发现,实验结果表明,考虑主题影响的划分具有更好的社区结构。 展开更多
关键词 主题关注网络 集对 联系度 社区发现
在线阅读 下载PDF
基于时序关系的社交网络影响最大化算法研究 被引量:7
15
作者 陈晶 祁子怡 《通信学报》 EI CSCD 北大核心 2020年第10期211-221,共11页
针对动态社交网络中节点存在的时序关系,提出了基于时序关系的社交网络影响最大化问题,即在时序社交网络上寻找k个节点使信息传播最大化。首先,通过改进度估计算法来计算节点间的传播概率;其次,针对静态社交网络的WCM传播模型无法适用... 针对动态社交网络中节点存在的时序关系,提出了基于时序关系的社交网络影响最大化问题,即在时序社交网络上寻找k个节点使信息传播最大化。首先,通过改进度估计算法来计算节点间的传播概率;其次,针对静态社交网络的WCM传播模型无法适用于时序社交网络的问题,提出了IWCM传播模型,并以此为基础提出了TIM算法,该算法分别利用时序启发阶段和时序贪心阶段,选择影响力估计值inf(u)最大的备选节点和影响力最大的种子节点;最后,通过实验验证了TIM算法的高效性和准确度。此外,所提算法结合了启发式算法和贪心算法的优点,将边际收益的计算范围由网络中所有节点缩减到了备选节点,在保证精度的前提下大大缩短了程序的运行时间。 展开更多
关键词 时序社交网络 影响最大化 信息传播模型 贪心算法 启发式算法
在线阅读 下载PDF
基于覆盖阈值的影响最大化算法的研究 被引量:2
16
作者 陈晶 刘贤 《高技术通讯》 EI CAS 北大核心 2019年第5期438-448,共11页
针对影响最大化算法存在选取的种子节点影响力重叠、时间复杂度高等问题,提出了基于覆盖阈值的度最大启发式算法(CTMD)。该算法主要思想是利用改进的k-shell算法计算节点影响力以选取初始种子节点;计算两度以内节点的激活概率,基于覆盖... 针对影响最大化算法存在选取的种子节点影响力重叠、时间复杂度高等问题,提出了基于覆盖阈值的度最大启发式算法(CTMD)。该算法主要思想是利用改进的k-shell算法计算节点影响力以选取初始种子节点;计算两度以内节点的激活概率,基于覆盖阈值θ,把易激活的节点标记为覆盖状态,更新节点的影响力值,直到选取到指定数量的种子节点;通过实验对核覆盖算法(CCA)、度最大(Max Degree)、影响力排名影响力估计(IRIE)和CTMD算法进行了比较与分析。实验结果表明,在独立级联(IC)模型和加权级联(WC)模型中,CTMD算法的影响范围具有明显的优势。此外,通过对运行时间进行测试可知,随着网络规模的逐步增大,CTMD算法具有较低的时间复杂度。 展开更多
关键词 社交网络 节点影响力 影响最大化 覆盖阈值 K-SHELL
在线阅读 下载PDF
不确定图中紧密子图高效挖掘算法
17
作者 邹晓红 魏真真 +2 位作者 郭景峰 刘院英 王秀芹 《小型微型计算机系统》 CSCD 北大核心 2015年第11期2479-2483,共5页
研究不确定图数据的挖掘,主要解决不确定图数据上紧密子图挖掘问题.基于加权不确定图数据模型,使用子图期望密度和顶点期望度数来度量子图的紧密程度.给出贪心迭代中期望峰值的特性,利用期望峰值的特性来改进算法执行过程,其结果满足2... 研究不确定图数据的挖掘,主要解决不确定图数据上紧密子图挖掘问题.基于加权不确定图数据模型,使用子图期望密度和顶点期望度数来度量子图的紧密程度.给出贪心迭代中期望峰值的特性,利用期望峰值的特性来改进算法执行过程,其结果满足2近似比的同时使得算法具有较高的执行效率.并且严格证明了算法的正确性.带顶点限制的紧密子图挖掘问题是NP难的,改进后的带顶点限制的紧密子图挖掘算法较其它方法更高效快速. 展开更多
关键词 不确定图 数据挖掘 期望密度 紧密子图
在线阅读 下载PDF
一种改进Shapley值的符号网络聚类研究
18
作者 陈晓 郭景峰 刘凤春 《小型微型计算机系统》 CSCD 北大核心 2016年第11期2448-2453,共6页
符号网络中宏观网络结构(拓扑结构属性和符号属性)和微观博弈对联盟(社区)的形成具有相互影响,是符号网络博弈模型的新特征.基于以上思想,提出一种新的符号网络层次聚类算法HCSVSN(Hierarchical Clustering Based on the Shapley Value ... 符号网络中宏观网络结构(拓扑结构属性和符号属性)和微观博弈对联盟(社区)的形成具有相互影响,是符号网络博弈模型的新特征.基于以上思想,提出一种新的符号网络层次聚类算法HCSVSN(Hierarchical Clustering Based on the Shapley Value in Signed Netw ork).首先,基于结点的符号属性和结点度,提出改进Shapely值的计算方法,可以避免忽略外部环境(网络结构)对Shapley值的影响,并可以降低Shapley值计算的复杂性;其次,基于网络密度对联盟形成的影响,提出联盟收益均值的计算方法,并给出符号网络联盟博弈模型;然后,基于联盟平均收益最大化实现符号网络的社区发现;最后,通过实验验证算法的准确性和有效性. 展开更多
关键词 符号网络 联盟博弈 SHAPLEY值 层次聚类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部