期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于蚁群算法的骨干网络发现 被引量:3
1
作者 吕芳 柏军 +1 位作者 黄俊恒 王佰玲 《通信学报》 EI CSCD 北大核心 2020年第11期74-85,共12页
针对交互网络中实体的非法、异常活动日趋隐蔽,复杂的交互关系又加剧了网络分析难度的问题,提出一种发现骨干网络的蚁群模型。该模型基于路径寻优理论模拟实体间交互关系,量化信息交互路径的显著性,实现网络规模约减。首先,利用网络中... 针对交互网络中实体的非法、异常活动日趋隐蔽,复杂的交互关系又加剧了网络分析难度的问题,提出一种发现骨干网络的蚁群模型。该模型基于路径寻优理论模拟实体间交互关系,量化信息交互路径的显著性,实现网络规模约减。首先,利用网络中心性理论,提出了交互网络中蚂蚁初始位置选择策略;然后,设计了拟合信息交互行为的蚁群模型路径转移机制;最后,利用自适应的信息素动态更新机制引导信息流通路径优化。在真实金融交互网络上的实验结果表明,所提模型在最优解质量和性能上均优于传统蚁群算法,且相比于贪心算法具有更好的覆盖率和准确率。 展开更多
关键词 交互网络 蚁群算法 骨干网络 路径优化 动态信息素更新
在线阅读 下载PDF
面向非平衡数据集的金融欺诈账户检测研究 被引量:2
2
作者 吕芳 汤丰赫 +1 位作者 黄俊恒 王佰玲 《计算机工程》 CAS CSCD 北大核心 2021年第6期312-320,共9页
针对非平衡金融数据集,提出一种银行欺诈账户检测框架iForest-SMOTE。基于账户的动态交易特点,从统计、时序、监督信息维度抽取账户交易行为特征。针对过采样技术ADASYN在金融账户数据集中存在的跨区域样本合成问题,提出一种基于iFores... 针对非平衡金融数据集,提出一种银行欺诈账户检测框架iForest-SMOTE。基于账户的动态交易特点,从统计、时序、监督信息维度抽取账户交易行为特征。针对过采样技术ADASYN在金融账户数据集中存在的跨区域样本合成问题,提出一种基于iForest算法的数据集均衡预处理策略,通过iForest算法对数据进行混合采样,在去除多数类噪声数据的同时降低分类器对少数类的学习难度。在此基础上,设计随机森林分类器实现金融欺诈账户检测。在真实金融账户交易数据集上进行实验,结果表明,与ADASYN、SMOTE等采样技术相比,iForest-SMOTE在召回率和准确率方面具有明显优势,F-value值至少能够提升2.13个百分点。 展开更多
关键词 隔离森林 非平衡分类 欺诈账户检测 随机森林 特征挖掘
在线阅读 下载PDF
SemFA:基于语义特征与关联注意力的大规模多标签文本分类模型 被引量:4
3
作者 王振东 董开坤 +1 位作者 黄俊恒 王佰玲 《计算机科学》 CSCD 北大核心 2023年第12期270-278,共9页
大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务。目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功。然而,现有方法都没能充分利用Transformer模型的优势... 大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务。目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功。然而,现有方法都没能充分利用Transformer模型的优势,忽略了文本不同粒度下细微的局部语义信息,同时标签与文本之间的潜在关联尚未得到稳健的建立与利用。对此,提出了一种基于语义特征与关联注意力的大规模多标签文本分类模型SemFA(An Extreme Multi-Label Text Classification Model Based on Semantic Features and Association-Attention)。在SemFA中,首先拼接多层编码器顶层输出作为全局特征。其次,结合卷积神经网络从多层编码器浅层向量中获取局部特征。综合丰富的全局信息和不同粒度下细微的局部信息获得更丰富、更准确的语义特征。最后,通过关联注意力机制建立标签特征与文本特征之间的潜在关联,引入关联损失作为潜在关联不断优化模型。在Eurlex-4K和Wiki10-31K两个公开数据集上的实验结果表明,SemFA优于大多数现有的XMTC模型,能有效地融合语义特征与关联注意力,提升整体的分类性能。 展开更多
关键词 自然语言处理 大规模多标签文本分类 语义特征 预训练模型 注意力机制
在线阅读 下载PDF
基于多粒度对比学习的聊天对话摘要模型 被引量:1
4
作者 康梦瑶 刘扬 +2 位作者 黄俊恒 王佰玲 刘树龙 《计算机科学》 CSCD 北大核心 2023年第11期192-200,共9页
社交网络的发展在给人们带来便捷的同时也产生了海量的聊天数据,如何从聊天对话中筛选出关键信息成为一大难题。聊天摘要是解决此类问题的有效工具,既不必重复浏览冗长的聊天记录,又可以快速获取重要内容。目前,预训练模型被广泛应用于... 社交网络的发展在给人们带来便捷的同时也产生了海量的聊天数据,如何从聊天对话中筛选出关键信息成为一大难题。聊天摘要是解决此类问题的有效工具,既不必重复浏览冗长的聊天记录,又可以快速获取重要内容。目前,预训练模型被广泛应用于各种类型的文本,包括非结构化、半结构化和结构化文本。然而,针对聊天对话文本的应用,常见的预训练模型难以捕捉到其独特的结构特征,仍需进一步探索与改进。对此,提出了一种基于对比学习的聊天摘要算法MGCSum。该算法无需人工标注数据集,便于学习和迁移。首先使用文档频数、词项频数和信息熵构造了针对聊天文本的停用词列表,去除聊天中的干扰信息;其次,从词语和主题两个粒度进行自监督对比学习,识别对话中的结构信息,挖掘聊天中的关键词和不同主题信息。在聊天摘要公开数据集SAMSum和金融欺诈对话数据集FINSum上进行实验,结果表明,与当前主流的聊天摘要方法相比,该算法在摘要的连贯性、信息量和ROUGE评价指标上均有显著提升。 展开更多
关键词 聊天摘要 对比学习 预训练模型 关键词检测 主题分割
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部