期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
轻梯度提升机算法的发展与应用 被引量:2
1
作者 魏佳妹 袁书娟 +2 位作者 孔闪闪 杨爱民 赵晨颖 《计算机工程与应用》 北大核心 2025年第5期32-42,共11页
轻梯度提升机算法(light gradient boosting machine,LightGBM)是机器学习领域中比较强大的算法之一,LightGBM采用高效的树学习算法,以更快地训练模型,其独特的直方图分桶方法和基于梯度的单边叶子生长技术降低了内存的使用和计算成本。... 轻梯度提升机算法(light gradient boosting machine,LightGBM)是机器学习领域中比较强大的算法之一,LightGBM采用高效的树学习算法,以更快地训练模型,其独特的直方图分桶方法和基于梯度的单边叶子生长技术降低了内存的使用和计算成本。LightGBM被广泛应用于医疗、自然语言处理、金融、工业制造等领域。然而,LightGBM在高维数据处理、类别特征处理、模型解释性等方面仍面临许多挑战。目前,解决这些问题的方法主要集中在特征工程、可视化、模型混合等方面,并取得了很好的效果。介绍了决策树家族的相关算法原理和变体研究;对LightGBM的原理、优缺点进行梳理,归纳出算法所面临的挑战,并指出LightGBM未来的研究热点和难点;对LightGBM的发展进行了总结和展望。 展开更多
关键词 轻梯度提升机算法 决策树 集成学习 机器学习
在线阅读 下载PDF
融合语义的个性化差分隐私轨迹发布方案
2
作者 张牙 刘凤春 +2 位作者 杨光辉 张春英 任静 《信息安全研究》 北大核心 2025年第7期670-679,共10页
轨迹数据库中包含大量用户的信息,直接将其发布可能会导致个人敏感信息的泄露.用户的位置语义信息中包含大量日常活动和访问偏好信息,现有个性化差分隐私轨迹发布方案对于位置点隐私级别的判定未考虑位置点间的语义信息,仍然存在隐私性... 轨迹数据库中包含大量用户的信息,直接将其发布可能会导致个人敏感信息的泄露.用户的位置语义信息中包含大量日常活动和访问偏好信息,现有个性化差分隐私轨迹发布方案对于位置点隐私级别的判定未考虑位置点间的语义信息,仍然存在隐私性和数据可用性之间的不平衡问题.为解决上述问题,提出一种融合语义的个性化差分隐私轨迹发布方案(PRTDP),根据用户自身轨迹的移动特性进行动态隐私级别判定.首先,提出敏感位置点判定算法.利用DBSCAN聚类算法得到用户敏感位置点.接着,提出一种个性化隐私级别划分算法.基于位置点间的语义信息构建敏感位置点关系有向图模型,设计改进的PageRank算法确定位置点的隐私级别,将相应隐私级别的拉普拉斯噪声加入轨迹数据中并发布.PRTDP方案能够有效地保护用户的敏感信息,并提高轨迹数据的可用性,实验证明该方案在隐私保护程度、可用性和时间效率3个方面优于现有方案NFRP算法和FPT算法. 展开更多
关键词 个性化差分隐私 轨迹隐私保护 PAGERANK算法 轨迹数据发布 隐私预算
在线阅读 下载PDF
融合语义信息的最优位置选择算法
3
作者 李梦涵 闫彦彤 李丽红 《郑州大学学报(理学版)》 北大核心 2025年第4期88-94,共7页
目前,位置服务的广泛应用带来了个人信息安全的挑战。为应对这一挑战,研究人员致力于探究多种位置隐私保护策略。其中,融合语义信息的位置隐私保护算法成为研究的热点之一。利用语义信息提出了一种新的选择位置中心的思想,将该思想与语... 目前,位置服务的广泛应用带来了个人信息安全的挑战。为应对这一挑战,研究人员致力于探究多种位置隐私保护策略。其中,融合语义信息的位置隐私保护算法成为研究的热点之一。利用语义信息提出了一种新的选择位置中心的思想,将该思想与语义距离融合,选择最佳匿名候选集合,从而保证位置集合的语义多样性和物理多样性。实验结果表明,相较于DLS算法、Enhanced-DLS算法和MMDS算法,所提算法在语义和物理位置方面能够保证多样性,有效降低了位置数据的准确性,保护了用户的隐私。 展开更多
关键词 位置服务 语义信息 位置中心 匿名候选集合
在线阅读 下载PDF
MSHC:一种多阶段超图聚类算法
4
作者 张春英 王静 +2 位作者 刘璐 兰思武 张庆达 《深圳大学学报(理工版)》 北大核心 2025年第1期68-76,共9页
超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hyper... 超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hypergraph clustering,MSHC)算法,该算法将超图聚类过程分为超图约简、超图初始聚类以及优化迁移3个阶段.在超图约简阶段,提出一种不改变超图结构的快速约简方法,降低了后续算法的复杂度;提出基于集对分析理论的超图节点间相似性度量方法,并采用层次聚类方法对超图进行初始聚类,采用4种不同的类簇合并计算方法,增加聚类方案的多样性;将遗传算法应用于优化超图聚类方案的研究中,以此获得最优超图聚类方案.在3个不同规模的数据集上与4个经典的超图聚类方法进行对比实验,结果表明,MSHC算法在Songs_genres数据集和Papers_keywords数据集上超图模块度指数分别提高了0.0797和0.0777,在Movies_genres数据集上仅降低0.0060. 展开更多
关键词 数据处理 超图聚类 遗传算法 集对分析理论 超图约简 多阶段聚类 超图模块度
在线阅读 下载PDF
基于特征融合的双分支恶意代码同源性分析模型
5
作者 刘凤春 张志枫 +2 位作者 薛涛 杨光辉 魏群 《信息安全研究》 北大核心 2025年第7期594-602,共9页
在恶意代码同源性分析中,由于加密、混淆和加壳等技术产生大量恶意代码变种,导致深度学习模型对恶意代码特征提取能力不足的问题.为此,提出一种多分支卷积和Transformer构建的双分支恶意代码同源性分析模型MCAT-Net(multi-branch convol... 在恶意代码同源性分析中,由于加密、混淆和加壳等技术产生大量恶意代码变种,导致深度学习模型对恶意代码特征提取能力不足的问题.为此,提出一种多分支卷积和Transformer构建的双分支恶意代码同源性分析模型MCAT-Net(multi-branch convolution and Transformer-Net).首先,构建MCAT-Net双分支网络,一个分支是多分支卷积MBC(multi-branch convolution)模块,以MBC模块构建CNN分支,同时引入混合注意力机制,使网络在兼顾局部特征的同时更能关注核心特征;另一个分支是以Vi T为主干的Transformer模块,提取恶意代码图像的全局特征信息并提出下采样模块,在精细地保留全局特征的同时使Transformer与CNN的特征图在空间尺度对齐;其次,以级联的策略融合CNN分支的局部特征和Transformer分支的全局特征,解决网络只关注单一特征问题;最后,使用Softmax分类器对恶意代码家族进行同源性分析.实验结果表明,基于特征融合的双分支模型的分类准确率达到99.24%,相比单支CNN和单支Transformer模型,准确率分别提高0.11%和0.65%. 展开更多
关键词 双分支 特征融合 多分支卷积 注意力机制 下采样
在线阅读 下载PDF
不完备数据集的邻域容差互信息选择集成分类算法 被引量:2
6
作者 李丽红 董红瑶 +2 位作者 刘文杰 李宝霖 代琪 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期106-117,共12页
针对不完备混合信息系统的分类问题,结合粒计算中的邻域容差关系和互信息理论,定义邻域容差互信息的概念,并利用集成学习的思想,提出不完备数据集的邻域容差互信息选择集成分类算法.该算法首先根据缺失属性得到信息粒,划分粒层构建粒空... 针对不完备混合信息系统的分类问题,结合粒计算中的邻域容差关系和互信息理论,定义邻域容差互信息的概念,并利用集成学习的思想,提出不完备数据集的邻域容差互信息选择集成分类算法.该算法首先根据缺失属性得到信息粒,划分粒层构建粒空间,在不同的粒层上使用以BP神经网络作为基分类器的集成算法,构建新的基分类器;然后,根据每个信息粒的缺失属性计算出关于类属性的邻域容差互信息,来衡量各个信息粒的重要度,并根据基分类器预测准确率以及邻域容差互信息重新定义基分类器权重;最后,根据预测样本对基分类器加权集成预测分类结果,并与传统的集成分类算法进行对比分析.对于部分不完备混合型数据集,新提出的集成分类算法能有效提升分类准确率. 展开更多
关键词 不完备混合信息系统 邻域容差互信息 集成学习 分类
在线阅读 下载PDF
一种球团原料最佳配比的BAS智能推荐模型 被引量:7
7
作者 韩阳 杨爱民 张玉柱 《仪器仪表学报》 EI CAS CSCD 北大核心 2019年第9期246-254,共9页
结合广义回归神经网络(GRNN)在非线性拟合和柔性网络结构等方面的优势,构建熟球抗压强度预报模型,确定球团矿生产过程中的原料成分配比(Ca、Si、Mg等含量)与表征球团矿质量的重要参数(熟球抗压强度)之间的定量关系。基于抗压强度预报模... 结合广义回归神经网络(GRNN)在非线性拟合和柔性网络结构等方面的优势,构建熟球抗压强度预报模型,确定球团矿生产过程中的原料成分配比(Ca、Si、Mg等含量)与表征球团矿质量的重要参数(熟球抗压强度)之间的定量关系。基于抗压强度预报模型,借助天牛须搜索(BAS)算法,构建球团原料最佳配比智能推荐模型,在球团矿配料可调控区间上,智能推荐原料最佳配比方案。仿真与实验结果显示:熟球抗压强度预报模型具有超强的插值能力和优良的泛化性能;在球团矿各种配料变化不超过20%的区间内,智能推荐的最佳配料方案平均提升熟球抗压强度达16%以上,且系统运行稳健、仿真结果有效;将BAS智能推荐模型应用于球团制造实际流程中后较前一年同一时期的熟球抗压强度日均值有明显提升,实际应用效果佳。 展开更多
关键词 BAS 原料配比 柔性网络 智能推荐
在线阅读 下载PDF
基于粒化可拓决策的属性约简算法研究 被引量:5
8
作者 王君宇 杨亚锋 +2 位作者 赵佳亮 代琪 李丽红 《郑州大学学报(理学版)》 CAS 北大核心 2022年第5期72-81,共10页
针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法。首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决... 针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法。首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简。实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性。 展开更多
关键词 属性约简 粒化 K-MEANS聚类 可拓决策 关联度
在线阅读 下载PDF
基于邻域容差熵选择集成分类算法 被引量:2
9
作者 董红瑶 申成奥 李丽红 《郑州大学学报(理学版)》 CAS 北大核心 2023年第6期15-21,共7页
针对不完备混合型信息系统的分类问题,融合粒计算和集成学习思想,引入邻域容差关系,提出基于邻域容差熵选择集成分类算法。首先根据样本中的缺失属性将不完备混合型数据集划分为不同的信息粒,并再次遍历数据集进行最大化信息粒,构成新... 针对不完备混合型信息系统的分类问题,融合粒计算和集成学习思想,引入邻域容差关系,提出基于邻域容差熵选择集成分类算法。首先根据样本中的缺失属性将不完备混合型数据集划分为不同的信息粒,并再次遍历数据集进行最大化信息粒,构成新的粒空间,用以BP神经网络为基分类器的集成算法在粒空间上训练最大化信息粒,构建新的基分类器;然后以每个信息粒的缺失属性作为条件计算出关于类别属性的邻域容差条件熵,各个信息粒的重要度通过邻域容差条件熵进行量化后,通过信息粒的大小、新训练出的基分类器预测准确率以及邻域容差条件熵重新定义各个基分类器的权重;最后根据预测样本对基分类器加权集成,预测分类结果,并与传统的集成分类算法进行对比分析。对于不完备混合型数据集,新提出的集成分类算法能有效提升分类准确率。 展开更多
关键词 不完备混合型信息系统 信息粒 邻域容差熵 集成学习 分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部