期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于条件生成对抗插补网络的双重判别器缺失值插补算法
1
作者 粟佳 于洪 《计算机应用》 CSCD 北大核心 2024年第5期1423-1427,共5页
应用中的各种因素可能造成数据缺失,影响后续任务的分析。因此,数据集缺失值的插补尤为重要。相比原本没有插补的处理,错误的插补值也会对分析造成更严重的偏差。针对这种情况,提出新的采用双重判别器的基于条件生成对抗插补网络(C-GAIN... 应用中的各种因素可能造成数据缺失,影响后续任务的分析。因此,数据集缺失值的插补尤为重要。相比原本没有插补的处理,错误的插补值也会对分析造成更严重的偏差。针对这种情况,提出新的采用双重判别器的基于条件生成对抗插补网络(C-GAIN)的缺失值插补算法DDC-GAIN(Dual Discriminator based on C-GAIN)。该算法通过一个辅助判别器辅助主判别器判断预测值的真假,即根据一个样本的全局信息判断这个样本生成的真假,更注重特征之间的关系,以此估算预测值。在4个数据集上与5种经典插补算法进行对比实验,结果表明:同样条件下,DDC-GAIN算法在样本量较大时的均方根误差(RMSE)最低;在Default credit card数据集上缺失率为15%时,DDC-GAIN算法的RMSE比次优算法C-GAIN降低了28.99%。这说明利用辅助判别器帮助主判别器学习特征之间的关系是有效的。 展开更多
关键词 条件生成对抗插补网络 缺失值插补 不完备性 特征关系 双重判别器
在线阅读 下载PDF
粗糙集的近似集 被引量:43
2
作者 张清华 王国胤 肖雨 《软件学报》 EI CSCD 北大核心 2012年第7期1745-1759,共15页
粗糙集是1982年由Pawlak教授提出的解决集合边界不确定的重要方法,它通过两个精确的上、下近似集作为边界线来刻画目标集合(概念)X的不确定性,但它没有给出如何用已知的知识基(知识粒)来精确或近似地描述边界不确定的目标集合(概念)X的... 粗糙集是1982年由Pawlak教授提出的解决集合边界不确定的重要方法,它通过两个精确的上、下近似集作为边界线来刻画目标集合(概念)X的不确定性,但它没有给出如何用已知的知识基(知识粒)来精确或近似地描述边界不确定的目标集合(概念)X的方法.首先给出了集合之间的相似度概念,然后分析了分别用上近似集R(X)和下近似集R(X)作为目标集合(概念)X近似描述的不足,提出了在已有知识基(粒)空间下寻找目标集合(概念)X的近似集的方法,并分析了用R0.5(X)作为X(概念)的近似集的优越性.最后讨论了不同知识粒度空间下R0.5(X)与X的相似度随知识粒度的变化关系.从新的角度提出了目标集合(概念)X近似集的构造方法,促进了粗糙集模型的发展. 展开更多
关键词 粗糙集 近似集 粒计算 知识空间 相似度
在线阅读 下载PDF
粗糙集的最优近似集 被引量:32
3
作者 张清华 薛玉斌 王国胤 《软件学报》 EI CSCD 北大核心 2016年第2期295-308,共14页
Pawlak教授提出的粗糙集理论是解决集合边界不确定的重要手段,他构建了边界不确定集合的两条精确边界,但没有给出用已有知识基来精确或近似地构建目标概念(集合)X的方法.在前期的研究中提出了寻找目标概念X的近似集方法,但并没有给出最... Pawlak教授提出的粗糙集理论是解决集合边界不确定的重要手段,他构建了边界不确定集合的两条精确边界,但没有给出用已有知识基来精确或近似地构建目标概念(集合)X的方法.在前期的研究中提出了寻找目标概念X的近似集方法,但并没有给出最优的近似集.首先,回顾了集合间的相似度概念和粗糙集的近似集Rλ(X)的构建方法,提出并证明了Rλ(X)所满足的运算性质.其次,找到了Rλ(X)比上近似集R(X)和下近似集R(X)更近似于目标概念X的λ成立的区间.最后,提出了R0.5(X)作为目标概念的最优近似集所满足的条件. 展开更多
关键词 粗糙集 模糊集 近似集 相似度 粒计算
在线阅读 下载PDF
一种解决新项目冷启动问题的推荐算法 被引量:100
4
作者 于洪 李俊华 《软件学报》 EI CSCD 北大核心 2015年第6期1395-1408,共14页
推荐系统作为缓解信息过载问题的有效方法之一,在社交媒体中的作用日趋重要.但是,新项目冷启动和新用户冷启动问题是推荐技术面临的难题.为了解决新项目冷启动问题,提出了用户时间权重信息概念,该定义考虑到了用户评价时间与项目发布时... 推荐系统作为缓解信息过载问题的有效方法之一,在社交媒体中的作用日趋重要.但是,新项目冷启动和新用户冷启动问题是推荐技术面临的难题.为了解决新项目冷启动问题,提出了用户时间权重信息概念,该定义考虑到了用户评价时间与项目发布时间的时间间隔,根据用户时间权重值的大小,可以判断该用户是积极用户还是消极用户,以及用户对新项目的偏爱程度;利用三分图的形式来描述用户-项目-标签、用户-项目-属性之间的关系.在充分考虑用户、标签、项目属性、时间等信息基础上,获得个性化的预测评分值公式,提出了推荐算法.实验结果表明:所提出的方法能够实现满足不同用户、不同偏好的个性化推荐,在为用户推荐到合适项目的同时还能带来惊喜.比较实验说明,所提出的方法推荐准确度高,推荐新颖度高.交叉验证实验结果表明:该方法在解决推荐算法中的新项目冷启动问题上,无论是在推荐的准确度还是推荐项目的新颖度上都是有效的. 展开更多
关键词 推荐系统 协同过滤 冷启动 个性化 标签
在线阅读 下载PDF
决策域分布保持的启发式属性约简方法 被引量:18
5
作者 马希骜 王国胤 于洪 《软件学报》 EI CSCD 北大核心 2014年第8期1761-1780,共20页
在决策粗糙集中,由于引入了概率阈值,属性增加或减少时,正域或者非负域有可能变大、变小或者不变,即属性的增减与决策域(正域或非负域)之间不再具有单调性.分析结果表明,现有的基于整个决策域的属性约简定义可能会改变决策域.为使决策... 在决策粗糙集中,由于引入了概率阈值,属性增加或减少时,正域或者非负域有可能变大、变小或者不变,即属性的增减与决策域(正域或非负域)之间不再具有单调性.分析结果表明,现有的基于整个决策域的属性约简定义可能会改变决策域.为使决策域保持不变,引入了正域分布保持约简与非负域分布保持约简的概念.此外,决策域的非单调性使得属性约简算法必须检查一个属性集合的所有子集.为了简化算法设计,提出了正域和非负域分布条件信息量的定义,并证明其满足单调性,从而为设计决策域分布保持约简的启发式计算方法提供了理论基础.为了进一步获得最小约简,提出一种基于遗传算法的决策域分布保持启发式约简算法,并在两种单调的决策域分布条件信息量基础上构造了新算子,即修正算子,确保遗传算法找到的是约简而不是约简的超集.对比实验从分类正确率与误分类代价两个方面都反映了决策域分布保持约简定义的合理性,并且,所提出的遗传算法在大多数情况下都找到了最小约简. 展开更多
关键词 决策粗糙集模型 决策域分布保持约简 遗传算法 属性约简 启发式方法
在线阅读 下载PDF
基于云综合方法的三支群决策模型 被引量:21
6
作者 李帅 王国胤 杨洁 《计算机应用》 CSCD 北大核心 2019年第11期3163-3171,共9页
在三支决策问题中,领域专家群决策是一种确定损失函数的最直接方法。相较于体现单一不确定性的语言变量模型和模糊集模型,云模型描述的专家评价更能够反映认知过程中复杂的不确定性形式,并能通过云综合的方法获得综合评价函数。但当前... 在三支决策问题中,领域专家群决策是一种确定损失函数的最直接方法。相较于体现单一不确定性的语言变量模型和模糊集模型,云模型描述的专家评价更能够反映认知过程中复杂的不确定性形式,并能通过云综合的方法获得综合评价函数。但当前的云综合方法仅对数字特征进行简单的线性组合,缺乏对概念语义差异上的描述,难以获得令人信服的结果。因此首先证明了在云模型的距离空间中赋权距离和是一个凸函数,并将综合云模型定义为此函数的最小值点。然后,将该定义推广到多个云模型的场景下,提出了一种新的云综合方法--基于密度中心的云综合方法。群决策过程中,该方法在保证综合评价与基础评价之间的相似度最高的同时获得最精确的综合评价,为损失函数的确定提供了一种新的语义解释。实验结果表明,在与简单线性组合和合理粒度方法对比中,该方法所确定的损失函数使得三支决策中的误分类率最低。 展开更多
关键词 云综合 云模型 群决策 三支决策
在线阅读 下载PDF
基于三支决策的不平衡数据过采样方法 被引量:32
7
作者 胡峰 王蕾 周耀 《电子学报》 EI CAS CSCD 北大核心 2018年第1期135-144,共10页
采样是解决不平衡数据分类问题的一个有效途径.文中结合三支决策理论,根据样本分布将样本划分成三个区域:正域、边界域和负域;在此基础上,分别对边界域和负域中的小类样本进行不同的过采样处理,提出了一种基于三支决策的不平衡数据过采... 采样是解决不平衡数据分类问题的一个有效途径.文中结合三支决策理论,根据样本分布将样本划分成三个区域:正域、边界域和负域;在此基础上,分别对边界域和负域中的小类样本进行不同的过采样处理,提出了一种基于三支决策的不平衡数据过采样算法(TWD-IDOS算法).实验结果表明,在C4.5、KNN和CART等分类器上,文中提出的算法能有效解决不平衡数据的二分类问题,在Recall、F-value、AUC等指标上优于文献中的过采样算法. 展开更多
关键词 三支决策 邻域粗糙集 边界采样 不平衡数据 SMOTE
在线阅读 下载PDF
HSV颜色空间下用演化超网络识别道路限速标志的研究 被引量:5
8
作者 王进 任小龙 +1 位作者 孙开伟 张韵轩 《高技术通讯》 CAS CSCD 北大核心 2013年第7期679-684,共6页
针对国内城市6类常见道路限速标志(20、30、40、50、60、80 km/h),提出了一种HSV颜色空间信息和圆度特征相结合的限速标志检测与特征提取方法,对经特征提取得到的7×5向量采用一种新颖的演化超网络模型进行分类。基于239张道路限速... 针对国内城市6类常见道路限速标志(20、30、40、50、60、80 km/h),提出了一种HSV颜色空间信息和圆度特征相结合的限速标志检测与特征提取方法,对经特征提取得到的7×5向量采用一种新颖的演化超网络模型进行分类。基于239张道路限速标志图像的实验的结果表明,上述标志检测方法可实现对限速标志的快速、准确检测:单张图像检测平均时间为26ms,对所有图像的检测率为90.38%。通过采用123个特征向量作为训练集对超网络进行训练,演化超网络对独立测试集中93个特征向量的平均识别率达到98.2%,在识别率上优于大多数传统识别方法 。 展开更多
关键词 智能交通系统 道路限速标志 HSV颜色空间 圆度检测 演化超网络
在线阅读 下载PDF
演化超网络在多类型癌症分子分型中的应用 被引量:5
9
作者 王进 丁凌 +1 位作者 孙开伟 李钟浩 《电子与信息学报》 EI CSCD 北大核心 2013年第10期2425-2431,共7页
该文提出一种用于多类型癌症分子分型的演化超网络模式识别方法。首先采用"一对多"方法,将一个多类分型问题转化为多个二类分型问题;然后利用信噪比方法对DNA微阵列数据进行信息基因选择;经过超网络对训练集的演化学习,构造... 该文提出一种用于多类型癌症分子分型的演化超网络模式识别方法。首先采用"一对多"方法,将一个多类分型问题转化为多个二类分型问题;然后利用信噪比方法对DNA微阵列数据进行信息基因选择;经过超网络对训练集的演化学习,构造一系列二类分类器并进行集成,最终构建一个多类型癌症分型系统并对待测样本进行分类。对急性白血病、儿童小圆蓝细胞肿瘤和GCM数据集实验结果表明:演化超网络留一交叉验证(LOOCV)识别率分别为:98.61%,100%和85.35%。演化超网络有利于挖掘癌症相关基因,具有良好的学习结果可读性。 展开更多
关键词 模式识别 机器学习 演化超网络 微阵列 癌症多类型分类
在线阅读 下载PDF
基于密度峰值的网格聚类算法 被引量:12
10
作者 杨洁 王国胤 王飞 《计算机应用》 CSCD 北大核心 2017年第11期3080-3084,共5页
2014年提出的密度峰值聚类算法,思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性。基于密度峰值聚类算法提出了一种网格聚类算法,能够高效地对大规模数据进行处理。首先,将N维空间粒化为不相交的长方形网格单元;然后,统... 2014年提出的密度峰值聚类算法,思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性。基于密度峰值聚类算法提出了一种网格聚类算法,能够高效地对大规模数据进行处理。首先,将N维空间粒化为不相交的长方形网格单元;然后,统计单元空间的信息,利用密度峰值聚类寻找中心点的思想确定中心单元,即中心网格单元被一些低局部密度的数据单元包围,而且与比自身局部密度高的网格单元的距离相对较大;最后,合并与中心网格单元相近网格单元,从而得出聚类结果。在UCI人工数据集上的仿真实验结果表明,所提算法能够较快得出聚类中心,有效处理大规模数据的聚类问题,具有较高的效率,与原始的密度峰值聚类算法相比,在不同数据集上时间损耗降低至原来的1/100~1/10,而精度损失维持在5%~8%。 展开更多
关键词 密度峰值 网格粒化 大规模数据 聚类
在线阅读 下载PDF
基于时空背景模型的自适应运动目标检测方法 被引量:11
11
作者 李伟生 汪钊 《计算机应用》 CSCD 北大核心 2014年第12期3515-3520,共6页
现有的视觉背景提取方法(Vi Be)在背景建模时只利用了像素的空间信息,而忽略时间信息,降低了检测的准确性,且检测半径和背景更新的随机子采样因子都为固定常数,在动态背景干扰、相机抖动等情况下,检测效果不理想。针对这些问题,提出一... 现有的视觉背景提取方法(Vi Be)在背景建模时只利用了像素的空间信息,而忽略时间信息,降低了检测的准确性,且检测半径和背景更新的随机子采样因子都为固定常数,在动态背景干扰、相机抖动等情况下,检测效果不理想。针对这些问题,提出一种时空背景模型的自适应运动目标检测方法。首先,在Vi Be方法中加入时间信息建立时空背景模型;然后,在检测和更新过程中,提出背景模型中样本的标准差能反映背景的复杂度,通过计算样本的标准差来自适应地改变检测半径和背景更新的随机子采样因子适应背景的变化。实验结果表明,改进的方法不仅能够在静态背景和光照均匀的情况下有效地检测出前景像素,而且对存在光线变化较大、相机抖动、动态背景干扰等情况也有一定的抑制作用,提高了检测的准确性。 展开更多
关键词 运动目标检测 时空背景模型 自适应 检测半径 随机子采样因子
在线阅读 下载PDF
基于代表点与K近邻的密度峰值聚类算法 被引量:12
12
作者 张清华 周靖鹏 +1 位作者 代永杨 王国胤 《软件学报》 EI CSCD 北大核心 2023年第12期5629-5648,共20页
密度峰值聚类(density peaks clustering,DPC)是一种基于密度的聚类算法,该算法可以直观地确定类簇数量,识别任意形状的类簇,并且自动检测、排除异常点.然而,DPC仍存在些许不足:一方面,DPC算法仅考虑全局分布,在类簇密度差距较大的数据... 密度峰值聚类(density peaks clustering,DPC)是一种基于密度的聚类算法,该算法可以直观地确定类簇数量,识别任意形状的类簇,并且自动检测、排除异常点.然而,DPC仍存在些许不足:一方面,DPC算法仅考虑全局分布,在类簇密度差距较大的数据集聚类效果较差;另一方面,DPC中点的分配策略容易导致“多米诺效应”.为此,基于代表点(representative points)与K近邻(K-nearest neighbors,KNN)提出了RKNN-DPC算法.首先,构造了K近邻密度,再引入代表点刻画样本的全局分布,提出了新的局部密度;然后,利用样本的K近邻信息,提出一种加权的K近邻分配策略以缓解“多米诺效应”;最后,在人工数据集和真实数据集上与5种聚类算法进行了对比实验,实验结果表明,所提出的RKNN-DPC可以更准确地识别类簇中心并且获得更好的聚类结果. 展开更多
关键词 聚类分析 密度峰值聚类 代表点 K近邻(KNN)
在线阅读 下载PDF
结合最优类别信息离散的细粒度超网络微阵列数据分类 被引量:5
13
作者 王进 张军 胡白帆 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第12期1856-1862,共7页
针对传统演化超网络只能有效处理二值数据输入的问题,提出一种结合最优类别信息离散(Optimal Class-Dependent Discretization,OCDD)的细粒度演化超网络模型,对连续数据进行离散化生成细粒度二进制编码,并通过对其进行演化学习得到具备... 针对传统演化超网络只能有效处理二值数据输入的问题,提出一种结合最优类别信息离散(Optimal Class-Dependent Discretization,OCDD)的细粒度演化超网络模型,对连续数据进行离散化生成细粒度二进制编码,并通过对其进行演化学习得到具备决策能力的超网络分类器.该方法避免了传统超网络模型对连续数据进行直接二值化后的高信息损失,使演化超网络的概率估计更接近于数据真实分布,提高了超网络的决策分类能力.对结肠癌、肺癌、前列腺癌和急性白血病4种DNA微阵列数据集进行实验的结果表明,结合OCDD的细粒度演化超网络具有比传统演化超网络更高的识别率和鲁棒性. 展开更多
关键词 模式识别 机器学习 超网络 细粒度
在线阅读 下载PDF
广义多尺度集值决策系统最优尺度选择 被引量:2
14
作者 胡军 陈艳 +1 位作者 张清华 王国胤 《计算机研究与发展》 EI CSCD 北大核心 2022年第9期2027-2038,共12页
为了在不同的粒度下对同一对象进行观察、表示、分析和决策,提出了多尺度信息系统.考虑到一个对象在属性的各个尺度上的取值为多值的情况,多尺度信息系统被进一步扩展到多尺度集值信息系统.然而,在现有的多尺度集值信息系统中,所有属性... 为了在不同的粒度下对同一对象进行观察、表示、分析和决策,提出了多尺度信息系统.考虑到一个对象在属性的各个尺度上的取值为多值的情况,多尺度信息系统被进一步扩展到多尺度集值信息系统.然而,在现有的多尺度集值信息系统中,所有属性必须具有相同的尺度级数,使得每个属性都只能在同一个尺度下进行组合.并且,最优尺度选择仅考虑决策系统的一致性或不确定性,忽略了实际应用中的决策代价问题.针对上述问题,定义了一种具有代价的广义多尺度集值决策系统,分析了决策系统的不确定性和代价随尺度组合的变化趋势.然后,为了提高最优尺度选择的时间效率,提出了一种基于三支决策思想的尺度空间更新方法.最后,结合用户需求,给出了最小化不确定性和代价的最优尺度选择方法.实验结果表明,该方法不仅可以结合不确定性和代价得到最优尺度解,并且与传统的Lattic Mode相比,能有效地提高计算效率. 展开更多
关键词 多尺度 集值信息系统 代价敏感 三支决策 最优尺度选择
在线阅读 下载PDF
基于k-means的自动三支决策聚类方法 被引量:20
15
作者 于洪 毛传凯 《计算机应用》 CSCD 北大核心 2016年第8期2061-2065,2091,共6页
应用广泛的k-means算法结果是一种二支决策的结果,即对象要么属于某个类要么不属于这个类,这种决策方式难以适用于一些具有不确定现象的环境,因此提出三支决策聚类方法来反映对象与类之间的关系,即:对象确定属于某类、可能属于某类或确... 应用广泛的k-means算法结果是一种二支决策的结果,即对象要么属于某个类要么不属于这个类,这种决策方式难以适用于一些具有不确定现象的环境,因此提出三支决策聚类方法来反映对象与类之间的关系,即:对象确定属于某类、可能属于某类或确定不属于某类。显然,二支决策是三支决策的一种特例。此外,从类内紧凑性和考虑近邻类间分离性角度出发,定义了分离性指数、聚类结果评估有效性指数,并提出了一种自动三支决策聚类算法。该方法为处理具有不确定信息的基于k-means算法框架的聚类数目自动确定的难题提供了一种新的解决思路。在人工数据集和UCI真实数据集上的初步对比实验结果表明所提出的方法是有效的。 展开更多
关键词 聚类 三支决策 有效性指数 K-MEANS算法
在线阅读 下载PDF
融合多粒度社区信息的网络嵌入方法 被引量:2
16
作者 胡军 许正康 +1 位作者 刘立 钟福金 《计算机应用》 CSCD 北大核心 2022年第3期663-670,共8页
现有大多数网络嵌入方法仅保留了网络的局部结构信息,而忽略了网络中的其他潜在信息。为了保留网络的社区信息,并体现网络社区结构的多粒度特性,提出一种融合多粒度社区信息的网络嵌入方法(EMGC)。首先,获得网络的多粒度社区结构,并初... 现有大多数网络嵌入方法仅保留了网络的局部结构信息,而忽略了网络中的其他潜在信息。为了保留网络的社区信息,并体现网络社区结构的多粒度特性,提出一种融合多粒度社区信息的网络嵌入方法(EMGC)。首先,获得网络的多粒度社区结构,并初始化节点嵌入和社区嵌入;然后,根据上一粒度上的节点嵌入和本层粒度的社区结构,更新社区嵌入,进而调整相应的节点嵌入;最后,对不同粒度下的节点嵌入进行拼接,从而得到融合多粒度社区信息的网络嵌入结果。在4个真实网络数据集上进行实验,相较于未考虑社区信息的方法(DeepWalk、node2vec)和考虑了单一粒度社区信息的方法(ComE、GEMSEC),EMGC在链接预测上的AUC值和节点分类上的F1值总体上优于对比方法。实验结果表明EMGC能够有效提升后续链接预测和节点分类的准确率。 展开更多
关键词 网络表示 网络嵌入 多粒度 社区发现 复杂网络
在线阅读 下载PDF
基于光流法和卡尔曼滤波的多目标跟踪 被引量:18
17
作者 石龙伟 邓欣 +1 位作者 王进 陈乔松 《计算机应用》 CSCD 北大核心 2017年第A01期131-136,共6页
目标跟踪中运动情况的复杂性给目标跟踪任务增加了许多困难。针对此问题,提出一种将光流法和卡尔曼滤波方法相结合的目标跟踪方法。首先,通过光流法处理输入视频帧;其次,经形态学膨胀和改进的中值滤波处理,进而实现对运动目标的准确获取... 目标跟踪中运动情况的复杂性给目标跟踪任务增加了许多困难。针对此问题,提出一种将光流法和卡尔曼滤波方法相结合的目标跟踪方法。首先,通过光流法处理输入视频帧;其次,经形态学膨胀和改进的中值滤波处理,进而实现对运动目标的准确获取;最后,根据所获取的目标位置等信息,使用卡尔曼滤波方法处理后续图像序列,并对运动目标进行预测,从而实现对运动目标的有效跟踪。在两组对比实验中,所提方法的跟踪平均准确率分别达到67.83%和85.25%,实验结果表明所提方法在提高跟踪准确率的同时也使得跟踪更具主动性。 展开更多
关键词 目标跟踪 计算机视觉 光流法 中值滤波 卡尔曼滤波
在线阅读 下载PDF
基于相似度量的自适应三支垃圾邮件过滤器 被引量:7
18
作者 谢秦 张清华 王国胤 《计算机研究与发展》 EI CSCD 北大核心 2019年第11期2410-2423,共14页
垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题.然而,较之于... 垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题.然而,较之于三支决策模型,二分类模型会产生较大的错分代价.作为三支决策的一个重要分支,基于决策理论粗糙集的三支决策模型符合人类认知习惯,且能有效地降低错分代价,进而提高过滤器的性能.然而,在构造损失函数时,少有研究考虑由于等价类之间的差异性而对分类结果带来的影响.因此,在基于决策理论粗糙集的三支决策模型的基础上,提出了一种基于相似度量的自适应三支垃圾邮件分类模型.该模型根据集合方差计算了条件属性的权重,并基于相似度量建立了一种刻画差异信息的综合评价函数,进而根据贝叶斯决策规则构建了一种计算自适应阈值对的方法.实验结果表明所提模型在垃圾邮件过滤领域表现优异. 展开更多
关键词 垃圾邮件过滤 决策理论粗糙集 三支决策 相似度量 阈值
在线阅读 下载PDF
基于时间粒的铝电解过热度预测模型 被引量:8
19
作者 郭英杰 胡峰 +1 位作者 于洪 张红亮 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期624-632,共9页
过热度是铝电解生产过程中的一项重要参数,将过热度保持在适当的范围内可以提高电流效率,减小电解槽损耗,但是过热度测量难度较大且测量过程复杂.因此,基于粒计算理论,提出一种基于时间粒的过热度预测模型.通过在时间序列上构建时间粒,... 过热度是铝电解生产过程中的一项重要参数,将过热度保持在适当的范围内可以提高电流效率,减小电解槽损耗,但是过热度测量难度较大且测量过程复杂.因此,基于粒计算理论,提出一种基于时间粒的过热度预测模型.通过在时间序列上构建时间粒,结合时间粒构建新的特征集与样本集,在此基础上,利用分类器对新的样本集进行训练,得到模型.采用山东魏桥铝电有限公司的铝电解生产数据进行实验,结果表明,该方法在预测过热度上较已有模型的预测能力有较大提升。 展开更多
关键词 过热度 粒计算 时间序列 铝电解
在线阅读 下载PDF
属性组序下基于代价敏感的约简方法 被引量:5
20
作者 刘鑫 胡军 张清华 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期469-479,共11页
属性约简是粗糙集理论中的重要问题.为了满足用户对属性的偏好,人们研究了属性序下的属性约简,然而对一些问题却很难给出完整的属性序.针对该问题,比较分析了属性组序下的约简子集的优劣,并提出代价敏感下的属性组序约简的算法.该算法... 属性约简是粗糙集理论中的重要问题.为了满足用户对属性的偏好,人们研究了属性序下的属性约简,然而对一些问题却很难给出完整的属性序.针对该问题,比较分析了属性组序下的约简子集的优劣,并提出代价敏感下的属性组序约简的算法.该算法通过属性组序的特点考虑用户偏好并结合属性代价以及属性重要度加权的方式选择局部属性,可以得到更符合用户偏好的约简.理论分析和实验结果验证了该算法的可行性和有效性,并且能在一般情形下找到满足用户偏好的约简. 展开更多
关键词 属性约简 用户偏好 属性组序 代价敏感
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部