期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
邻域粗糙模糊集的高效动态更新增量式算法
1
作者 何柳 周雯 《计算机工程与设计》 北大核心 2025年第8期2200-2210,共11页
为了解决邻域粗糙模糊集模型的增量式计算问题,提出一种矩阵策略的邻域粗糙模糊集动态更新算法。提出一种基于矩阵方法的邻域粗糙模糊集模型,通过邻域关系矩阵和模糊决策对角阵的矩阵运算,实现了邻域粗糙模糊近似集的矩阵表达;当信息系... 为了解决邻域粗糙模糊集模型的增量式计算问题,提出一种矩阵策略的邻域粗糙模糊集动态更新算法。提出一种基于矩阵方法的邻域粗糙模糊集模型,通过邻域关系矩阵和模糊决策对角阵的矩阵运算,实现了邻域粗糙模糊近似集的矩阵表达;当信息系统增加和删除对象时,增量式更新邻域关系矩阵和模糊决策对角阵的结果,并利用更新后矩阵的运算实现了邻域粗糙模糊近似集的动态更新,因此减少了不必要的计算且提升了性能;利用所提出的增量式更新机制设计了邻域粗糙模糊集的动态更新算法。在UCI数据集上的实验结果表明,该动态算法的运行效率明显高于静态算法和同类型动态算法。 展开更多
关键词 粗糙集 模糊粗糙集 邻域粗糙模糊 模糊决策 动态更新 矩阵 增量式
在线阅读 下载PDF
基于中心偏移的Fisher score与直觉邻域模糊熵的多标记特征选择 被引量:1
2
作者 孙林 马天娇 《计算机科学》 CSCD 北大核心 2024年第7期96-107,共12页
现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记... 现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记将多标记论域划分为多个样本集,计算样本集的特征均值作为标记下样本的原始中心点,以最远样本的距离乘以距离系数,去除边缘样本集,定义了新的有效样本集,计算中心偏移处理后的标记下每个特征的得分以及标记集的特征得分,进而建立了基于中心偏移的多标记Fisher score模型,预处理多标记数据。然后,引入多标记分类间隔作为自适应模糊邻域半径参数,定义了模糊邻域相似关系和模糊邻域粒,由此构造了多标记模糊邻域粗糙集的上、下近似集;在此基础上提出了多标记邻域粗糙直觉隶属度函数和非隶属度函数,定义了多标记邻域直觉模糊熵。最后,给出了特征的外部和内部重要度的计算公式,设计了基于邻域直觉模糊熵的多标记特征选择算法,筛选出最优特征子集。在多标记K近邻分类器下、9个多标记数据集上的实验结果表明,所提算法选择的最优子集具有良好的分类性能。 展开更多
关键词 多标记学习 特征选择 Fisher score 多标记模糊邻域粗糙集 邻域直觉模糊
在线阅读 下载PDF
基于邻域粗糙集的多标记分类特征选择算法 被引量:111
3
作者 段洁 胡清华 +2 位作者 张灵均 钱宇华 李德玉 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期56-65,共10页
多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法... 多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法以应对维数灾难问题,但对于多标记的属性约简和特征选择却鲜有研究.将粗糙集应用于多标记数据的特征选择中,针对多标记分类任务,重新定义了邻域粗糙集的下近似和依赖度计算方法,探讨了这一模型的性质,进而构造了基于邻域粗糙集的多标记分类任务的特征选择算法,并给出了在公开数据上的实验结果.实验分析证明算法的有效性. 展开更多
关键词 多标记分类 特征选择 邻域粗糙集 依赖度
在线阅读 下载PDF
基于自适应邻域空间粗糙集模型的直觉模糊熵特征选择 被引量:14
4
作者 姚晟 徐风 +1 位作者 赵鹏 纪霞 《计算机研究与发展》 EI CSCD 北大核心 2018年第4期802-814,共13页
特征选择是数据预处理中一项很重要的技术,主要从原始数据集的特征中选出一些最有效的特征以降低数据集的维度,从而提高学习算法性能.目前基于邻域粗糙集模型的特征选择算法中,由于没有考虑数据分布不均的问题,对象的邻域存在一定的缺陷... 特征选择是数据预处理中一项很重要的技术,主要从原始数据集的特征中选出一些最有效的特征以降低数据集的维度,从而提高学习算法性能.目前基于邻域粗糙集模型的特征选择算法中,由于没有考虑数据分布不均的问题,对象的邻域存在一定的缺陷.为了解决这个问题,采用方差来度量数据的分布情况,重新定义二元邻域空间,基于此提出自适应二元邻域空间的粗糙集模型,并将该模型与邻域直觉模糊熵结合作为特征评估的方式,进而构造相应的特征选择算法.UCI实验结果表明:所提出的算法能够选出更小且具有更高分类精度的特征子集,同时算法拥有更少的时间消耗.因此所提的特征选择算法具有更强的优越性. 展开更多
关键词 粗糙集 邻域 方差 二元邻域空间 邻域直觉模糊 特征选择
在线阅读 下载PDF
一种基于邻域粗糙集的多标记专属特征选择方法 被引量:15
5
作者 孙林 潘俊方 +2 位作者 张霄雨 王伟 徐久成 《计算机科学》 CSCD 北大核心 2018年第1期173-178,共6页
在多标记学习中,数据降维是一项重要且具有挑战性的任务,而特征选择又是一种高效的数据降维技术。在邻域粗糙集理论的基础上提出一种多标记专属特征选择方法,该方法从理论上确保了所得到的专属特征与相应标记具有较强的相关性,进而改善... 在多标记学习中,数据降维是一项重要且具有挑战性的任务,而特征选择又是一种高效的数据降维技术。在邻域粗糙集理论的基础上提出一种多标记专属特征选择方法,该方法从理论上确保了所得到的专属特征与相应标记具有较强的相关性,进而改善了约简效果。首先,该方法运用粗糙集理论的约简算法来减少冗余属性,在保持分类能力不变的情况下获得标记的专属特征;然后,在邻域精确度和邻域粗糙度概念的基础上,重新定义了基于邻域粗糙集的依赖度与重要度的计算方法,探讨了该模型的相关性质;最后,构建了一种基于邻域粗糙集的多标记专属特征选择模型,实现了多标记分类任务的特征选择算法。在多个公开的数据集上进行仿真实验,结果表明了该算法是有效的。 展开更多
关键词 多标记学习 邻域粗糙集 专属特征 特征选择
在线阅读 下载PDF
基于稳健模糊粗糙集模型的多标记文本分类 被引量:7
6
作者 张晶 李德玉 +1 位作者 王素格 李华 《计算机科学》 CSCD 北大核心 2015年第7期270-275,共6页
针对多标记数据的不确定性以及噪声数据的存在,提出了一种新的多标记稳健模糊粗糙分类模型。该模型是处理单标记分类问题的k-mean稳健统计量模糊粗糙分类模型的扩展应用。对于每个待分类数据,首先根据相似性计算方法,得到它们相对于各... 针对多标记数据的不确定性以及噪声数据的存在,提出了一种新的多标记稳健模糊粗糙分类模型。该模型是处理单标记分类问题的k-mean稳健统计量模糊粗糙分类模型的扩展应用。对于每个待分类数据,首先根据相似性计算方法,得到它们相对于各标记的隶属度;然后根据隶属度定义待分类数据与各标记的相关度;最后为每一组相关度赋予合适的阈值,得到相关的标记集合。在3个标准多标记数据集和1个真实多标记文本数据集上的实验结果表明,对于多标记文本分类问题,所提模型在6个常用的多标记评测指标上较常用的ML-kNN和rank-SVM多标记学习方法具有更高的准确率。 展开更多
关键词 模糊粗糙集 k-mean稳健统计量 隶属度 多标记学习
在线阅读 下载PDF
基于模糊邻域粗糙集的启发式属性约简算法 被引量:5
7
作者 任晓霞 薛凡 《计算机工程与应用》 CSCD 北大核心 2018年第9期47-53,212,共8页
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后... 属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。 展开更多
关键词 属性约简 模糊邻域粗糙集 依赖度 知识粒度 模糊邻域粒度
在线阅读 下载PDF
基于邻域粗糙集和Relief的弱标记特征选择方法 被引量:14
8
作者 孙林 黄苗苗 徐久成 《计算机科学》 CSCD 北大核心 2022年第4期152-160,共9页
在多标记学习与分类中,现有邻域粗糙集特征选择算法若将样本的分类间隔作为邻域半径,则会出现分类间隔过大导致分类无意义、样本距离过大容易造成异类样本和同类样本失效,以及无法处理弱标记数据等情况。为解决这些问题,提出一种基于多... 在多标记学习与分类中,现有邻域粗糙集特征选择算法若将样本的分类间隔作为邻域半径,则会出现分类间隔过大导致分类无意义、样本距离过大容易造成异类样本和同类样本失效,以及无法处理弱标记数据等情况。为解决这些问题,提出一种基于多标记邻域粗糙集和多标记Relief的弱标记特征选择方法。首先,引入异类样本数和同类样本数来改进分类间隔,在此基础上定义邻域半径,构造新的邻域近似精度与多标记邻域粗糙集模型,并有效度量边界域引起的集合不确定性。其次,利用迭代更新权重公式填补大部分缺失标记信息,将邻域近似精度与互信息相结合,以构造新的标记相关性,填补剩余的缺失标记信息。然后,使用异类样本数和同类样本数,以构造新的标记权重和特征权重计算公式,进而提出多标记Relief模型,并将其应用于多标记特征选择。最后,结合多标记邻域粗糙集模型和多标记Relief算法,设计一种新的弱标记特征选择算法,以处理带有缺失标记的高维数据,并有效地提升多标记分类性能。在11个公共多标记数据集上进行仿真实验,结果验证了所提出的弱标记特征选择算法的有效性。 展开更多
关键词 多标记学习 特征选择 邻域粗糙集 RELIEF 缺失标记
在线阅读 下载PDF
基于模糊邻域相对决策熵的属性约简算法 被引量:1
9
作者 徐久成 张杉 +1 位作者 白晴 马妙贤 《计算机科学》 北大核心 2025年第2期165-172,共8页
针对模糊邻域粗糙集对数据分布敏感且无法有效评估密度差异较大数据集的分类不确定性这一问题,提出了一种基于模糊邻域相对决策熵的属性约简算法。首先,采用相对距离定义样本的分类不确定度,重塑模糊邻域相似关系,并结合变精度模糊邻域... 针对模糊邻域粗糙集对数据分布敏感且无法有效评估密度差异较大数据集的分类不确定性这一问题,提出了一种基于模糊邻域相对决策熵的属性约简算法。首先,采用相对距离定义样本的分类不确定度,重塑模糊邻域相似关系,并结合变精度模糊邻域粗糙近似,减少样本被归入错误类别的可能性;其次,在信息观下将模糊邻域可信度和覆盖度引入信息熵,并与基于代数观构造的模糊邻域相对依赖度相结合,提出模糊邻域相对决策熵;最后,设计一种基于模糊邻域相对决策熵的属性约简算法,从信息观和代数观两个角度来评估属性的重要度。在8个公共数据集上将其与现有的6种属性约简算法进行对比实验,结果表明,所提算法能有效地测量不同数据分布下样本的不确定度,提高数据的分类性能。 展开更多
关键词 属性约简 模糊邻域粗糙集 分类不确定度 信息熵
在线阅读 下载PDF
区间值直觉模糊β覆盖粗糙集模型 被引量:1
10
作者 任浩伟 王青海 张巧珍 《陕西科技大学学报》 北大核心 2024年第5期214-224,共11页
在新的β覆盖邻域系统上提出四种区间值直觉模糊β覆盖粗糙集模型,用于有效处理区间值直觉模糊信息的多属性决策问题.首先,从论域的区间值直觉模糊β覆盖出发,引入两类新的邻域系统并构造了四种不同类型的区间值直觉模糊β覆盖粗糙集,... 在新的β覆盖邻域系统上提出四种区间值直觉模糊β覆盖粗糙集模型,用于有效处理区间值直觉模糊信息的多属性决策问题.首先,从论域的区间值直觉模糊β覆盖出发,引入两类新的邻域系统并构造了四种不同类型的区间值直觉模糊β覆盖粗糙集,扩展了现有模型的适用范围.其次,深入研究了每种模型的数学性质,构建了所提出的四种模型之间的关联关系,为模糊β覆盖粗糙集领域的研究提供了理论基础.最后,为解决区间值直觉模糊信息的多属性决策问题,设计了决策算法并进行应用实例分析,并通过与其他决策方法的对比分析,表明了区间值直觉模糊β覆盖粗糙集在多属性决策问题中具有可行性和有效性.研究成果对于复杂模糊信息决策具有一定的参考和指导意义,并为解决多属性决策问题提供了新的思路和方法. 展开更多
关键词 区间值直觉模糊 邻域系统 β覆盖粗糙集 多属性决策
在线阅读 下载PDF
基于多粒度模糊邻域熵的在线流组特征选择
11
作者 韩子钦 徐久成 +2 位作者 章磊 周长顺 许诗卉 《计算机工程与设计》 北大核心 2025年第1期214-222,共9页
针对传统在线流组特征选择方法无法处理异常或者缺失的不完备混合数据,导致特征选择效果不佳的问题,在不完备系统中提出一种基于多粒度模糊邻域熵的在线流组特征选择算法。考虑不完备混合数据中的不确定信息,将决策自信息与模糊邻域熵... 针对传统在线流组特征选择方法无法处理异常或者缺失的不完备混合数据,导致特征选择效果不佳的问题,在不完备系统中提出一种基于多粒度模糊邻域熵的在线流组特征选择算法。考虑不完备混合数据中的不确定信息,将决策自信息与模糊邻域熵相结合,从代数和信息视角提出多粒度模糊邻域熵;提出在线流组内、组间粒选度,根据模糊邻域对比度对特征组进行冗余分析。在8个公共数据集上进行实验对比分析,所提算法在处理不完备混合数据时能有效消除冗余特征,提高数据的分类精度。 展开更多
关键词 流特征选择 流组 自信息 模糊邻域粗糙集 不完备决策系统 模糊邻域 重合度
在线阅读 下载PDF
面向模糊邻域动态特征交互的特征选择方法
12
作者 徐久成 牛武林 +2 位作者 段江豪 张杉 白晴 《西北大学学报(自然科学版)》 北大核心 2025年第2期320-332,共13页
针对大部分基于模糊邻域信息系统的特征选择方法,在选入特征时只是单调的按照特征顺序进行特征交互的问题,以及大多数特征度量函数仅从代数观或信息观的视角构造度量函数的缺陷,提出了一种基于模糊邻域动态特征交互的特征选择方法。首先... 针对大部分基于模糊邻域信息系统的特征选择方法,在选入特征时只是单调的按照特征顺序进行特征交互的问题,以及大多数特征度量函数仅从代数观或信息观的视角构造度量函数的缺陷,提出了一种基于模糊邻域动态特征交互的特征选择方法。首先,引入模糊邻域互信息计算特征相关度,并根据特征相关度将特征顺序重组。其次,分析特征动态交互的过程,通过模糊邻域互信息以及模糊邻域条件互信息,按照特征排序依次计算特征之间的冗余及动态交互程度。最后,为改善大多数特征度量函数构造视角单一的缺陷,提出一种多视角下的依赖模糊邻域混合互信息度量函数。在8个公共数据集上与现有的7种属性约简算法进行对比实验,实验结果表明,该算法消除了冗余特征,同时提高了数据分类的准确度。 展开更多
关键词 特征选择 模糊邻域粗糙集 动态特征交互 互信息 条件互信息
在线阅读 下载PDF
基于变精度邻域粗糙集的多标记子空间研究 被引量:8
13
作者 张佳欢 李磊军 +2 位作者 李美争 米据生 解滨 《南京理工大学学报》 EI CAS CSCD 北大核心 2019年第4期414-422,共9页
多标记学习是目前机器学习中的热点研究问题。本文基于变精度邻域粗糙集探究多标记学习中的特征选择方法,并对所得到的多标记子空间进行了详细的分析。首先提出了基于多标记学习的变精度邻域粗糙集模型,进而给出了一种多标记学习中的特... 多标记学习是目前机器学习中的热点研究问题。本文基于变精度邻域粗糙集探究多标记学习中的特征选择方法,并对所得到的多标记子空间进行了详细的分析。首先提出了基于多标记学习的变精度邻域粗糙集模型,进而给出了一种多标记学习中的特征选择方法。在此基础上,基于不同的精度和邻域能够得到不同的特征选择结果,即不同的特征子空间。该文详细分析了精度和邻域对特征子空间的影响,并将所得到的特征子空间进行集成,详细分析了相应的集成效果。 展开更多
关键词 多标记学习 变精度邻域粗糙集 特征选择 集成
在线阅读 下载PDF
模糊邻域粗糙集的决策熵不确定性度量 被引量:7
14
作者 樊雲瑞 张贤勇 杨霁琳 《计算机工程与设计》 北大核心 2021年第5期1300-1306,共7页
针对不确定性度量的强健构建与泛化推广,采用代数表示与信息表示的融合,提出模糊邻域粗糙集的决策熵。关于模糊决策概念,代数粗糙度的信息函数深入诱导出模糊邻域相对决策熵;关于模糊决策分类,决策类集成自然诱导出模糊邻域相对决策熵,... 针对不确定性度量的强健构建与泛化推广,采用代数表示与信息表示的融合,提出模糊邻域粗糙集的决策熵。关于模糊决策概念,代数粗糙度的信息函数深入诱导出模糊邻域相对决策熵;关于模糊决策分类,决策类集成自然诱导出模糊邻域相对决策熵,融合依赖度改进出模糊邻域依赖决策熵。模糊邻域决策熵实施了代数与信息的复合构建,呈现关于属性与半径的双重粒化单调性,具有鲁棒的不确定性刻画能力,决策表实例与数据集实验验证了相关有效性。 展开更多
关键词 模糊邻域粗糙集 不确定性度量 决策熵 粗糙 依赖度 粒化单调性
在线阅读 下载PDF
基于模糊邻域系统的模糊粗糙集模型 被引量:4
15
作者 冉虹 候婷 +1 位作者 贺龙雨 秦克云 《计算机科学》 CSCD 北大核心 2022年第S02期330-334,共5页
针对模糊邻域系统,提出了基于一般模糊逻辑算子的模糊粗糙上、下近似算子并探讨了算子的基本性质。然后将邻域系统串行、自反、对称、一元、欧几里得的概念推广到模糊邻域系统。最后研究了当模糊邻域系统是串行、自反、对称、一元、欧... 针对模糊邻域系统,提出了基于一般模糊逻辑算子的模糊粗糙上、下近似算子并探讨了算子的基本性质。然后将邻域系统串行、自反、对称、一元、欧几里得的概念推广到模糊邻域系统。最后研究了当模糊邻域系统是串行、自反、对称、一元、欧几里得时模糊粗糙近似算子的相关代数结构。 展开更多
关键词 模糊邻域系统 粗糙集 上近似算子 下近似算子
在线阅读 下载PDF
基于Fisher score与模糊邻域熵的多标记特征选择算法 被引量:5
16
作者 孙林 马天娇 薛占熬 《计算机应用》 CSCD 北大核心 2023年第12期3779-3789,共11页
针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最... 针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最大信息系数(MIC)衡量特征与标记之间的关联程度,构建特征与标记关系矩阵;基于修正余弦相似度定义标记关系矩阵,分析标记之间的相关性。其次,给出一种二阶策略获得多个二阶标记关系组,以此重新划分多标记论域;通过增强标记之间的强相关性和削弱标记之间的弱相关性得到每个特征的得分,进而改进Fisher score模型,对多标记数据进行预处理。再次,引入多标记分类间隔,定义自适应邻域半径和邻域类并构造了上、下近似集;在此基础上提出了多标记粗糙隶属度函数,将多标记邻域粗糙集映射到模糊集,基于多标记模糊邻域给出了上、下近似集以及多标记模糊邻域粗糙集模型,由此定义模糊邻域熵和多标记模糊邻域熵,有效度量边界域的不确定性。最后,设计基于二阶标记相关性的多标记Fisher score特征选择算法(MFSLC),从而构建MLFSF。在多标记K近邻(MLKNN)分类器下11个多标记数据集上的实验结果表明,相较于ReliefF多标记特征选择(MFSR)等6种先进算法,MLFSF的平均分类精度(AP)的均值提高了2.47~6.66个百分点;同时,在多数数据集上,MLFSF在5个评价指标上均能取得最优值。 展开更多
关键词 多标记学习 特征选择 Fisher score 多标记模糊邻域粗糙集 模糊邻域
在线阅读 下载PDF
代价敏感的多粒度邻域粗糙模糊集的近似表示 被引量:6
17
作者 杨洁 匡俊成 +1 位作者 王国胤 刘群 《计算机科学》 CSCD 北大核心 2023年第5期137-145,共9页
多粒度邻域粗糙集是邻域粗糙集理论的一种新型数据处理模式,其目标概念分别由乐观和悲观的上、下近似边界描述。但当前的多粒度邻域粗糙集既缺乏利用已有的信息粒近似描述目标概念的方法,又无法处理目标概念为模糊的情形。而张清华教授... 多粒度邻域粗糙集是邻域粗糙集理论的一种新型数据处理模式,其目标概念分别由乐观和悲观的上、下近似边界描述。但当前的多粒度邻域粗糙集既缺乏利用已有的信息粒近似描述目标概念的方法,又无法处理目标概念为模糊的情形。而张清华教授提出的粗糙集近似理论提供了一种利用已有信息粒近似描述知识的方法,为构建多粒度邻域粗糙模糊集的近似精确集提供了新思路。文中首先针对模糊目标概念,将粗糙集近似理论应用到邻域粗糙集领域,提出了代价敏感的邻域粗糙模糊集的近似表示模型;然后进一步从多粒度视角,构建出一种代价敏感的邻域粗糙模糊集的多粒度近似表示模型,并分析了其相关性质;最后,通过实验仿真,验证了当多粒度代价敏感近似及其上、下近似方法分别去近似刻画模糊目标概念时,多粒度代价敏感近似方法产生的误分类代价最小。 展开更多
关键词 粗糙集 邻域粗糙模糊 近似模型 代价敏感 多粒度
在线阅读 下载PDF
基于模糊-粗糙集的文本分类方法 被引量:8
18
作者 付雪峰 王明文 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期73-76,共4页
在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优七值的选取需要通过... 在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优七值的选取需要通过训练得到.文中借助模糊-粗糙集理论来改进传统的k-近邻方法,并使用基于距离的邻城空间,以不经训练地确定适宜每个待分类文本的k-值,最后将所提方法和其他一些k-近邻方法进行了实验比较,结果表明模糊-粗糙集方法能够在一定程度上提高分类的精度和召回率. 展开更多
关键词 模糊-粗糙集 模糊-粗糙隶属函数 k-近邻方法 文本分类 邻域空间
在线阅读 下载PDF
基于模糊邻域判别指数的在线流组特征选择 被引量:3
19
作者 徐久成 孙元豪 韩子钦 《计算机工程与设计》 北大核心 2024年第3期806-813,共8页
在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数... 在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数,用于描述模糊邻域粒的判别信息,扩展相关的不确定性度量方法。在此基础上,用组内特征选择和组间特征选择两种策略选择具有强近似能力且非冗余的特征。在8个公共数据集上进行对比实验,验证了该算法具有更优且稳定的分类性能。 展开更多
关键词 特征选择 流特征选择 流组 模糊粗糙集 模糊邻域 邻域判别指数 不确定性度量
在线阅读 下载PDF
模糊粗糙集的LIFT数据分析 被引量:1
20
作者 梁绍宸 徐苏平 +2 位作者 窦慧莉 李洪梅 杨习贝 《小型微型计算机系统》 CSCD 北大核心 2018年第5期1052-1057,共6页
在多标记学习中,因为不同的标记拥有与其自身紧密相关的特性,所以可以利用LIFT策略来处理多标记问题,其过程包含两个步骤:首先根据不同标记构建类属属性,然后在类属属性空间上进行分类.然而由于利用LIFT所构建的类属属性维度较高,会致... 在多标记学习中,因为不同的标记拥有与其自身紧密相关的特性,所以可以利用LIFT策略来处理多标记问题,其过程包含两个步骤:首先根据不同标记构建类属属性,然后在类属属性空间上进行分类.然而由于利用LIFT所构建的类属属性维度较高,会致使分类模型训练变慢或泛化能力不足.为解决这一问题,借助传统与稳健的模糊粗糙集模型,提出了对类属属性空间进行特征选择,并在此基础上利用模糊粗糙分类器进行多标记预测的模糊粗糙LIFT方法.实验结果表明,新算法不仅可以有效地降低类属属性空间维度,而且在压缩后的类属属性空间中,分类性能将有所提升. 展开更多
关键词 类属属性 多标记学习 模糊粗糙集 特征选择
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部