期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
融合特征选择与多模型软投票集成学习的代码异味检测方法 被引量:1
1
作者 黄晨峻 高建华 《小型微型计算机系统》 北大核心 2025年第2期504-512,共9页
代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,... 代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%. 展开更多
关键词 代码异味 特征选择 CK度量 投票模型 集成学习
在线阅读 下载PDF
基于特征选择的集成极限学习机故障辨识方法
2
作者 马驰 赵荣珍 +1 位作者 原健辉 郑玉巧 《兰州理工大学学报》 北大核心 2025年第2期44-50,共7页
针对传统极限学习机神经网络在处理复杂数据时无法获得最佳分类性能的问题,提出了基于特征选择的集成极限学习机故障辨识方法.首先,选择合适的尺度对振动信号进行粗粒化分解,在不同尺度上计算振动信号的模糊近似熵,并构成高维数据集.然... 针对传统极限学习机神经网络在处理复杂数据时无法获得最佳分类性能的问题,提出了基于特征选择的集成极限学习机故障辨识方法.首先,选择合适的尺度对振动信号进行粗粒化分解,在不同尺度上计算振动信号的模糊近似熵,并构成高维数据集.然后,通过邻域粗糙集算法对高维数据集进行属性约简,并且采用不同的邻域半径对数据集进行约简,从而产生不同的特征子集,同时将每个特征子集划分为训练集和测试集,进而输入极限学习机进行模式识别.最后,整合多个极限学习机的预测结果,依据相对多数投票法决定最终的辨识结果.实验证明,相比传统极限学习机,该方法可以提高滚动轴承故障类别的辨识精度,使故障分类结果更准确、更有效. 展开更多
关键词 模糊近似熵 特征选择 分类集成 极限学习机
在线阅读 下载PDF
基于特征过滤法和Stacking集成学习的无人机影像作物精细分类
3
作者 刘朝辉 杨风暴 张琳 《现代电子技术》 北大核心 2025年第7期1-10,共10页
针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取... 针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取不同作物的颜色和纹理特征,进而计算单类作物特征系数和作物间特征差异系数,实现各典型作物的分类特征过滤法优选;最后,构建融合多种机器学习算法的Stacking集成学习作物分类模型,其中第一层的基学习器选择随机森林、支持向量机、K⁃最近邻算法,第二层的元学习器选择逻辑回归模型,实现多种典型作物精细分类。实验结果表明,所提方法对7种典型作物的总体分类精度和Kappa系数分别为85.2%和83.34%,相比于未进行特征选择的分类结果分别提升了2.18%和3.68%,具有较高的分类精度,为多种典型作物的精细分类提供了新方法。 展开更多
关键词 作物分类 特征选择 Stacking集成学习 植被指数 阈值分割 衍生特征
在线阅读 下载PDF
一种基于递归分类树的集成特征基因选择方法 被引量:26
4
作者 李霞 张田文 郭政 《计算机学报》 EI CSCD 北大核心 2004年第5期675-682,共8页
利用DNA芯片基因表达谱信息识别疾病相关基因 ,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义 .该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (EnsembleFeatureSelectionbasedonRecursivePartition Tree) .EFS... 利用DNA芯片基因表达谱信息识别疾病相关基因 ,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义 .该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (EnsembleFeatureSelectionbasedonRecursivePartition Tree) .EFST可选择多组基于不同样本分布结构的特征基因 ,结合有监督机器学习中的多分类器集成 (ensemble)决策技术 ,利用提出的衡量特征基因稳定性与显著性测度 ,集成各特征基因组选择最终的特征基因 .应用结肠癌 2 0 0 0个基因的表达谱实验数据分析结果显示 :EFST方法不仅具有寻找疾病相关基因的能力和较强的数据维数压缩能力 ,而且由支持向量机 (SVM)等 4种模式分类方法证实EFST方法可以明显地提高疾病鉴别分类的准确率 . 展开更多
关键词 递归分类 特征选择 集成决策 EFST 基因表达谱 生物技术 基因芯片 信息识别
在线阅读 下载PDF
用于阿尔茨海默症分类的模糊逻辑特征选择和异质集成学习方法 被引量:2
5
作者 韩亮 杨婷 +1 位作者 蒲秀娟 黄谦 《电子与信息学报》 EI CSCD 北大核心 2021年第11期3319-3326,共8页
阿尔茨海默症(AD)分类有助于在AD早期阶段及时采取针对性的治疗和干预措施,对降低老年群体的AD发病率和延缓AD疾病进展具有重要意义。该文提出一种改进的高斯模糊逻辑特征选择方法,首先采用互信息量和方差齐性分析两种方法给出特征重要... 阿尔茨海默症(AD)分类有助于在AD早期阶段及时采取针对性的治疗和干预措施,对降低老年群体的AD发病率和延缓AD疾病进展具有重要意义。该文提出一种改进的高斯模糊逻辑特征选择方法,首先采用互信息量和方差齐性分析两种方法给出特征重要性评分并分别进行归一化,然后使用改进的高斯模糊逻辑方法对其加权得到最终的特征重要性评分,最后依据特征重要性评分选取特征。该文还使用逻辑回归、随机森林、LightGBM、支持向量机和深度前馈网络作为初级分类器,多项式朴素贝叶斯分类器作为次级分类器,构建异质集成分类器,利用选取的特征进行AD分类。在TADPOLE数据集上进行实验,实验结果证实了所提特征选择方法是有效的,且采用所提特征选择方法,基于多项式朴素贝叶斯的异质集成分类器在AD分类上的性能要优于传统分类器。 展开更多
关键词 阿尔茨海默症 模糊逻辑 特征选择 多项式朴素贝叶斯 异质集成分类
在线阅读 下载PDF
集成特征选择的广义粗集方法与多分类器融合 被引量:10
6
作者 孙亮 韩崇昭 +1 位作者 沈建京 戴宁 《自动化学报》 EI CSCD 北大核心 2008年第3期298-304,共7页
为改善多分类器系统的分类性能,提出了基于广义粗集的集成特征选择方法.为在集成特征选择的同时获取各特征空间中的多类模式可分性信息,研究并提出了关于多决策表的相对优势决策约简,给出了关于集成特征选择的集成属性约简(Ensemble att... 为改善多分类器系统的分类性能,提出了基于广义粗集的集成特征选择方法.为在集成特征选择的同时获取各特征空间中的多类模式可分性信息,研究并提出了关于多决策表的相对优势决策约简,给出了关于集成特征选择的集成属性约简(Ensemble attribute reduction,EAR)方法,结合基于知识发现的KD-DWV算法进行了高光谱遥感图像植被分类比较实验.结果表明,EAR方法与合适的多分类器融合算法结合可有效提高多分类器融合的推广性. 展开更多
关键词 集成特征选择 分类器融合 广义粗集 高光谱
在线阅读 下载PDF
一种集成NER的文本分类特征选择方法 被引量:3
7
作者 施德明 林洋港 陈恩红 《计算机工程与科学》 CSCD 2007年第11期152-156,共5页
文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征是影响文本分类器分类性能的一个重要步骤。很多应用中需要处理的文本信息包含了很多的命名实体,如某个行业的名人... 文本分类是将自由文本自动划分到若干预先定义类别的方法,在信息检索等领域有很重要的作用。其中,如何选择有效的文本特征是影响文本分类器分类性能的一个重要步骤。很多应用中需要处理的文本信息包含了很多的命名实体,如某个行业的名人,往往能够在很大程度上影响着文本所属的类别。然而,现阶段的文本特征方法都只利用关键词的统计意义,而没有考虑关键词作为命名实体所含有的分类特征。针对这一问题,本文提出了一种将命名实体识别方法NER集成到文本分类特征选择中的方法,在保留关键词统计特征之外,还保留了单词作为命名实体的分类特征。实验结果表明,相对于其他特征选择方法而言,本文提出的方法在一定程度上提高了文本分类的分类准确率。 展开更多
关键词 命名实体识别 命名实体 特征选择 文本分类 隐马尔可夫模型
在线阅读 下载PDF
图像分类卷积神经网络的特征选择模型压缩方法(英文) 被引量:8
8
作者 邹月娴 余嘉胜 +2 位作者 陈泽晗 陈锦 王毅 《控制理论与应用》 EI CAS CSCD 北大核心 2017年第6期746-752,共7页
深度卷积神经网络(convolutional neural networks,CNN)作为特征提取器(feature extractor,CNN-FE)已被广泛应用于许多领域并获得显著成功.根据研究评测可知CNN-FE具有大量参数,这大大限制了CNN-FE在如智能手机这样的内存有限的设备上... 深度卷积神经网络(convolutional neural networks,CNN)作为特征提取器(feature extractor,CNN-FE)已被广泛应用于许多领域并获得显著成功.根据研究评测可知CNN-FE具有大量参数,这大大限制了CNN-FE在如智能手机这样的内存有限的设备上的应用.本文以AlexNet卷积神经网络特征提取器为研究对象,面向图像分类问题,在保持图像分类性能几乎不变的情况下减少CNN-FE模型参数量.通过对AlexNet各层参数分布的详细分析,作者发现其全连接层包含了大约99%的模型参数,在图像分类类别较少的情况,AlexNet提取的特征存在冗余.因此,将CNN-FE模型压缩问题转化为深度特征选择问题,联合考虑分类准确率和压缩率,本文提出了一种新的基于互信息量的特征选择方法,实现CNN-FE模型压缩.在公开场景分类数据库以及自建的无线胶囊内窥镜(wireless capsule endoscope,WCE)气泡图片数据库上进行图像分类实验.结果表明本文提出的CNN-FE模型压缩方法减少了约83%的AlexNet模型参数且其分类准确率几乎保持不变. 展开更多
关键词 卷积神经网络 图像分类 特征提取 特征选择 模型压缩
在线阅读 下载PDF
特征选择和聚类分析的图像分类模型 被引量:1
9
作者 汤海林 林亚松 张大斌 《现代电子技术》 2021年第8期45-48,共4页
传统方法因图像自身存在较大复杂性,导致分类精度不符合实际图像分类需求。该文通过构建基于特征选择和聚类分析的图像分类模型,提取图像特征建立图像特征样本集;在图像特征样本集中使用基于主成分分析的核心特征量选取方法,获取图像的... 传统方法因图像自身存在较大复杂性,导致分类精度不符合实际图像分类需求。该文通过构建基于特征选择和聚类分析的图像分类模型,提取图像特征建立图像特征样本集;在图像特征样本集中使用基于主成分分析的核心特征量选取方法,获取图像的核心特征;使用均值聚类算法聚类图像的全部核心特征,构建图像核心特征训练样本;最后将该样本使用基于支持向量机的图像分类模型,实现图像分类。经测试,当所构建模型的权重指数为0.9时,对医学图像分类精度高达98.51%;分类差异图像时,所构建模型分类准确度较高,且拒分度低于同类分析模型。 展开更多
关键词 图像分类模型 特征选择 聚类分析 图像特征聚类 训练样本构建 分类性能测试
在线阅读 下载PDF
融合多特征与互信息选择集成多核极限学习机的影像分类方法 被引量:3
10
作者 杨素妨 曾红春 《遥感信息》 CSCD 北大核心 2021年第1期56-60,共5页
针对影像分类结果的类间差异性与准确性难以平衡的问题,提出一种融合多特征与互信息选择集成多核极限学习机的影像分类方法。该方法首先利用最小噪声分离提取影像的光谱特征,考虑到高分辨率影像局部细节信息清晰,利用LBP算子提取影像的... 针对影像分类结果的类间差异性与准确性难以平衡的问题,提出一种融合多特征与互信息选择集成多核极限学习机的影像分类方法。该方法首先利用最小噪声分离提取影像的光谱特征,考虑到高分辨率影像局部细节信息清晰,利用LBP算子提取影像的局部纹理信息,采用泛化性能好的核极限学习机训练多个弱分类器;然后,通过引入相关性准则描述准确性,冗余性准则描述差异性,将选择性集成多核极限学习机问题转化为变量选择问题;最后,利用基于互信息的最大相关最小冗余准则,对生成的多核极限学习机进行选择,从而实现影像分类结果差异性与准确性的平衡。文章采用高分二号数据实验,总体分类精度和Kappa系数分别为92.03%、0.9。分析结果表明,该方法能够利用多种特征的分类优势,进而有效改善了高分二号影像的分类结果。 展开更多
关键词 融合多特征 互信息 选择集成 极限学习机 影像分类
在线阅读 下载PDF
基于多粒度特征选择和模型融合的复合电能质量扰动分类特征优化 被引量:22
11
作者 阮梓航 肖先勇 +2 位作者 胡文曦 郑子萱 汪颖 《电力系统保护与控制》 EI CSCD 北大核心 2022年第14期1-10,共10页
现代电力系统因其“双高”特性造成电能质量扰动模式愈加复杂,对复合扰动的准确分类提出了挑战。传统电能质量扰动分类方法在特征提取阶段所提取的特征由人为确定,难以判断所提取的特征对分类问题是否有效,加之多重复合扰动特征相互耦... 现代电力系统因其“双高”特性造成电能质量扰动模式愈加复杂,对复合扰动的准确分类提出了挑战。传统电能质量扰动分类方法在特征提取阶段所提取的特征由人为确定,难以判断所提取的特征对分类问题是否有效,加之多重复合扰动特征相互耦合导致扰动特征的可分性确定困难。为此,提出一种基于粒度的计算方法进行特征选择的模型。在提取的扰动特征集的基础上,通过构建多粒度空间反映特征分布差异性,进而挖掘各粒度下的最优特征子集以确定有效和冗余的分类特征,达到优化分类效果的目的。在此基础上,通过集成分类模型融合不同粒度空间最优扰动特征集所训练的同质弱分类器模型,提出一种新的电能质量扰动多粒度集成分类方法。该方法克服了现有方法在进行多粒度分类时通过寻找最优单粒度空间特征而导致的其他粒度空间信息丢失的问题。实验表明,多粒度特征选择算法可提取对分类有效的扰动特征,集成分类模型可进一步改善模型的分类性能。 展开更多
关键词 电能质量 复合扰动 特征选择 多粒度空间 集成分类
在线阅读 下载PDF
一种处理不均衡多分类问题的特征选择集成方法 被引量:2
12
作者 宿晨 徐华 +1 位作者 崔鑫 王玲娣 《重庆大学学报》 CSCD 北大核心 2022年第5期125-134,共10页
为解决不均衡多分类问题,提出一种特征选择和AdaBoost的集成方法。首先,数据进行预处理。利用WSPSO算法进行特征选择,根据特征重要性选取初始粒子构建初始种群,使得算法初期就可以沿着正确的搜索方向开展,减少不相关特征的影响。其次,利... 为解决不均衡多分类问题,提出一种特征选择和AdaBoost的集成方法。首先,数据进行预处理。利用WSPSO算法进行特征选择,根据特征重要性选取初始粒子构建初始种群,使得算法初期就可以沿着正确的搜索方向开展,减少不相关特征的影响。其次,利用AdaBoost算法对于样本权重较敏感的特点,增强对小类样本的关注度。并且利用AUCarea作为评价标准,相对于其他评价标准,AUCarea具有可视化的优点且对较差AUC更加敏感。最后,与其他几种不均衡分类算法在不平衡数据集上进行对比,结果证明该算法可有效处理不均衡多分类问题。 展开更多
关键词 不平衡数据 集成学习 ADABOOST 特征选择 分类
在线阅读 下载PDF
基于特征选择算法的建筑能耗预测集成模型 被引量:4
13
作者 白雪 刘刚 +3 位作者 黄蕾 钟韬 乔丹 杨执钧 《计算机工程与设计》 北大核心 2020年第10期2892-2896,共5页
为提高建筑能耗预测效果,提出一种基于随机森林特征选择算法的建筑能耗预测集成回归模型(RF-GBDT)。通过随机森林的特征选择算法处理原始数据集生成最优特征子集,使用梯度提升决策树算法将6种基础的机器学习算法建立集成回归模型,以最... 为提高建筑能耗预测效果,提出一种基于随机森林特征选择算法的建筑能耗预测集成回归模型(RF-GBDT)。通过随机森林的特征选择算法处理原始数据集生成最优特征子集,使用梯度提升决策树算法将6种基础的机器学习算法建立集成回归模型,以最优特征子集作为集成模型的输入数据集。使用评价指标RMSE和R^2将集成模型预测结果与传统集成模型以及单一机器学习算法的预测结果进行对比,实验结果验证了集成后的RF-GBDT模型比单一算法的预测性能有了大幅度提升。 展开更多
关键词 随机森林 梯度提升树 特征选择 集成回归模型 能耗预测
在线阅读 下载PDF
融合样本选择与特征选择的AdaBoost支持向量机集成算法 被引量:11
14
作者 杨宏晖 王芸 +2 位作者 孙进才 戴健 李亚安 《西安交通大学学报》 EI CAS CSCD 北大核心 2014年第12期63-68,共6页
为提高AdaBoost分类器集成算法的分类精确度并简化分类系统的复杂度,提出一种融合样本选择与特征选择的AdaBoost支持向量机集成算法(IFSelect-SVME).该算法在AdaBoost算法的每个循环中利用加权免疫克隆样本选择算法进行样本选择,并用... 为提高AdaBoost分类器集成算法的分类精确度并简化分类系统的复杂度,提出一种融合样本选择与特征选择的AdaBoost支持向量机集成算法(IFSelect-SVME).该算法在AdaBoost算法的每个循环中利用加权免疫克隆样本选择算法进行样本选择,并用互信息顺序向前特征选择算法进行特征选择,再利用每个循环优化选择得到的特征样本子集训练个体SVM分类器,并对其进行加权集成,生成最终的决策系统.对实验所用9组UCI数据集的仿真结果表明:与支持向量机集成(SVME)算法相比,IFSelect-SVME算法的正确分类率有所提高,且样本数可减少30.8%~80.0%,特征数可减少32.2%~81.5%,简化了集成结构,缩短了测试样本的分类时间,所得到的分类系统具有更好的分类精度. 展开更多
关键词 分类集成 ADABOOST算法 支持向量机 样本选择 特征选择
在线阅读 下载PDF
利用特征选择的遥感图像场景分类 被引量:7
15
作者 徐侃 陈丽君 +1 位作者 杨文 孙洪 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第9期117-121,共5页
为了提高遥感图像场景分类精度,提出了一种基于增广LDA(Latent Dirichlet Allocation)模型的特征选择算法.首先对图像进行尺度不变特征变换、颜色直方图、几何模糊特征、局域二值模式和Gabor纹理特征提取,然后引入一种改进的自动选择特... 为了提高遥感图像场景分类精度,提出了一种基于增广LDA(Latent Dirichlet Allocation)模型的特征选择算法.首先对图像进行尺度不变特征变换、颜色直方图、几何模糊特征、局域二值模式和Gabor纹理特征提取,然后引入一种改进的自动选择特征算法,通过交叉验证选出最具针对性的特征组合,再利用LDA将高维特征组合进行降维,最后使用正则化逻辑回归分类器完成场景分类.实验结果表明,与其他特征组合相比,经自动选择后的特征组合可以有效提高遥感图像场景分类的精度. 展开更多
关键词 场景分类 主题模型 特征选择 逻辑回归
在线阅读 下载PDF
基于特征贡献度的特征选择方法在文本分类中应用 被引量:9
16
作者 孟佳娜 林鸿飞 李彦鹏 《大连理工大学学报》 EI CAS CSCD 北大核心 2011年第4期611-615,共5页
在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件... 在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件,特征对于某一类别的FCD值为特征在该类中出现的文档数与在所有类别中出现的文档数的比值.对该方法进行了实验,并与一些常用的特征选择方法进行了比较,实验结果表明该方法具有更好的分类效果. 展开更多
关键词 文本分类 特征选择 向量空间模型 特征贡献度
在线阅读 下载PDF
基于特征选择和最大熵模型的汉语词义消歧 被引量:37
17
作者 何径舟 王厚峰 《软件学报》 EI CSCD 北大核心 2010年第6期1287-1295,共9页
词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在... 词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在此基础上提出一套基于最大熵分类模型的自动特征选择方法,包括针对所有歧义词的统一特征模板选择和针对单个歧义词的独立特征模板优化算法.实验结果表明,使用自动选择的特征,不仅简化了特征模板,而且提高了汉语词义消歧的性能.与SemEval2007:task#5的最好成绩相比,该方法分别在微平均值MicroAve(micro-average accuracy)和宏平均值MacroAve(macro-average accuracy)上提升了3.10%和2.96%. 展开更多
关键词 最大熵模型 分类特征 自动特征选择 汉语词义消歧
在线阅读 下载PDF
基于特征选择集成学习的果蝇求偶行为识别 被引量:3
18
作者 谢元澄 梁敬东 +2 位作者 王书平 余倩倩 李飞 《南京农业大学学报》 CAS CSCD 北大核心 2011年第6期82-88,共7页
设计一个机器学习分类算法,实现对果蝇求偶行为的自动识别。在对图片规范化的基础上,提取图像局部二元模式统计特征与沃尔什特征获得果蝇求偶图像纹理几何特征。通过基于特征选择的集成学习来构建一个强分类器,实现对果蝇求偶行为的检测... 设计一个机器学习分类算法,实现对果蝇求偶行为的自动识别。在对图片规范化的基础上,提取图像局部二元模式统计特征与沃尔什特征获得果蝇求偶图像纹理几何特征。通过基于特征选择的集成学习来构建一个强分类器,实现对果蝇求偶行为的检测;采用十折交叉验证的方法进行验证,检测结果优于传统的图像处理分割算法。基于特征选择快速选择性集成,效率高于传统集成方法,基于特征选择集成学习识别昆虫的复杂纹理是可行的。通过机器学习方法来识别果蝇行为谱可以实现大规模的行为筛查,这将有助于基因和神经回路控制行为的研究。 展开更多
关键词 特征选择 集成学习 分类 果蝇求偶
在线阅读 下载PDF
针对文本情感分类任务的textSE-ResNeXt集成模型 被引量:9
19
作者 康雁 李浩 +2 位作者 梁文韬 宁浩宇 霍雯 《计算机工程与应用》 CSCD 北大核心 2020年第7期205-209,共5页
针对深度学习方法中文本表示形式单一,难以有效地利用语料之间细化的特征的缺陷,利用中英文语料的不同特性,有区别地对照抽取中英文语料的特征提出了一种新型的textSE-ResNeXt集成模型。通过PDTB语料库对语料的显式关系进行分析,从而截... 针对深度学习方法中文本表示形式单一,难以有效地利用语料之间细化的特征的缺陷,利用中英文语料的不同特性,有区别地对照抽取中英文语料的特征提出了一种新型的textSE-ResNeXt集成模型。通过PDTB语料库对语料的显式关系进行分析,从而截取语料主要情感部分,针对不同中、英文情感词典进行情感程度关系划分以此获得不同情感程度的子数据集。在textSE-ResNeXt神经网络模型中采用了动态卷积核策略,以此对文本数据特征进行更为有效的提取,模型中融合了SEnet和ResNeXt,有效地进行了深层次文本特征的抽取和分类。将不同情感程度的子集上对textSE-ResNeXt模型采用投票集成的方法进一步提高分类效率。分别在中文酒店评论语料和六类常见英文分类数据集上进行实验。实验结果表明了本模型的有效性。 展开更多
关键词 文本情感分类 textSE-ResNeXt 特征划分 集成模型
在线阅读 下载PDF
支持向量机集成和特征选择联合算法 被引量:4
20
作者 杨宏晖 孙进才 +1 位作者 牛奕龙 赵妮 《声学技术》 CSCD 北大核心 2006年第4期337-340,共4页
提出了两种基于支持向量机集成和特征选择联合算法。联合算法的核心思想是在构建基础分类器的同时选择有效特征。通过对实测舰船数据和公共数据的识别实验,证明了两种算法都可以用于舰船目标识别。算法一更适用于冗余特征较多的情况。... 提出了两种基于支持向量机集成和特征选择联合算法。联合算法的核心思想是在构建基础分类器的同时选择有效特征。通过对实测舰船数据和公共数据的识别实验,证明了两种算法都可以用于舰船目标识别。算法一更适用于冗余特征较多的情况。算法二在对舰船目标识别时,选择的特征数目降低为原来特征数目的30%,正确分类率比单个支持向量机高近10%。 展开更多
关键词 支持向量机 特征选择 分类集成:舰船辐射噪声
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部