期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
融合概率类别特征增强的短文本分类
1
作者 廖列法 李奎 姚秀 《计算机工程与设计》 北大核心 2024年第7期2074-2081,共8页
对短文本所含信息量缺乏而导致分类准确度难以提升的问题进行研究,提出一种融合概率类别特征增强的短文本分类网络模型FT_BDCNN。将N-gram处理后产生的N元词典通过TF-IDF分离出具有概率类别区分度的特征信息(FT模块);将向量化表示后的... 对短文本所含信息量缺乏而导致分类准确度难以提升的问题进行研究,提出一种融合概率类别特征增强的短文本分类网络模型FT_BDCNN。将N-gram处理后产生的N元词典通过TF-IDF分离出具有概率类别区分度的特征信息(FT模块);将向量化表示后的文本信息输入到改进后的特征提取模块中;将两个模块的输出进行特征融合,完成文本分类。实验结果表明,所提模型在THUCNews数据集上的F1值达到91.91%。FT模块可以与现有分类模型进行融合,提升模型的分类性能。 展开更多
关键词 类别特征增强 短文本 双池化 特征融合 统计算法 快速分类 深度学习
在线阅读 下载PDF
基于对比学习和注意力机制的文本分类方法 被引量:4
2
作者 钱来 赵卫伟 《计算机工程》 CAS CSCD 北大核心 2024年第7期104-111,共8页
文本分类作为自然语言处理领域的基本任务,在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息,导致学到的文本特征不够全面。为了充分利用训练实例信息,提出一种基于对... 文本分类作为自然语言处理领域的基本任务,在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息,导致学到的文本特征不够全面。为了充分利用训练实例信息,提出一种基于对比学习和注意力机制的文本分类方法。首先,设计一种有监督对比学习训练策略,旨在优化模型对文本向量表征的检索,提高模型在推理过程中检索到的训练实例的质量;然后,构建注意力机制,对获取的训练文本特征进行注意力分布学习,聚焦关联性更强的相邻实例信息,获得更多隐含的相似特征;最后,将注意力机制与模型网络相结合,融合相邻的训练实例信息,增强模型提取多样性特征的能力,实现全局特征和局部特征的提取。实验结果表明,所提方法在卷积神经网络(CNN)、双向长短期记忆网络(Bi LSTM)、图卷积网络(GCN)、BERT和Ro BERTa等多个模型上都取得了显著的性能提升。以CNN模型为例,其在THUCNews数据集、今日头条数据集和搜狗数据集上宏F1值分别提高了4.15、6.2和1.92个百分点。因此,该方法也为文本分类任务提供了一种有效的解决方案。 展开更多
关键词 文本分类 深度模型 对比学习 近似最近邻算法 注意力机制
在线阅读 下载PDF
ID4TST:基于融合数据集的文本风格迁移模型
3
作者 顾亦然 薛宇辰 张腾飞 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2338-2344,共7页
文本风格迁移是自然语言处理的一项新兴任务,旨在改变文本的风格属性并保持其语义不变,本文对写作风格的迁移进行研究.在较小规模数据集上训练的风格迁移模型虽然能根据源文本生成具有目标的写作风格的文本,但是却无法很好地保留源文本... 文本风格迁移是自然语言处理的一项新兴任务,旨在改变文本的风格属性并保持其语义不变,本文对写作风格的迁移进行研究.在较小规模数据集上训练的风格迁移模型虽然能根据源文本生成具有目标的写作风格的文本,但是却无法很好地保留源文本的内容.本文将多个数据集融合进一个训练集,利用更大规模的数据增强模型抽取高级语义特征的能力,同时加入启发式语言模板用于区分不同的数据集.此外,本文还改进了作家归属分类器的分类算法进行写作风格的量化.实验结果表明,本文提出的方法生成的文本不仅能在一定程度上更接近目标写作风格,并且在源文本内容保存和通顺程度方面都优于其他模型. 展开更多
关键词 文本风格迁移 写作风格 融合数据集 启发式语言模板 分类算法
在线阅读 下载PDF
基于句法CYK图神经网络的知识增强文本分类 被引量:1
4
作者 章巍 陈学奇 +2 位作者 韩剑锋 虞小江 吴海燕 《计算机应用》 CSCD 北大核心 2024年第S01期11-17,共7页
句子分类方法主要分为基于特征工程的机器学习方法、序列化模型和结构化模型,但基于特征工程的机器学习方法对词序不敏感易产生稀疏向量,序列化模型忽略了句子的短语、依存关系等句法结构信息,结构化模型如句法树、二叉树等的准确率受... 句子分类方法主要分为基于特征工程的机器学习方法、序列化模型和结构化模型,但基于特征工程的机器学习方法对词序不敏感易产生稀疏向量,序列化模型忽略了句子的短语、依存关系等句法结构信息,结构化模型如句法树、二叉树等的准确率受句法解析工具影响。针对上述问题,构建基于句法CYK(Cocke Younger Kasami)图神经网络(GNN)的知识增强文本分类模型S-CYK,对输入句子分别构建对应的短语树和CYK图以形成句法CYK图,并利用关系图注意力网络(RGAT)进行句子分类。在公共数据集AG’s News、DBpedia、ARP(Amazon Review Polarity)和ARF(Amazon Review Full)上的实验结果表明,与现有先进模型半监督变分自编码器(SSVAE)、对抗性微调BERT(AFTB)、基于GloVe的ABLSTM(GloVe+ABLSTM)和融合FastText的CNN(CNN with FastText)相比,S-CYK模型在4个数据集的准确率提升了0.04%~1.21%。S-CYK使用句法CYK图结构进行知识增强,能有效增强聚合句子信息的能力。 展开更多
关键词 句法知识 CYK算法 知识增强 图神经网络 文本分类
在线阅读 下载PDF
面向低资源的无人机指令意图识别算法及半实物仿真
5
作者 刘鸿福 付雅晶 +1 位作者 张万鹏 张虎 《系统仿真学报》 CAS CSCD 北大核心 2024年第12期2894-2905,共12页
在通信网络部分失能或被干扰时,无人机陷入“低资源环境”,必须依赖本地硬件资源,面临着计算能力、存储空间和能源供应的限制。针对“低资源环境”下的无人机指令意图识别研究需求,设计并实现了一个应急救灾场景中无人机指令意图识别半... 在通信网络部分失能或被干扰时,无人机陷入“低资源环境”,必须依赖本地硬件资源,面临着计算能力、存储空间和能源供应的限制。针对“低资源环境”下的无人机指令意图识别研究需求,设计并实现了一个应急救灾场景中无人机指令意图识别半实物仿真系统。基于“低资源环境”的机载硬件在环,通过GIS+BIM三维环境建模任务场景,半实物仿真无人机指令意图识别与任务规划。针对核心功能指令意图识别提出了一种新的轻量化算法,基于GraphSAGE的全局句子结构信息抽取与FastText局部语义特征的共同注意力融合机制,优化提升了意图理解预测的准确率和响应速度。在构建的专业无人机指令意图数据集上,半实物仿真验证指令意图识别准确率为0.890 7、时间为58.808 ms,满足实时性要求。 展开更多
关键词 无人机 低资源环境 指令意图识别 文本分类 轻量化算法 半实物仿真
在线阅读 下载PDF
应用特征聚合进行中文文本分类的改进KNN算法 被引量:59
6
作者 张晓辉 李莹 +1 位作者 王华勇 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期229-232,共4页
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传... 针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 。 展开更多
关键词 改进KNN算法 中文文本分类 分类贡献模式 特征聚合
在线阅读 下载PDF
基于文本内容的敏感数据识别方法研究与实现 被引量:18
7
作者 李伟伟 张涛 +3 位作者 林为民 邓松 时坚 汪晨 《计算机工程与设计》 CSCD 北大核心 2013年第4期1202-1206,共5页
为了防止敏感数据的泄露,为数据的访问控制提供依据,提出并实现了一种基于中文文本内容的敏感数据识别方法。通过对敏感数据库和已知分类文档库的学习,完成对文本中敏感数据识别的阙值的确定和未知文档是否敏感数据的判断过程。描述了... 为了防止敏感数据的泄露,为数据的访问控制提供依据,提出并实现了一种基于中文文本内容的敏感数据识别方法。通过对敏感数据库和已知分类文档库的学习,完成对文本中敏感数据识别的阙值的确定和未知文档是否敏感数据的判断过程。描述了预处理、文本识别、阙值确定的详细设计和实现过程。通过对搜狗语料库中教育相关部分文本的识别,验证该方法的敏感数据识别过程简单实用并且具有较高的正确率。 展开更多
关键词 敏感数据 文本识别 内容识别 数据防泄漏 分类算法
在线阅读 下载PDF
基于上下文重构的短文本情感极性判别研究 被引量:22
8
作者 杨震 赖英旭 +1 位作者 段立娟 李玉鑑 《自动化学报》 EI CSCD 北大核心 2012年第1期55-67,共13页
文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层表达之间巨大的语义鸿沟.本文尝试借由时间、空间、联系等要素挖掘文本间隐含的关联关系,重构文本上下文范畴,提升情感极... 文本对象所固有的多义性,面对短文本特征稀疏和上下文缺失的情况,现有处理方法无法明辨语义,形成了底层特征和高层表达之间巨大的语义鸿沟.本文尝试借由时间、空间、联系等要素挖掘文本间隐含的关联关系,重构文本上下文范畴,提升情感极性分类性能.具体做法对应一个两阶段处理过程:1)基于短文本的内在联系将其初步重组成上下文(领域);2)将待处理短文本归入适合的上下文(领域)进行深入处理.首先给出了基于NaiveBayes分类器的短文本情感极性分类基本框架,揭示出上下文(领域)范畴差异对分类性能的影响.接下来讨论了基于领域归属划分的文本情感极性分类增强方法,并将领域的概念扩展为上下文关系,提出了基于特殊上下文关系的文本情感极性判别方法.同时为了解决由于信息缺失所造成的上下文重组困难,给出基于遗传算法的任意上下文重组方案.理论分析表明,满足限制条件的前提下,基于上下文重构的情感极性判别方法能够同时降低抽样误差(Sample error)和近似误差(Approximation error).真实数据集上的实验结果也验证了理论分析的结论. 展开更多
关键词 舆情分析 短文本处理 情感计算 误差分析 遗传算法
在线阅读 下载PDF
云计算环境下朴素贝叶斯文本分类算法的实现 被引量:21
9
作者 江小平 李成华 +1 位作者 向文 张新访 《计算机应用》 CSCD 北大核心 2011年第9期2551-2554,2566,共5页
采用分布式编程MapReduce模型研究了文本统一格式预处理、训练、测试以及分类等基于朴素贝叶斯文本分类算法主要计算过程的MapReduce并行化方法,并在Hadoop云计算平台进行了实验。实验结果表明:朴素贝叶斯文本分类算法MapReduce并行化后... 采用分布式编程MapReduce模型研究了文本统一格式预处理、训练、测试以及分类等基于朴素贝叶斯文本分类算法主要计算过程的MapReduce并行化方法,并在Hadoop云计算平台进行了实验。实验结果表明:朴素贝叶斯文本分类算法MapReduce并行化后在Hadoop云计算平台上部署运行,具有较好的加速比,对中文网页文本分类识别率达到了86%。 展开更多
关键词 云计算 并行计算 MapReduce编程模型 文本分类 朴素贝叶斯算法
在线阅读 下载PDF
文本自动分类中特征权重算法的改进研究 被引量:57
10
作者 徐凤亚 罗振声 《计算机工程与应用》 CSCD 北大核心 2005年第1期181-184,220,共5页
文章研究并改进了文本自动分类中的特征权重算法。传统的特征权重算法着重于考虑频率和反文档频率等因素,而未考虑特征的类间、类内分布与低频高权信息。该文重点研究了特征的类间、类内分布,以及低频高权特征对分类的影响,并在此基础... 文章研究并改进了文本自动分类中的特征权重算法。传统的特征权重算法着重于考虑频率和反文档频率等因素,而未考虑特征的类间、类内分布与低频高权信息。该文重点研究了特征的类间、类内分布,以及低频高权特征对分类的影响,并在此基础上提出了低频高权特征集的构造方法及特征权重的新算法,同时将该算法推广到多层次分类体系。实验证明该算法能有效提高分类的精确度,而且在多级分类中也能取得很好的效果。 展开更多
关键词 特征项 权重算法 分布信息 低频高权特征 文本分类
在线阅读 下载PDF
基于自训练EM算法的半监督文本分类 被引量:17
11
作者 张博锋 白冰 苏金树 《国防科技大学学报》 EI CAS CSCD 北大核心 2007年第6期65-69,共5页
为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文... 为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文本分类实验表明STEM算法在大部分情况下的分类准确性都高于EM,并通过减少迭代提高了分类器学习的计算效率。 展开更多
关键词 半监督学习 EM算法 自训练 文本分类 NAIVE BAYES
在线阅读 下载PDF
直接验证的封装式特征选择方法 被引量:7
12
作者 汪文勇 刘川 +2 位作者 赵强 沈晓明 丘晓彤 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第4期607-615,共9页
封装式特征选择算法可以准确地选择出有价值的特征,但是其评价过程伴随着极大的时间复杂度。为此,该文针对封装式特征选择算法中时间复杂度最高的交叉验证评价环节,提出了可以替代交叉验证的特征集直接评价方法——LW测量。进一步,将该... 封装式特征选择算法可以准确地选择出有价值的特征,但是其评价过程伴随着极大的时间复杂度。为此,该文针对封装式特征选择算法中时间复杂度最高的交叉验证评价环节,提出了可以替代交叉验证的特征集直接评价方法——LW测量。进一步,将该方法与封装式特征选择算法中常用的序列搜索策略相结合,提出了改进的序列前(后)向搜索特征选择算法SFS-LW(SBS-LW)。通过在2个UCI数据集上与传统的基于交叉验证的封装式特征选择算法进行3组对比实验,结果表明该改进特征选择方法具有与传统方法近似的分类精度,但在时间复杂度上则有数倍的改善。 展开更多
关键词 特征选择 序列搜索算法 分类 时间复杂度 封装式方法
在线阅读 下载PDF
一种新的基于统计的自动文本分类方法 被引量:48
13
作者 刘斌 黄铁军 +1 位作者 程军 高文 《中文信息学报》 CSCD 北大核心 2002年第6期18-24,共7页
自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上... 自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上提取文档的统计特征 ,能够更好地反映文档的统计分布。基于核的距离加权KNN算法解决了样本的多峰分布、边界重叠问题和分类器的精确分类决策问题。实际应用中 ,互联网和文本库提供了大量经过粗分类的训练文本 ,但普遍存在样本质量较差的问题 ,本文通过样本重要性分析技术解决此问题。实验系统证明了新方法的有效性。 展开更多
关键词 统计 自动文本分类 多层次特征提取 距离加权KNN算法 样本重要性分析 汉字识别
在线阅读 下载PDF
基于语义与最大匹配度的短文本分类研究 被引量:18
14
作者 孙建旺 吕学强 张雷瀚 《计算机工程与设计》 CSCD 北大核心 2013年第10期3613-3618,共6页
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出... 为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法。以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类。实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高。 展开更多
关键词 短文本分类 义原相似度 词语相似度 语义 最大匹配度 KNN算法
在线阅读 下载PDF
基于区域划分的kNN文本快速分类算法研究 被引量:23
15
作者 胡元 石冰 《计算机科学》 CSCD 北大核心 2012年第10期182-186,共5页
kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用。为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法。将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最... kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用。为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法。将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最近邻,从而大大降低kNN算法的计算量。数学推理和实验结果均表明,该算法在确保kNN分类器准确率不变的前提下,显著提高了分类效率。 展开更多
关键词 文本分类 KNN算法 聚类 K-均值算法
在线阅读 下载PDF
文本分类中一种基于密度的KNN改进方法 被引量:4
16
作者 刘海峰 汪泽焱 +1 位作者 姚泽清 刘守生 《情报学报》 CSSCI 北大核心 2009年第6期834-838,共5页
特征降维与分类算法的性能是文本自动分类的两个主要问题。KNN算法以其简单、有效、非参数特点常用于文本分类,但是训练文本分布的不均匀对KNN的分类效果产生负面影响,而在实际应用中训练文本分布不均是常见现象。本文针对这种分类环境... 特征降维与分类算法的性能是文本自动分类的两个主要问题。KNN算法以其简单、有效、非参数特点常用于文本分类,但是训练文本分布的不均匀对KNN的分类效果产生负面影响,而在实际应用中训练文本分布不均是常见现象。本文针对这种分类环境,首先提出了一种改进的tf-idf赋权方法用于特征降维,在此基础上进一步提出了一种基于密度的改进KNN方法用于文本分类,使处于样本点分布较密集区域的样本点之间的距离增大。随后的文本分类试验表明,本文提出的方法基于密度的KNN方法具有较好的文本分类效果。 展开更多
关键词 TF-IDF 文本分类 KNN算法 特征降维
在线阅读 下载PDF
基于组合分类算法的源代码注释质量评估方法 被引量:7
17
作者 余海 李斌 +2 位作者 王培霞 贾荻 王永吉 《计算机应用》 CSCD 北大核心 2016年第12期3448-3453,3467,共7页
源代码注释是软件的重要组成部分,研究者往往需要利用人工或自动化的方法产生分析注释,注释的质量评估也往往是通过人工来完成,这无疑是低效不客观的。为此,首先从注释的格式、语言形式、内容以及与代码相关度4个方面出发构建注释评估准... 源代码注释是软件的重要组成部分,研究者往往需要利用人工或自动化的方法产生分析注释,注释的质量评估也往往是通过人工来完成,这无疑是低效不客观的。为此,首先从注释的格式、语言形式、内容以及与代码相关度4个方面出发构建注释评估准则;进而,基于这一准则提出了一种基于组合分类算法的注释质量评估方法。该方法将机器学习以及自然语言处理技术引入到注释质量评估中来,利用分类算法将注释分为不合格、合格、良好、优秀四个等级。通过对基本分类算法的组合使用,使得评估效果进一步提高。组合分类算法的准确率和F1值较单独使用某一种分类算法提高20个百分点左右,除宏平均F1值外,各项指标都达到了70%以上。实验结果表明,所提方法能够很好地应用于注释质量评估。 展开更多
关键词 源码注释 质量评估 文本分类 组合算法 自然语言处理
在线阅读 下载PDF
遗传-粒子群的投影寻踪模型 被引量:11
18
作者 万中英 廖海波 王明文 《计算机工程与应用》 CSCD 北大核心 2010年第20期210-212,240,共4页
以前的投影寻踪研究都是采用遗传算法来寻找最优的投影方向,但遗传算法对初始种群的选择有一定的依赖性,收敛速度较慢,而且得到的也未必是最优解。粒子群算法是一种模拟鸟群飞行觅食的行为,通过个体之间的协作来寻找最优解的进化计算技... 以前的投影寻踪研究都是采用遗传算法来寻找最优的投影方向,但遗传算法对初始种群的选择有一定的依赖性,收敛速度较慢,而且得到的也未必是最优解。粒子群算法是一种模拟鸟群飞行觅食的行为,通过个体之间的协作来寻找最优解的进化计算技术。根据遗传算法和粒子群算法的优缺点,将两者有效地结合在一起,提出了遗传-粒子群的投影寻踪模型。该方法能有效地解决投影寻踪模型中投影方向的寻优问题,并将该方法应用于文本分类,在Reuters-21578文档集上分别采用KNN和朴素贝叶斯方法进行实验,结果表明此方法能有效提取投影方向,取得了满意的分类效果,也提高了算法收敛到最优解的能力。 展开更多
关键词 遗传算法 粒子群算法 投影方向 投影寻踪 文本分类
在线阅读 下载PDF
基于改进K最近邻分类算法的不良网页并行识别 被引量:6
19
作者 徐雅斌 李卓 陈俊伊 《计算机应用》 CSCD 北大核心 2013年第12期3368-3371,3379,共5页
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处... 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 展开更多
关键词 不良网页 文本分类 K最近邻分类算法 HADOOP MAPREDUCE
在线阅读 下载PDF
关联文本分类的规则修正策略 被引量:6
20
作者 邱江涛 唐常杰 +1 位作者 曾涛 刘胤田 《计算机研究与发展》 EI CSCD 北大核心 2009年第4期683-688,共6页
通过分析基于关联规则的文本分类,发现在保持分类规则对正例样本正确分类的同时减少对反例样本的错误分类可以提高分类的精确度.基于否定选择算法的思想提出了分类规则修正策略,用反例样本集合对分类规则进行耐受,从分类规则错误判别的... 通过分析基于关联规则的文本分类,发现在保持分类规则对正例样本正确分类的同时减少对反例样本的错误分类可以提高分类的精确度.基于否定选择算法的思想提出了分类规则修正策略,用反例样本集合对分类规则进行耐受,从分类规则错误判别的反例样本中再产生规则,与原来的规则组成新规则,称为增强关联规则.基于修正策略产生的增强关联规则可以大幅度地减少对反例样本的错误分类,从而提高分类的精确度.通过形式化证明和实验,分类规则修正策略的有效性得到验证. 展开更多
关键词 关联规则 增强关联规则 文本分类 否定选择算法 规则修正
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部