检索结果-维普期刊中文期刊服务平台

一种基于聚类的PU主动文本分类方法被引量：24: 1; 作者刘露彭涛 +1 位作者左万利戴耀康《软件学报》 EI CSCD 北大核心 2013年第11期2571-2583,共13页; 文本分类是信息检索的关键问题之一.提取更多的可信反例和构造准确高效的分类器是PU(positive and unlabeled)文本分类的两个重要问题.然而,在现有的可信反例提取方法中,很多方法提取的可信反例数量较少,构建的分类器质量有待提高.分别... 展开更多; 关键词 pu(FIositive and unlabeled)文本分类聚类 TFIPNDF(term FREQUENCY inverse positive negative document frequency) 主动学习可信反例改进的Rocchio; 在线阅读下载PDF 职称材料

基于支持向量机的PU中文文本分类器构建被引量：6: 2; 作者王宗尧刘金岭《南京邮电大学学报（自然科学版）》北大核心 2015年第6期100-105,共6页; 在PU文本分类中,针对文本分类中可信反例获取困难,使文本分类器性能低下的问题,提出了一种基于支持向量机的PU文本分类器的构建。该方法采用改进的特征词权值提取方法进行特征词提取,利用OB_PCZ算法从未标识文本数据集中尽可能多地移除... 展开更多; 关键词支持向量机 pu分类文本分类正例可信反例; 在线阅读下载PDF 职称材料

基于PU学习的建议语句分类方法被引量：2: 3; 作者张璞刘畅李逍《计算机应用》 CSCD 北大核心 2019年第3期639-643,共5页; 建议挖掘作为一项新兴研究任务,具有重要的应用价值。针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数据稀疏等问题,提出一种基于PU学习的建议语句分类方法。首先,使用简单规则从无标注评论集合中选择建议语... 展开更多; 关键词建议挖掘建议语句分类 pu学习自编码器多层感知机; 在线阅读下载PDF 职称材料

最大化AUC的正例未标注分类及其增量算法被引量：1: 4; 作者马毓敏王士同《计算机科学与探索》 CSCD 北大核心 2020年第11期1879-1887,共9页; 正例未标注分类简称PU分类,由于只有正例样本与未标注样本,传统的分类方法在PU分类中往往效果不甚理想。为此利用PU分类下的AUC与传统分类下的AUC关系,提出了将传统分类方法中AUC作为目标函数应用到PU分类中,利用高斯核函数将原始样本... 展开更多; 关键词机器学习 pu分类 AUC 增量算法; 在线阅读下载PDF 职称材料

题名一种基于聚类的PU主动文本分类方法被引量：24: 1; 作者刘露彭涛左万利戴耀康; 机构吉林大学计算机科学与技术学院 Department of Computer Science 符号计算与知识工程教育部重点实验室(吉林大学); 出处《软件学报》 EI CSCD 北大核心 2013年第11期2571-2583,共13页; 基金国家自然科学基金(60903098,60973040); 文摘文本分类是信息检索的关键问题之一.提取更多的可信反例和构造准确高效的分类器是PU(positive and unlabeled)文本分类的两个重要问题.然而,在现有的可信反例提取方法中,很多方法提取的可信反例数量较少,构建的分类器质量有待提高.分别针对这两个重要步骤提供了一种基于聚类的半监督主动分类方法.与传统的反例提取方法不同,利用聚类技术和正例文档应与反例文档共享尽可能少的特征项这一特点,从未标识数据集中尽可能多地移除正例,从而可以获得更多的可信反例.结合SVM主动学习和改进的Rocchio构建分类器,并采用改进的TFIDF(term frequency inverse document frequency)进行特征提取,可以显著提高分类的准确度.分别在3个不同的数据集中测试了分类结果(RCV1,Reuters-21578,20 Newsgoups).实验结果表明,基于聚类寻找可信反例可以在保持较低错误率的情况下获取更多的可信反例,而且主动学习方法的引入也显著提升了分类精度.; 关键词 pu(FIositive and unlabeled)文本分类聚类 TFIPNDF(term FREQUENCY inverse positive negative document frequency) 主动学习可信反例改进的Rocchio; Keywords positive and unlabeled （pu） text classification clustering TFIPNDF （term frequency inverse positive-negative documentfrequency） active learning reliable negative example improved Rocchio; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于支持向量机的PU中文文本分类器构建被引量：6: 2; 作者王宗尧刘金岭; 机构淮阴工学院管理工程学院淮阴工学院计算机与软件工程学院; 出处《南京邮电大学学报（自然科学版）》北大核心 2015年第6期100-105,共6页; 基金江苏省高校哲学社会科学研究(2015SJD702) 淮阴工学院科研基金(HGC1422)资助项目; 文摘在PU文本分类中,针对文本分类中可信反例获取困难,使文本分类器性能低下的问题,提出了一种基于支持向量机的PU文本分类器的构建。该方法采用改进的特征词权值提取方法进行特征词提取,利用OB_PCZ算法从未标识文本数据集中尽可能多地移除正例,从而获得更多的可信反例。结合支持向量机和改进的Rocchio构建了高效的文本分类器。实验表明,该方法比目前其它的面向PU学习的文本分类方法具有更高的分类质量。; 关键词支持向量机 pu分类文本分类正例可信反例; Keywords support vector machine pu classification text classification positive cases trusted counterexample; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于PU学习的建议语句分类方法被引量：2: 3; 作者张璞刘畅李逍; 机构重庆邮电大学计算机科学与技术学院; 出处《计算机应用》 CSCD 北大核心 2019年第3期639-643,共5页; 基金教育部人文社会科学研究青年基金资助项目(17YJCZH247) 重庆市教委人文社会科学研究项目(17SKG055)~~; 文摘建议挖掘作为一项新兴研究任务,具有重要的应用价值。针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数据稀疏等问题,提出一种基于PU学习的建议语句分类方法。首先,使用简单规则从无标注评论集合中选择建议语句的正例集合;然后,为了降低特征维度,缓解数据稀疏性,在自编码神经网络(Autoencoder)特征空间中使用Spy技术划分可靠反例集合;最后,利用正例集合和可靠反例集合来训练多层感知机(MLP)对剩余的无标注样例进行分类。该方法在中文数据集上的F1值和准确率值分别达到81.98%和82.67%,实验结果表明,该方法能够有效地对建议语句进行分类,且不需要对数据进行人工标注。; 关键词建议挖掘建议语句分类 pu学习自编码器多层感知机; Keywords suggestion mining suggestion sentence classification pu(positive and unlabeled)learning autoencoder Multi-Layer Perceptron(MLP); 分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名最大化AUC的正例未标注分类及其增量算法被引量：1: 4; 作者马毓敏王士同; 机构江南大学人工智能与计算机学院; 出处《计算机科学与探索》 CSCD 北大核心 2020年第11期1879-1887,共9页; 基金国家自然科学基金No.61572236。; 文摘正例未标注分类简称PU分类,由于只有正例样本与未标注样本,传统的分类方法在PU分类中往往效果不甚理想。为此利用PU分类下的AUC与传统分类下的AUC关系,提出了将传统分类方法中AUC作为目标函数应用到PU分类中,利用高斯核函数将原始样本映射到高维空间使数据线性可分。通过优化AUC目标函数得到解析解避免了多次迭代的麻烦,并可以推导出增量公式,加快了运算速度。实验结果表明,所提算法实现了与训练集内所有正例与负例标签都已知的理想支持向量机(SVM)相近的性能,并且实现了快速增量,是处理现实问题的有力工具。; 关键词机器学习 pu分类 AUC 增量算法; Keywords machine learning positive-unlabeled(pu)classification AUC incremental algorithm; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种基于聚类的PU主动文本分类方法	刘露彭涛左万利戴耀康	《软件学报》 EI CSCD 北大核心	2013	24	在线阅读下载PDF 职称材料
2	基于支持向量机的PU中文文本分类器构建	王宗尧刘金岭	《南京邮电大学学报（自然科学版）》北大核心	2015	6	在线阅读下载PDF 职称材料
3	基于PU学习的建议语句分类方法	张璞刘畅李逍	《计算机应用》 CSCD 北大核心	2019	2	在线阅读下载PDF 职称材料
4	最大化AUC的正例未标注分类及其增量算法	马毓敏王士同	《计算机科学与探索》 CSCD 北大核心	2020	1	在线阅读下载PDF 职称材料