期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于直觉模糊集的Tri-Training改进算法
1
作者 彭雅琴 宫宁生 《微电子学与计算机》 CSCD 北大核心 2016年第3期134-137,141,共5页
Tri-Training算法是半监督算法中的一种,其初始分类器性能受有标记样本影响较大,当样本数目不足时,分类器性能相对较弱,会直接影响后续迭代.为此提出IFS-Tri-Training(Tri-Training based on intuitionistic fuzzy sets)算法,引入SOM算... Tri-Training算法是半监督算法中的一种,其初始分类器性能受有标记样本影响较大,当样本数目不足时,分类器性能相对较弱,会直接影响后续迭代.为此提出IFS-Tri-Training(Tri-Training based on intuitionistic fuzzy sets)算法,引入SOM算法构建直觉模糊集,使得分类器在多因素下综合判别无标记样本,提高无标记样本的使用率,从而在迭代中扩展有标记样本集.在多个UCI数据上进行实验,结果数据表明,分类器的性能得到提高,学习无标记样本过程是影响分类器的关键点. 展开更多
关键词 tri—training算法 SOM算法 直觉模糊集 半监督
在线阅读 下载PDF
一种基于Tri-training的众包标记噪声纠正算法 被引量:1
2
作者 杨艺 蒋良孝 +1 位作者 李超群 李宏伟 《电子学报》 EI CAS CSCD 北大核心 2021年第3期424-434,共11页
在众包学习中,使用标记集成算法得到的集成标记中仍然存在一定程度的标记噪声.本文受三重训练思想的启发,提出了一种基于tri-training的众包标记噪声纠正算法(Tri-Training-based Label Noise Correction,TTLNC).TTLNC首先使用过滤器获... 在众包学习中,使用标记集成算法得到的集成标记中仍然存在一定程度的标记噪声.本文受三重训练思想的启发,提出了一种基于tri-training的众包标记噪声纠正算法(Tri-Training-based Label Noise Correction,TTLNC).TTLNC首先使用过滤器获得干净集和噪声集,然后在干净集上进行bagging分别训练三个不同的分类器,并通过这些分类器重新标注噪声集中的实例,同时按照实例分配策略将实例分配给相应的训练集.最后在新训练集上重新训练三个不同的分类器,并用新分类器的分类结果重新标注所有实例.在仿真标准数据和真实众包数据集上的实验结果表明TTLNC比其他四种最先进的噪声纠正算法在噪声比和模型质量两个度量指标上表现更优. 展开更多
关键词 众包学习 三重训练 集成标记 标记噪声 噪声纠正 噪声过滤
在线阅读 下载PDF
基于改进Tri-training算法的中文问句分类 被引量:1
3
作者 王雷 杨思春 《安徽工业大学学报(自然科学版)》 CAS 2016年第2期172-176,共5页
原始Tri-training算法对有标记的数据集通过随机采样方法,形成3个训练集去训练3个分类器。但是由这种随机采样形成的训练集中,可能出现有标记数据集中的不同类别数据数量相差较大,从而导致训练集中样本类别不平衡问题,影响分类器的分类... 原始Tri-training算法对有标记的数据集通过随机采样方法,形成3个训练集去训练3个分类器。但是由这种随机采样形成的训练集中,可能出现有标记数据集中的不同类别数据数量相差较大,从而导致训练集中样本类别不平衡问题,影响分类器的分类正确率。本文通过分类采样对Tri-training算法的随机采样方法进行改进,根据该改进的Tri-training算法,建立分类模型,并利用其对哈工大中文问句集和本文扩展问句集进行分类实验。结果表明,本文算法有良好的适应性,且分类正确率明显提高;适当增大训练集和未标记样本数据可以增强分类器的泛化能力,从而使分类正确率提高。 展开更多
关键词 tri-training算法 随机采样 问句分类
在线阅读 下载PDF
基于Tri-Training的驾驶风格分类算法 被引量:4
4
作者 董昊旻 张维轩 +2 位作者 王文彬 何云廷 康子怡 《汽车技术》 CSCD 北大核心 2021年第4期6-11,共6页
为进一步提高驾驶风格识别准确率并降低传统监督学习所需大量人工标记带来的时间成本,基于半监督学习三协同训练(Tri-Training)方法对驾驶员驾驶风格进行识别。对驾驶员真实驾驶产生的长时序数据进行数据清洗、工况识别、特征提取,并通... 为进一步提高驾驶风格识别准确率并降低传统监督学习所需大量人工标记带来的时间成本,基于半监督学习三协同训练(Tri-Training)方法对驾驶员驾驶风格进行识别。对驾驶员真实驾驶产生的长时序数据进行数据清洗、工况识别、特征提取,并通过专家系统进行标记后使用Tri-Training算法进行训练,建立驾驶风格识别模型,通过调节带标签样本与无标签样本的比例,对比使用不同样本比例下训练的传统机器学习模型和Tri-Training模型的驾驶风格识别准确率。试验结果表明,相比于传统的监督学习方法,Tri-Training在带标签数据较少时,仍能表现出优异的识别准确率,半监督学习下的Tri-Training模型可以有效利用未标记样本来提高驾驶风格分类的准确率。 展开更多
关键词 驾驶风格识别 半监督学习 三协同训练
在线阅读 下载PDF
基于Tri-training半监督学习的JPEG隐密分析方法 被引量:3
5
作者 郭艳卿 孔祥维 +1 位作者 尤新刚 何德全 《通信学报》 EI CSCD 北大核心 2008年第10期205-209,214,共6页
提出了一种基于半监督学习机制的JPEG隐密分析方法。通过三类DCT域统计特征和多超球面OC-SVM算法构建三种独立的隐密分析方法,并以Tri-training学习方式迭代地对未标记图像样本进行标记,来扩充原训练样本集,进而可以利用大量未标记属性... 提出了一种基于半监督学习机制的JPEG隐密分析方法。通过三类DCT域统计特征和多超球面OC-SVM算法构建三种独立的隐密分析方法,并以Tri-training学习方式迭代地对未标记图像样本进行标记,来扩充原训练样本集,进而可以利用大量未标记属性的图像样本提高隐密分析算法的泛化能力。由JSteg、F5、Outguess、MB1含密图像与载体图像所组成的混合图像库上的仿真实验结果验证了此方法的有效性。 展开更多
关键词 隐密分析 半监督学习 tri-training 多超球面 一类支持向量机
在线阅读 下载PDF
基于Tri-Training的制冷系统半监督故障诊断 被引量:2
6
作者 任正雄 韩华 +2 位作者 崔晓钰 陆海龙 张运乾 《制冷学报》 CAS CSCD 北大核心 2022年第4期129-136,144,共9页
针对以往制冷系统故障诊断需采用已知运行状态的有标签数据,导致大量无标签数据信息无法利用的问题,本文提出一种基于Tri-Training的制冷系统半监督故障诊断方法,改善制冷系统故障诊断性能。采用一台316 kW离心式冷水机组7类典型故障的... 针对以往制冷系统故障诊断需采用已知运行状态的有标签数据,导致大量无标签数据信息无法利用的问题,本文提出一种基于Tri-Training的制冷系统半监督故障诊断方法,改善制冷系统故障诊断性能。采用一台316 kW离心式冷水机组7类典型故障的实际数据对该诊断方法进行验证,结果表明:该方法具有有效性,挖掘无标签数据信息的Tri-Training半监督故障诊断模型相比支持向量机(SVM)、K近邻(KNN)、随机森林(RF)3种有监督诊断模型,性能显著提高,总体诊断正确率达到99.43%,对系统级故障的诊断正确率提升1.73%~3.90%,虚警率、漏报率、误报率均有不同程度改善。同时,表明该故障诊断模型中3个基分类器的故障诊断性能及其多样性是影响该模型对制冷系统中无标签数据利用的主要因素。 展开更多
关键词 制冷系统 故障诊断 半监督学习 tri-training 优化
在线阅读 下载PDF
基于Tri-training MPLS的半监督软测量模型 被引量:2
7
作者 李东 刘乙奇 黄道平 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第2期217-224,共8页
随着污水处理过程日趋复杂,易测量变量和难测量变量的比例严重失衡,传统的监督性软测量建模方法已经无法满足需求。针对这一问题,提出了一种新的半监督学习的软测量模型-Tri-training MPLS模型。首先将标记数据均分为相互独立的3个部分... 随着污水处理过程日趋复杂,易测量变量和难测量变量的比例严重失衡,传统的监督性软测量建模方法已经无法满足需求。针对这一问题,提出了一种新的半监督学习的软测量模型-Tri-training MPLS模型。首先将标记数据均分为相互独立的3个部分,并由这3个相互独立的标记样本子集选择置信度高的未标记样本训练模型,提高模型的预测能力。其次,将单输出软测量模型升级为多输出模型,对多个输出的变量直接建模预测。最后,通过污水处理仿真模型BSM1(Benchmark Simulation Model-1)平台对本文模型进行验证。结果表明,该软测量模型不仅具有较好的多输出预测能力,而且对单个预测结果也有令人满意的预测表现。 展开更多
关键词 软测量 半监督学习 多输出 tri-training 偏最小二乘
在线阅读 下载PDF
基于LPA和Tri-Training的半监督文本倾向性分类 被引量:1
8
作者 郭毅 黄磊 《北京交通大学学报》 CAS CSCD 北大核心 2015年第6期114-121,共8页
提出了一种基于LPA和Tri-Training算法的半监督文本倾向性分类框架.通过LPA对初始样本进行快速分类,获得更多可信的有标签数据,优化分类框架的训练过程.引入Tri-Training算法,提高分类框架的泛化能力和可用性.实验结果表明,在不同标注... 提出了一种基于LPA和Tri-Training算法的半监督文本倾向性分类框架.通过LPA对初始样本进行快速分类,获得更多可信的有标签数据,优化分类框架的训练过程.引入Tri-Training算法,提高分类框架的泛化能力和可用性.实验结果表明,在不同标注比例的样本集上,该框架都有较好的分类性能,相较有监督学习算法和单一的半监督算法提高了分类精度,并有较强的鲁棒性,为解决有标签样本比例较少情况下的文本倾向性分类提供了一个新的思路. 展开更多
关键词 半监督学习 LIT2 文本倾向性分类 tri-training算法 标签传播算法
在线阅读 下载PDF
基于Tri-SE-CNN的风电机组叶片结冰检测研究
9
作者 孙坚 杨宇兵 《太阳能学报》 CSCD 北大核心 2024年第12期360-369,共10页
针对现有风力机叶片结冰检测方法未能充分利用无标签数据,且分类性能差的问题,提出一种基于改进的三重训练和卷积神经网络(Tri-SE-CNN)的结冰检测方法。首先建立基于最优加权策略的三重训练(Tri-training)模型,对无标签样本的状态进行判... 针对现有风力机叶片结冰检测方法未能充分利用无标签数据,且分类性能差的问题,提出一种基于改进的三重训练和卷积神经网络(Tri-SE-CNN)的结冰检测方法。首先建立基于最优加权策略的三重训练(Tri-training)模型,对无标签样本的状态进行判别,用以扩充训练集;接着将压缩与激励(SE)模块嵌入到卷积神经网络(CNN)中,并用SE-CNN分类器学习扩充后的样本集。结合提取的叶片结冰主控特征,以2017年工业大数据创新竞赛平台中15号和21号风力机数据为例进行仿真,并用云南某风场历史数据进行验证。实验结果表明,所提方法的准确度优于CNN、支持向量机等方法,在15号风力机上达到99.96%,可为风力机叶片结冰预警提供有益参考。 展开更多
关键词 风电机组叶片 无标签数据 卷积神经网络 三重训练 压缩和激励网络 结冰检测
在线阅读 下载PDF
一种增强差异性的半监督协同分类算法 被引量:9
10
作者 于重重 商利利 +3 位作者 谭励 涂序彦 杨扬 王竞燕 《电子学报》 EI CAS CSCD 北大核心 2013年第1期35-41,共7页
半监督学习中的Tr-i Training算法打破了以往算法对充分冗余视图的限制,并通过利用三个分类器处理标记置信度和样本预测问题提高了标记效率.为进一步增强协同训练过程中分类器之间的差异性以提高性能,本文在其理论基础上提出了一种增强... 半监督学习中的Tr-i Training算法打破了以往算法对充分冗余视图的限制,并通过利用三个分类器处理标记置信度和样本预测问题提高了标记效率.为进一步增强协同训练过程中分类器之间的差异性以提高性能,本文在其理论基础上提出了一种增强差异性的半监督协同分类算法.该算法利用三个不同的分类器进行学习;考虑到分类模型在更新过程中,可能会因随机抽样导致性能恶化,该算法利用基于标记类别的分层抽样法来对已标记样本集进行抽样,并通过基于分类正确率的加权投票法实现了分类器的集成,提高了预测准确率.本文通过实验对所提出算法与Tr-i Training算法做了性能比较,实验结果表明本文所提出的方法在分类问题上具有较好的性能,验证了该算法的有效性和可行性. 展开更多
关键词 半监督协同分类算法 Tr-itraining算法 增强差异性策略 分层抽样法
在线阅读 下载PDF
基于改进三重训练算法的高光谱图像半监督分类 被引量:8
11
作者 王立国 杨月霜 刘丹凤 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2016年第6期849-854,共6页
高光谱数据维数高,有标签的样本数量少,给高光谱图像分类带来困难。本文针对传统三重训练(tri-training)算法在初始有标签样本数量较少的情况下分类器间差异性不足的问题提出了一种基于改进三重训练算法的半监督分类框架。该方法首先通... 高光谱数据维数高,有标签的样本数量少,给高光谱图像分类带来困难。本文针对传统三重训练(tri-training)算法在初始有标签样本数量较少的情况下分类器间差异性不足的问题提出了一种基于改进三重训练算法的半监督分类框架。该方法首先通过边缘采样策略(margin Sampling,MS)选取最富含信息量的无标签样本,然后在训练每个分类器之前通过差分进化算法(differential evolution,DE)利用所选取的无标签样本产生新的样本。这些新产生的样本将被标记并且加入训练样本集来帮助初始化分类器。实验结果表明,该方法不仅能够有效地利用无标签样本,而且在有标签数据很少的情况下能够有效地提高分类精度。 展开更多
关键词 高光谱图像 半监督分类 三重训练 边缘采样 差分进化
在线阅读 下载PDF
基于Electre Tri的研究生就业能力评价方法
12
作者 高晓光 郑俊 +2 位作者 王云辉 李波 符小卫 《高等教育研究学报》 2015年第3期83-89,103,共8页
研究生就业能力评价问题是研究生就业指导和研究生培养过程管理中的核心问题。研究生培养的过程管理是一个监控-评价-调整-监控相互循环的一个动态过程,充分、全面、准确、深入的研究生就业能力评价就是这个动态过程的反馈点。针对研究... 研究生就业能力评价问题是研究生就业指导和研究生培养过程管理中的核心问题。研究生培养的过程管理是一个监控-评价-调整-监控相互循环的一个动态过程,充分、全面、准确、深入的研究生就业能力评价就是这个动态过程的反馈点。针对研究生培养和就业过程中的就业能力评价问题,提出基于Electre Tri的研究生职业能力评价方法。Electre Tri多属性决策方法根据强优劣关系原则对研究生的就业能力进行评估,能够将研究生根据就业能力进行优劣分类。间接偏好提取方法通过求解线性规划问题,能够得到评估指标的权重。仿真算例验证了该方法的有效性,该方法避免了传统多属性决策方法在确定权重时的随意性,能够更准确的反映研究生的就业能力。 展开更多
关键词 研究生培养 就业能力评价 多属性决策 ELECTRE tri
在线阅读 下载PDF
程序设计课程中的递归算法分析
13
作者 陈佳 苗英恺 《安阳师范学院学报》 2002年第2期75-76,共2页
通过一个实例详细分析递归概念难于理解的原因
关键词 程序设计课程 递归算法 子程序 断点地址 堆栈 入口参数 压栈 try函数 程序调用
在线阅读 下载PDF
基于半监督学习的AES算法功耗分析
14
作者 王相宾 王永娟 +2 位作者 赵远 高光普 袁庆军 《密码学报》 CSCD 2021年第4期660-668,共9页
基于机器学习的功耗分析是目前功耗分析的主要研究方向之一,属于建模类的攻击.针对无掩码防护的AES算法实现,本文将半监督机器学习算法Tri-Training应用于功耗分析,有效减少了用机器学习算法进行建模时所需要的有标记能量迹数量.相较于... 基于机器学习的功耗分析是目前功耗分析的主要研究方向之一,属于建模类的攻击.针对无掩码防护的AES算法实现,本文将半监督机器学习算法Tri-Training应用于功耗分析,有效减少了用机器学习算法进行建模时所需要的有标记能量迹数量.相较于基于有监督机器学习的建模类功耗分析,使用Tri-Training算法可以有效减小对有标记能量迹的需求,更具有现实意义.然而,Tri-Training算法在初始分类器较弱时,容易出现错误标记现象,影响分类的准确率和建模的效率.对此本文在使用Tri-Training算法进行建模时引入了阈值判断操作,提高了分类的准确率,并对比了不同阈值对分类准确率的影响.本文对在ATM89S52单片机上实现的AES-128算法进行建模类功耗分析,实验结果表明,在使用80条有标记能量迹时,相较于使用有监督学习算法的准确率为63.49%,本方法的准确率为74.56%,准确率提升了约11%. 展开更多
关键词 功耗分析 半监督学习 tri-training算法 AES-128算法 能量迹
在线阅读 下载PDF
基于虚拟链路交换式以太网的列车通信网络可靠性分析 被引量:13
15
作者 周洁琼 王立德 +1 位作者 王涛 申萍 《铁道学报》 EI CAS CSCD 北大核心 2014年第2期55-61,共7页
随着轨道交通技术的不断发展,列车通信网络中需要传输的数据类型和数据量日益增大,传统列车通信网络的带宽难以满足要求。本文提出一种基于虚拟链路的环形交换式以太网解决方案,通过流量整形和虚拟链路调度技术可以保证每个BAG间隔内只... 随着轨道交通技术的不断发展,列车通信网络中需要传输的数据类型和数据量日益增大,传统列车通信网络的带宽难以满足要求。本文提出一种基于虚拟链路的环形交换式以太网解决方案,通过流量整形和虚拟链路调度技术可以保证每个BAG间隔内只有不超过一个帧在使用虚拟链路,可避免传统以太网对介质访问存在的碰撞问题,保证数据传输的确定性。为进一步探讨该网络的实时性,本文采用边扩张二元决策图EEBDD(Edge Expansion Binary Decision Diagram)算法分析该网络中的单条虚拟链路、多条虚拟链路以及全部虚拟链路的连通可靠性与及时可靠性,并通过网络仿真研究证实了本方案应用于列车通信网络的可行性。 展开更多
关键词 虚拟链路交换式以太网 列车通信网络 及时可靠性 边扩张二元决策图算法 网络仿真 train communication network (TCN)
在线阅读 下载PDF
键合图理论在三轴差动机构效率分析中的应用 被引量:1
16
作者 李庆凯 唐德威 +1 位作者 姜生元 邓宗全 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第11期44-48,共5页
为了更好地对三轴差动机构的传动效率进行分析计算,利用键合图功率流动的特点,将键合图理论应用到三轴差动机构功率流的分析中.根据三轴差动机构的传动关系,采用绝对速度法,建立其在速度约束下的键合图模型,并进行相应的仿真计算,得到... 为了更好地对三轴差动机构的传动效率进行分析计算,利用键合图功率流动的特点,将键合图理论应用到三轴差动机构功率流的分析中.根据三轴差动机构的传动关系,采用绝对速度法,建立其在速度约束下的键合图模型,并进行相应的仿真计算,得到三轴差动机构在不同速度约束下的内部功率流以及各差速器转换机构的功率流情况.仿真结果表明:三轴差动机构属于功率汇流型机构,无循环功率存在,不存在自锁的可能性.以得到的功率流情况为基础,进行三轴差动机构的力矩传递特性分析以及传动效率的计算.该方法比传统方法更具系统性,便于使用计算机求解. 展开更多
关键词 三轴差动机构 键合图 轮系 功率流 效率
在线阅读 下载PDF
基于机器学习技术的光网络资源动态分配研究 被引量:3
17
作者 彭雪梅 黄建军 《激光杂志》 CAS 北大核心 2022年第7期144-148,共5页
合理分配资源,可有效控制光网络的拥塞现象,确保服务质量机制正常运转,提升用户体验。为此,对基于机器学习技术的光网络资源动态分配方法进行研究。通过融合改进的半监督机器学习方法Tri-Training算法与深度包检测技术构建光网络资源分... 合理分配资源,可有效控制光网络的拥塞现象,确保服务质量机制正常运转,提升用户体验。为此,对基于机器学习技术的光网络资源动态分配方法进行研究。通过融合改进的半监督机器学习方法Tri-Training算法与深度包检测技术构建光网络资源分类器,获取光网络流量所属的服务质量要求类别,实现资源类型分类,提升资源分配的合理性;依据资源分类结果,利用基于循环神经网络的光网络资源动态分配算法中的执行者部分优化分配方案,通过输入、动作与效用函数三部分获取混合策略纳什均衡,依据纳什均衡动态分配分类后的光网络资源。实验证明:该方法能够有效进行光网络资源的动态分配,降低业务阻塞率与延时情况的发生率。 展开更多
关键词 机器学习 光网络 资源 动态分配 tri-training算法 循环神经网络
在线阅读 下载PDF
桁架对列车气动特性的影响及其内部风场分析 被引量:3
18
作者 郭薇薇 蔡保硕 张慧彬 《铁道学报》 EI CAS CSCD 北大核心 2022年第6期131-139,共9页
为研究桁架结构对车桥系统气动特性的影响及其内部风场的分布特征,对某大跨度公铁两用斜拉桥的桁架主桥和箱梁引桥进行节段模型风洞试验,对比不同梁型的车桥系统三分力系数。基于试验结果建立CFD模型,推导适合桁架结构的等效风速计算公... 为研究桁架结构对车桥系统气动特性的影响及其内部风场的分布特征,对某大跨度公铁两用斜拉桥的桁架主桥和箱梁引桥进行节段模型风洞试验,对比不同梁型的车桥系统三分力系数。基于试验结果建立CFD模型,推导适合桁架结构的等效风速计算公式,研究桁架横断面、纵断面及各车道位置处的等效风速分布及侧风折算系数。结果表明,桁架对列车的遮风效应较为显著,零攻角时,列车在桁梁上的阻力、升力及力矩系数约为其在箱梁上的66%、17%、50%;横风流经桁架结构出现了风速三维分布,迎风侧外侧车道上的风速高于其他车道;在各车道上方0.15~0.45倍梁高处的风速较大,最大风速出现的位置与车体形心高度较为吻合;桁架内部的平均风速显著低于来流风速,但在节间两个直角三角形形心附近出现了高风区域,最大侧风折算系数达到了0.92。 展开更多
关键词 列车-桁架系统 三分力系数 侧风折算系数 等效风速 风洞实验 数值模拟
在线阅读 下载PDF
列车荷载作用下深厚饱和软土盾构隧道沉降分析 被引量:10
19
作者 宁茂权 《铁道标准设计》 北大核心 2015年第10期94-98,共5页
软土地层盾构隧道运营期沉降一直是工程界关注的重点问题。结合工程实例,采用不排水循环累积变形理论、循环三轴试验参数和简化动力有限元及分层总和法,分析深厚软土地层盾构隧道在运营期列车荷载作用下沉降响应。分析成果表明,隧道埋... 软土地层盾构隧道运营期沉降一直是工程界关注的重点问题。结合工程实例,采用不排水循环累积变形理论、循环三轴试验参数和简化动力有限元及分层总和法,分析深厚软土地层盾构隧道在运营期列车荷载作用下沉降响应。分析成果表明,隧道埋深越浅、隧底软土地层越厚,则运营期沉降越大;就沉降速率来看,隧道在运营期最大沉降速率将在隧道运营后的初期出现,且地层越差,沉降量越大,沉降速率越小,沉降稳定时间越长;采取一定沉降控制措施后,深厚软土地层盾构隧道在运营期列车循环荷载作用下的沉降是可控的。针对本项目的特点,结合分析成果,合理确定深厚软土地层盾构隧道沉降控制措施。 展开更多
关键词 盾构隧道 深厚饱和软土 循环累积变形 循环三轴试验 简化动力有限元 分层总和法 列车荷载 运营期沉降
在线阅读 下载PDF
基于改进三体训练法的半监督专利文本分类方法 被引量:10
20
作者 胡云青 邱清盈 +1 位作者 余秀 武建伟 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第2期331-339,共9页
针对信息增益算法只能考察特征对整个系统的贡献、忽略特征对单个类别的信息贡献的问题,提出改进信息增益算法,通过引入权重系数调整对分类有重要价值的特征的信息增益值,以更好地考虑一个词在类别间的分布不均匀性.针对传统专利自动分... 针对信息增益算法只能考察特征对整个系统的贡献、忽略特征对单个类别的信息贡献的问题,提出改进信息增益算法,通过引入权重系数调整对分类有重要价值的特征的信息增益值,以更好地考虑一个词在类别间的分布不均匀性.针对传统专利自动分类中训练集标注瓶颈问题,提出基于改进三体训练算法的半监督分类方法,通过追踪每次更新后的训练集样本类别分布来动态改变3个分类器对同一未标记样本类别的预测概率阈值,从而在降低噪音数据影响的同时实现对未标记训练样本的充分利用.实验结果表明,本研究所提出的分类方法在有标记训练样本较少的情况下,可以取得较好的自动分类效果,并且适当增大未标记样本数据可以增强分类器的泛化能力. 展开更多
关键词 专利文本分类 特征选择 信息增益 半监督 三体训练算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部