期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:2
1
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS聚类 特征空间增强 mixup算法
在线阅读 下载PDF
基于标签相关性的标签特定特征多标签学习 被引量:2
2
作者 王进 梁晨 +2 位作者 孙开伟 陈乔松 邓欣 《江苏大学学报(自然科学版)》 CAS 北大核心 2023年第5期554-563,576,共11页
针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specifi... 针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations,LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果. 展开更多
关键词 标签学习 标签特定特征 聚类集成 标签相关性 无向完全图 最小生成树
在线阅读 下载PDF
基于特征集重构与多标签分类模型的谐波源定位方法 被引量:2
3
作者 邵振国 林潇 +2 位作者 张嫣 陈飞雄 林洪洲 《电力自动化设备》 EI CSCD 北大核心 2024年第2期147-154,共8页
传统基于谐波状态估计的谐波源定位方法需要专门的同步相量量测装置,工程应用受到限制。为此,基于电能质量监测装置所采集的非同步量测数据,提出了基于特征集重构与多标签分类模型的谐波源定位方法。利用监测数据的充分统计量来挖掘量... 传统基于谐波状态估计的谐波源定位方法需要专门的同步相量量测装置,工程应用受到限制。为此,基于电能质量监测装置所采集的非同步量测数据,提出了基于特征集重构与多标签分类模型的谐波源定位方法。利用监测数据的充分统计量来挖掘量测时段的谐波信息,同时利用标签特定特征学习算法重构特征集,从而消除冗余特征以及无关特征对于谐波源定位精度的影响;提出基于邻接矩阵以及灵敏度分析的测点配置方法,结合电路网络拓扑信息实现测点的优化配置;提出基于改进极限学习机的谐波源定位方法,该方法以重构特征集为输入,建立多标签分类模型,实现谐波源定位。通过仿真与算例分析,验证了所提方法的可行性及有效性。 展开更多
关键词 电能质量 谐波源定位 非同步谐波监测数据 极限学习 标签特定特征学习算法
在线阅读 下载PDF
基于高置信度伪标签数据选择算法的临床事件抽取方法 被引量:1
4
作者 罗媛媛 杨春明 +2 位作者 李波 张晖 赵旭剑 《太原理工大学学报》 北大核心 2024年第1期204-213,共10页
【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为... 【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为实体识别模型,提出一种融合多特征的中文医学事件抽取方法:BERT-MCRF.该方法使用BERT构建模型的嵌入和特征提取部分,在CRF层加入多个字的滑动窗口特征,然后将BERT-MCRF作为半监督实验的基实验,提出一种高置信度伪标签数据选择算法作为筛选数据的条件,得到较高质量的300条数据与原始数据合并,最终构建了1700条语料,并重新训练模型。【结果】BERT-MCRF模型在3种属性实体上的整体F1值达到80.21%,比经典的BiLSTM-CRF模型提升15.11%;通过半监督思路重新训练的模型最终F1值达到81.56%,较原始BERT-MCRF提升了1.35%. 展开更多
关键词 临床医学事件抽取 实体识别 特征 半监督学习 高置信度伪标签选择算法
在线阅读 下载PDF
基于聚类提升树的多标签学习 被引量:2
5
作者 王进 余薇 +1 位作者 孙开伟 邓欣 《江苏大学学报(自然科学版)》 CAS 北大核心 2021年第4期428-437,共10页
为了探索多标签数据集中每个标签所具有的特定特征,针对标签特定特征进行有效的利用,提出基于聚类提升树的多标签学习方法(multi-label leaning based on boosting clustering trees,MLL-BCT).建立MLL-BCT整体框架,通过引入聚类特征树... 为了探索多标签数据集中每个标签所具有的特定特征,针对标签特定特征进行有效的利用,提出基于聚类提升树的多标签学习方法(multi-label leaning based on boosting clustering trees,MLL-BCT).建立MLL-BCT整体框架,通过引入聚类特征树来挖掘数据样本之间的相关性,以树形结构保存数据的内在关联;通过引入随机子集训练每个标签的若干分类树来学习标签特定特征,增强特征对单个标签表达,提升分类性能.将所提出的方法在flag、emotions等11个数据集上与经典的特定特征领域多标签学习方法(LIFT、LLSF、REEL、LLSF-DL)进行对比试验.结果表明:新方法在各评估指标(Hamming Loss、One-error、Ranking Loss、Average Precision、Micro-averaged F-Measure)上均具有明显的性能提升,且方法具备简单灵活性. 展开更多
关键词 标签学习 标签特定特征 特征构建 聚类特征 聚类提升树
在线阅读 下载PDF
一种改进的随机森林Boost多标签文本分类算法 被引量:4
6
作者 邵孟良 齐德昱 《计算机应用与软件》 北大核心 2022年第11期215-221,303,共8页
针对目前Boosting算法计算成本高、学习时间长的问题,提出一种改进的随机森林提升(RF-Boost)算法(IRF-Boost)。对训练特征进行排序;在每个Boosting轮中,过滤并使用排序靠前特征的较小子集;根据权重选择一个特征构建新的弱假设,弱假设搜... 针对目前Boosting算法计算成本高、学习时间长的问题,提出一种改进的随机森林提升(RF-Boost)算法(IRF-Boost)。对训练特征进行排序;在每个Boosting轮中,过滤并使用排序靠前特征的较小子集;根据权重选择一个特征构建新的弱假设,弱假设搜索空间的大小从k降低至1。实验检验并分析了信息增益、卡方、GSS系数、互信息、优势比、F1得分和准确度共7种特征排序方法。实验结果表明:在所评价的特征排序法中,互信息最适用于RF-Boost;IRF-Boost的效率优于RF-Boost及AdaBost.MH,即IRF-Boost是解决实践应用和专家系统中分类问题的较好选择。 展开更多
关键词 BOOSTING算法 特征排序 标签学习 文本分类 弱假设
在线阅读 下载PDF
基于可变形部件模型及稀疏特征的行人检测 被引量:2
7
作者 甘鹏坤 陶凌 龙伟 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2015年第6期563-570,共8页
针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行... 针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行训练得到部件模型,再结合级联检测算法对人体目标进行识别检测.实验结果显示,混合模型结合级联方法的检测耗时约是混合模型和语义模型平均检测耗时的1/4,与目前其他已有算法比较,所提方法更加鲁棒和具有识别力. 展开更多
关键词 图像处理 人体检测 稀疏特征 部件模型 标签隐藏变量支持向量机学习算法 级联检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部