期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
类别不均衡的少样本工业产品表观缺陷检测
1
作者 王素琴 杜雨洁 +1 位作者 石敏 朱登明 《图学学报》 北大核心 2025年第3期568-577,共10页
通用的目标检测网络在缺陷样本数量较少、缺陷类别分布不均衡时,总体检测精度偏低,在缺陷样本稀少的尾部类别上检测精度更低。为此,提出了一种基于改进YOLOv8s的工业产品表观缺陷检测方法。通过在Neck网络使用幻影卷积(GSConv),降低网... 通用的目标检测网络在缺陷样本数量较少、缺陷类别分布不均衡时,总体检测精度偏低,在缺陷样本稀少的尾部类别上检测精度更低。为此,提出了一种基于改进YOLOv8s的工业产品表观缺陷检测方法。通过在Neck网络使用幻影卷积(GSConv),降低网络复杂度的同时增强网络非线性能力,以避免过拟合风险。利用聚合模块VoV-GSCSP进一步提取与融合不同层次特征,提升网络特征提取与融合能力。通过采用重加权损失函数以平衡不同类别样本的训练损失贡献,加大尾部类别样本的损失贡献占比,从而提高尾部类别缺陷的检测精度。相比基线模型,改进方法对针灸针表观缺陷检测精度mAP为93.3%,提高5.0%,样本最少的断针缺陷提升9.1%;药板表观缺陷检测精度mAP为91.4%,提高2.6%,样本最少的脏污缺陷提升3.2%。在样本较多且分布不均衡的钢材数据集上,整体缺陷检测精度mAP提高2.6%。实验表明,该改进方法在缺陷样本少且类别分布不均衡时,可有效提升工业产品表观缺陷总体检测精度,对样本稀少的尾部类别检测精度改善明显,泛化性良好。 展开更多
关键词 表观缺陷检测 少样本 类别不均衡 GSConv 重加权损失函数
在线阅读 下载PDF
浮游植物类别不均衡图像分类方法对比研究 被引量:1
2
作者 梁天泓 殷高方 +9 位作者 邵新童 赵南京 张小玲 贾仁庆 徐敏 张子豪 胡翔 黄朋 董鸣 陈晓伟 《生态学报》 北大核心 2025年第7期3534-3543,共10页
自然水体中浮游植物物种丰富且类别分布不均,采集的显微图像中优势类别样本远多于劣势类别样本,导致深度学习方法在劣势类别上的分类准确率低。针对浮游植物类别不平衡引起的深度学习模型分类误差问题,分析了宏观领域类别不平衡问题的... 自然水体中浮游植物物种丰富且类别分布不均,采集的显微图像中优势类别样本远多于劣势类别样本,导致深度学习方法在劣势类别上的分类准确率低。针对浮游植物类别不平衡引起的深度学习模型分类误差问题,分析了宏观领域类别不平衡问题的多种解决方法和策略,探究这些方法在浮游植物显微图像领域的实用性。采集了巢湖流域中常见的29个藻属、18044张图像,构建了具有严重类别不平衡特性的浮游植物显微图像数据集,并提出使用微平均和宏平均综合评价模型的分类能力。实验结果表明,常规方法训练的模型预测劣势类别样本时的F1值较低,而使用重采样大类中平方根采样法训练的模型在微平均和宏平均两个指标上均有明显提升,分类F1值分别达到了0.932和0.852。特别地,在样本数量最少的10个类别上,微平均和宏平均的F1值分别提高了9.64%和15.94%。为自然水体浮游植物群落结构自动化检测提供了更有效的深度学习模型训练方法。 展开更多
关键词 浮游植物 显微 深度学习 类别不均衡 图像分类
在线阅读 下载PDF
逐层Transformer在类别不均衡数据的应用 被引量:1
3
作者 杨晶东 李熠伟 +3 位作者 江彪 姜泉 韩曼 宋梦歌 《计算机应用研究》 CSCD 北大核心 2023年第10期3047-3052,共6页
为解决临床医学量表数据类别不均衡容易对模型产生影响,以及在处理量表数据任务时深度学习框架性能难以媲美传统机器学习方法问题,提出了一种基于级联欠采样的Transformer网络模型(layer by layer Transformer,LLT)。LLT通过级联欠采样... 为解决临床医学量表数据类别不均衡容易对模型产生影响,以及在处理量表数据任务时深度学习框架性能难以媲美传统机器学习方法问题,提出了一种基于级联欠采样的Transformer网络模型(layer by layer Transformer,LLT)。LLT通过级联欠采样方法对多数类数据逐层删减,实现数据类别平衡,降低数据类别不均衡对分类器的影响,并利用注意力机制对输入数据的特征进行相关性评估实现特征选择,细化特征提取能力,改善模型性能。采用类风湿关节炎(RA)数据作为测试样本,实验证明,在不改变样本分布的情况下,提出的级联欠采样方法对少数类别的识别率增加了6.1%,与常用的NEARMISS和ADASYN相比,分别高出1.4%和10.4%;LLT在RA量表数据的准确率和F 1-score指标上达到了72.6%和71.5%,AUC值为0.89,mAP值为0.79,性能超过目前RF、XGBoost和GBDT等主流量表数据分类模型。最后对模型过程进行可视化,分析了影响RA的特征,对RA临床诊断具有较好的指导意义。 展开更多
关键词 量表数据分类 类别不均衡 级联欠采样 TRANSFORMER
在线阅读 下载PDF
TopPixelLoss:类别不均衡的遥感影像语义分割损失函数 被引量:2
4
作者 袁伟 许文波 周甜 《中国空间科学技术》 CSCD 北大核心 2021年第6期85-90,共6页
针对遥感影像中类别不均衡的小目标分割效果不理想的问题,提出了一种类别不均衡小目标二分类分割的损失函数——TopPixelLoss损失函数。首先计算出每个像素的交叉熵,然后将所有像素的交叉熵按从大到小进行排序,随后确定一个K值作为阈值... 针对遥感影像中类别不均衡的小目标分割效果不理想的问题,提出了一种类别不均衡小目标二分类分割的损失函数——TopPixelLoss损失函数。首先计算出每个像素的交叉熵,然后将所有像素的交叉熵按从大到小进行排序,随后确定一个K值作为阈值,筛选出前K个交叉熵最大的像素,最后对于筛选出的K个像素交叉熵取平均,做为损失值。在ISPRS提供的Vaihingen数据集上,使用PSPNet网络与普通交叉熵、FocalLoss、TopPixelLoss三种损失函数分别对车辆进行二分类分割试验。结果表明,不同的K值,使用TopPixelLoss损失函数的平均交并比(MIoU)、F1-score、准确度(ACC)都最高;当K值为5×10^(4)时效果最佳,MIoU、F1-score、ACC分别比FocalLoss提高了3.0%、5.0%、0.1%。TopPixelLoss损失函数是一种针对类别不均衡分割非常有效的损失函数。 展开更多
关键词 遥感影像 语义分割 深度学习 类别不均衡 小目标分割 不均样本
在线阅读 下载PDF
基于不均衡数据与迁移学习的面部微表情识别 被引量:5
5
作者 孔慧芳 钱世超 闫嘉鹏 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2020年第7期895-900,共6页
针对面部微表情识别研究中各类别数量不均衡造成的数据不均衡问题,文章采用端到端的深度学习方法,利用迁移学习将基于深度卷积神经网络的人脸识别模型VGGFace从人脸识别领域迁移到面部表情识别领域,并引入聚焦损失函数作为目标函数来降... 针对面部微表情识别研究中各类别数量不均衡造成的数据不均衡问题,文章采用端到端的深度学习方法,利用迁移学习将基于深度卷积神经网络的人脸识别模型VGGFace从人脸识别领域迁移到面部表情识别领域,并引入聚焦损失函数作为目标函数来降低数据不均衡的影响。对不均衡数据集(CASME II)进行的对比实验结果表明,采用端到端的深度学习方法自动提取特征的效果更好,微表情识别的准确率和F1值更高。 展开更多
关键词 微表情识别 类别不均衡 卷积神经网络 迁移学习 聚焦损失函数(FL)
在线阅读 下载PDF
面向司法文本的不均衡小样本数据分类方法 被引量:7
6
作者 梁越 刘晓峰 +2 位作者 李权树 白艳峰 马应龙 《计算机应用》 CSCD 北大核心 2022年第S02期118-122,共5页
在目前的控申业务中,将案件分流到不同检察职能部门处理是核心任务之一。由于控申业务类型复杂、数据存在多源异构和不平衡性以及严重依赖人工鉴别,导致控申案件分流工作繁重低效,为此提出了类别不均衡小样本控申文本分类方法以智能辅... 在目前的控申业务中,将案件分流到不同检察职能部门处理是核心任务之一。由于控申业务类型复杂、数据存在多源异构和不平衡性以及严重依赖人工鉴别,导致控申案件分流工作繁重低效,为此提出了类别不均衡小样本控申文本分类方法以智能辅助控申案件分流业务。首先,面向检察实务提出一套信访信件自动化智能化处理套件,对信访信件扫描便携式文件格式(PDF)进行图像提取、图像增强和图片光学字符识别,并通过TextRank算法对摘要和关键词提取文本特征,构建其基于变换器的双向编码器(BERT)文本向量表示。其次,提出了基于虚拟对抗训练(VAT)和Focal Loss函数的类别不均衡小样本控申文本分类方法,针对信访信件数量偏少且存在对抗样本的情况,在模型训练时引入VAT进行优化;同时,在采用分层抽样方法提高数据集质量的基础上,在训练中引入Focal Loss进行优化以解决数据不平衡问题。在实际控申数据集上,将优化后的模型与BERT表示模型对比。实验结果表明,基于VAT和Focal Loss的控申文本分类模型F1值达到0.85,相较于基准BERT模型F1值有约15个百分点的提高,具有很好的分类性能。 展开更多
关键词 司法人工智能 文本分类 虚拟对抗训练 类别不均衡 特征提取
在线阅读 下载PDF
基于数据生成的类别均衡联邦学习 被引量:8
7
作者 李志鹏 国雍 +3 位作者 陈耀佛 王耀威 曾炜 谭明奎 《计算机学报》 EI CAS CSCD 北大核心 2023年第3期609-625,共17页
手机、可穿戴设备等终端设备每天产生海量数据,但这些数据往往涉及敏感隐私而不能直接公开并使用.为解决隐私保护下的机器学习问题,联邦学习应运而生,旨在通过构建协同训练机制,在不共享客户端数据条件下,训练高性能全局模型.然而,在实... 手机、可穿戴设备等终端设备每天产生海量数据,但这些数据往往涉及敏感隐私而不能直接公开并使用.为解决隐私保护下的机器学习问题,联邦学习应运而生,旨在通过构建协同训练机制,在不共享客户端数据条件下,训练高性能全局模型.然而,在实际应用中,现有联邦学习机制面临两大不足:(1)全局模型需考虑多个客户端的数据,但各客户端往往仅包含部分类别数据且类别间数据量严重不均衡,使得全局模型难以训练;(2)各客户端之间的数据分布往往存在较大差异,导致各客户端模型往往差异较大,使得传统通过模型参数加权平均以获得全局模型的方法难以奏效.为降低客户端类别不均衡和数据分布差异的影响,本文提出一种基于数据生成的类别均衡联邦学习(Class-Balanced Federated Learning,CBFL)方法.CBFL旨在通过数据生成技术,针对各客户端构造符合全局模型学习的类别均衡数据集.为此,CBFL设计了一个包含类别均衡采样器和数据生成器的类别分布均衡器.其中,类别均衡采样器对客户端数据量不足的类别以较高概率进行采样.然后,数据生成器则根据所采样的类别生成相应的虚拟数据以均衡客户端数据的类别分布并用于后续的模型训练.为验证所提出方法的有效性,本文在四个标准数据集上进行了大量实验.实验表明,本文方法可大幅提升联邦学习性能:如在CIFAR-100数据集上,CBFL训练的ResNet20模型与现有方法相比,分类准确率提高了5.82%. 展开更多
关键词 联邦学习 数据生成 类别分布 类别不均衡 隐私保护
在线阅读 下载PDF
基于改进的QBC和随机森林的管道类别非均衡堵塞故障识别 被引量:4
8
作者 王显龙 冯早 +1 位作者 朱雪峰 赵燕锋 《电子测量与仪器学报》 CSCD 北大核心 2021年第3期84-93,共10页
针对城市埋地排水管道堵塞故障检测过程中有标签故障样本少,管道运行状态样本集存在类别不均衡及样本标注成本高昂的问题,提出一种基于主动学习的排水管道堵塞故障分类识别方法。该方法采用改进后的委员会样本查询策略通过基于一致熵的... 针对城市埋地排水管道堵塞故障检测过程中有标签故障样本少,管道运行状态样本集存在类别不均衡及样本标注成本高昂的问题,提出一种基于主动学习的排水管道堵塞故障分类识别方法。该方法采用改进后的委员会样本查询策略通过基于一致熵的委员会样本查询策略建立主动学习模型来实现不均衡样本集的学习。经过充分考虑样本的信息度并挖掘信息度高的未标注样本进行标注后,结合多个随机森林分类器组成委员会对未标注样本进行分类识别。在实验室所采集的管道运行数据集上对委员会样本查询策略中的投票熵、一致熵和随机选择样本查询策略进行对比验证。实验结果表明,采用基于一致熵的委员会查询策略在类别分布均衡初始训练集下有更快的收敛速度和更好的稳定性,在类别非均衡分布的初始训练集下同样具有良好的识别效果。 展开更多
关键词 埋地管道 类别不均衡 委员会样本查询 随机森林 一致熵
在线阅读 下载PDF
通过边缘引导的肾上腺三维CT影像分割
9
作者 王文静 牛四杰 +3 位作者 李帆 曹彩霞 丛文斌 杨自成 《南京师大学报(自然科学版)》 北大核心 2025年第1期93-99,共7页
计算机断层扫描图像是判断肾脏情况的主要成像方式.医生可以通过分割出腹部CT图像中感兴趣的肾上腺区域,从而计算出肾上腺的体积、灰度值和表面积来判断肾病的病因.然而手工标记图像中的病变区域是耗时、繁琐且具有挑战性的,且病变区域... 计算机断层扫描图像是判断肾脏情况的主要成像方式.医生可以通过分割出腹部CT图像中感兴趣的肾上腺区域,从而计算出肾上腺的体积、灰度值和表面积来判断肾病的病因.然而手工标记图像中的病变区域是耗时、繁琐且具有挑战性的,且病变区域与周围组织极为相似,勾画出的边界极为模糊.因此本文采用一种全卷积神经网络模型MedNeXt——一个受Transformer启发的大核分割网络来对肾上腺3D数据进行体积分割.为应对样本类别不均衡问题,本文还使用对称统一焦点损失替换Dice损失,以提高分割精度.同时考虑到肾上腺组织与周围组织边界难以区分的问题,本文提出结合边界损失函数与主体损失函数同时监督分割过程,使得模型更关注边界的细节信息,从而提升模型性能,实现更精确的分割结果.实验结果表明,所用方法与近几年最新的模型相比在本文所用肾上腺3D数据集上实现了最先进的性能. 展开更多
关键词 全卷积 TRANSFORMER MedNeXt 类别不均衡 体积分割
在线阅读 下载PDF
基于拓扑感知和双视图分类器的旋转机械故障诊断方法
10
作者 陈子旭 余文念 +1 位作者 杜伟涛 林正宇 《振动与冲击》 北大核心 2025年第1期151-162,共12页
针对旋转机械不同工况下数据分布不同,以及故障数据稀缺使得样本类别不均衡,导致故障诊断模型性能退化这一问题,提出一种基于拓扑感知和双视图分类器的故障诊断方法。该方法以一个图卷积网络为诊断框架,提出的非参数化拓扑感知模块能自... 针对旋转机械不同工况下数据分布不同,以及故障数据稀缺使得样本类别不均衡,导致故障诊断模型性能退化这一问题,提出一种基于拓扑感知和双视图分类器的故障诊断方法。该方法以一个图卷积网络为诊断框架,提出的非参数化拓扑感知模块能自适应更新图数据拓扑结构,约束不同域数据获取近似的消息传递路径,通过图卷积网络有效提取域一致故障特征;利用二分类器和多分类器构建双视图分类器,并计算二元输出和多元输出的相似度对训练数据进行重加权,避免了类别不均衡下模型的有偏训练以及对少数类样本识别能力不强的现象。利用公开的西安交通大学齿轮故障数据集、MAFAULDA旋转机械故障数据集及自制的滑动轴承故障模拟数据进行试验。结果表明,提出的方法能有效提升类别不均衡下变工况故障诊断的性能。 展开更多
关键词 拓扑感知 双视图分类器 类别不均衡 变工况 故障诊断
在线阅读 下载PDF
对话状态追踪模型的数据增强方法研究
11
作者 刘舒曼 冯洋 《中文信息学报》 北大核心 2025年第4期96-104,共9页
对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问... 对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问题,该文使用局部噪声强化槽位值的多样性,加强模型学习槽位无关对话结构的能力;针对训练语料稀少问题,该文根据语料中由槽位结构构成的任务逻辑序列,通过采样生成逻辑合法的槽位值序列,增强语料逻辑多样性,增加语料数量。该文方法在数据集上经对比和分析实验,能显著缓解对话状态追踪模型中存在的类别难度不均衡和语料稀少问题。 展开更多
关键词 对话状态追踪 数据增强 类别难度不均
在线阅读 下载PDF
基于多分类及特征融合的静默活体检测算法 被引量:6
12
作者 黄新宇 游帆 +4 位作者 张沛 张昭 张柏礼 吕建华 徐立臻 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期263-270,共8页
现有的静默活体检测研究忽略不同非活体攻击方式之间的差异,以及不考虑活体和非活体样本类别不均衡对模型学习的不利影响.本研究将非活体攻击类别细分成打印攻击和展示攻击,将静默活体检测由传统的二分类问题转变为多分类问题,并提出采... 现有的静默活体检测研究忽略不同非活体攻击方式之间的差异,以及不考虑活体和非活体样本类别不均衡对模型学习的不利影响.本研究将非活体攻击类别细分成打印攻击和展示攻击,将静默活体检测由传统的二分类问题转变为多分类问题,并提出采取交叉熵作为损失函数对网络模型进行训练的方案,用以克服二分类和类别不均衡问题,使得模型训练中能更准确发现和抽象出非活体人脸样本共同的欺诈特征,提高网络模型对非活体识别的精准度.构建双流特征融合网络模型,采取注意力机制对从RGB和YCrCb这2种不同色彩空间提取到的特征向量进行自适应加权融合,以进一步提升网络模型的特征表示能力.在CASIA-FASD、 Replay-Attack、MSU-MFSD和OULU-NPU 4个公开数据集进行大量的对比实验,实验结果表明,采取多分类策略以及特征融合的静默活体检测模型能够有效降低分类错误率并提升泛化能力. 展开更多
关键词 人脸活体检测 多分类 类别不均衡 交叉熵损失 特征融合
在线阅读 下载PDF
高分影像复杂背景下的城市水体自动提取方法 被引量:1
13
作者 王卫红 陈骁 +1 位作者 吴炜 高星宇 《计算机科学》 CSCD 北大核心 2019年第11期277-283,共7页
城市水体分布信息对于理解城市水循环、热岛效应等地理现象具有重要意义。利用高分辨率影像进行水体提取和水体制图是常用的信息获取方式。由于城市环境背景复杂、高分影像光谱通道少以及水体在影像上分布比例不均匀等原因,将高分影像... 城市水体分布信息对于理解城市水循环、热岛效应等地理现象具有重要意义。利用高分辨率影像进行水体提取和水体制图是常用的信息获取方式。由于城市环境背景复杂、高分影像光谱通道少以及水体在影像上分布比例不均匀等原因,将高分影像应用于水体自动提取仍存在较大难度。对此,基于国产高分影像发展一种面向复杂环境的城市水体自动化提取方法。首先,根据水体近红外通道灰度值较低的特征,自适应选取阈值进行分割,获取初始水体;其次,对初始水体进行缓冲以得到靶区域,使用高斯混合模型来表达其整体分布,通过改进期望最大算法估计水体类别分布参数后,使用最大似然法进行水体自动提取;在此基础上,针对粗提取水体中混杂阴影的问题,提出了融合特征方法来去除阴影,从而获得准确的水体提取结果。对上海市金山区的水体提取实验表明,使用所提方法可以有效提取实验影像中占比较小的水体结构,整体精度较目前常用的自动提取算法有明显提升。 展开更多
关键词 城市水体提取 高斯混合模型 类别不均衡 改进EM算法 阴影去除
在线阅读 下载PDF
基于自监督任务的多源无监督域适应法 被引量:1
14
作者 吴兰 王涵 +2 位作者 李斌全 李崇阳 孔凡士 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第4期754-763,共10页
针对多源聚合下同时对齐域不变特征较困难而造成分类精度不高的问题,提出基于自监督任务的多源无监督域适应法.该方法引入旋转、水平翻转和位置预测3个自监督辅助任务,通过伪标签性、语义信息的一致性对无标签数据进行自适应的对齐优化... 针对多源聚合下同时对齐域不变特征较困难而造成分类精度不高的问题,提出基于自监督任务的多源无监督域适应法.该方法引入旋转、水平翻转和位置预测3个自监督辅助任务,通过伪标签性、语义信息的一致性对无标签数据进行自适应的对齐优化.构建新的优化损失函数,减少多域公共类别的分类差异.针对类别不均衡的问题,基于少样本大权重的原则,定义动态权重参数,提高模型的分类性能.在公开的Office-31、Office-Caltech102种基准数据集上,与现有的主流方法进行实验对比.实验结果表明,在类别均衡、不均衡2种情况下,分类精度最高可以提高6.8%. 展开更多
关键词 自监督任务 类别不均衡 语义信息 权重 域自适应
在线阅读 下载PDF
采用最优集成学习的小样本电磁脉冲信号分类 被引量:2
15
作者 王雪晴 刘小军 +4 位作者 刘艳 程璐 许鑫 纪奕才 方广有 《振动与冲击》 EI CSCD 北大核心 2023年第11期193-198,共6页
闪电与核爆电磁脉冲分类是核检测系统中的关键问题,其主要难点便是其正负样本不均衡程度可达到104,因此我们提出了一种名为SMALLBAG的集成学习分类方法。针对小样本问题,通过对少数类样本进行数据增强和多数类样本重采样的方法重新构建... 闪电与核爆电磁脉冲分类是核检测系统中的关键问题,其主要难点便是其正负样本不均衡程度可达到104,因此我们提出了一种名为SMALLBAG的集成学习分类方法。针对小样本问题,通过对少数类样本进行数据增强和多数类样本重采样的方法重新构建新的训练数据集,分别提取时域、频域、小波域的特征以表征信号。针对样本不均衡问题,提出了基于新采样数据集的集成学习方案,减少样本不均衡影响同时提高分类准确率。该模型能够在保证准确率的同时保证实时性要求,试验结果显示识别准确率可达99.99%,测试速度为每个样本0.67 ms。 展开更多
关键词 集成学习 类别不均衡 小样本学习 核爆电磁脉冲(NEMP) 闪电电磁脉冲(LEMP)
在线阅读 下载PDF
基于偏最小二乘法的咳嗽信号检测 被引量:1
16
作者 王峥 尤鸣宇 +1 位作者 刘家铭 李国正 《计算机工程》 CAS CSCD 2014年第6期281-284,290,共5页
咳嗽中包含丰富的病理信息,可以为临床诊断提供重要支持。自动咳嗽检测方法有助于提高检测结果的可靠性,并减少人为工作量。但在自然记录的语音信号中,非咳嗽信号的数量远多于咳嗽,语音流中咳嗽信号的自动检测是个典型的类别不均衡问题... 咳嗽中包含丰富的病理信息,可以为临床诊断提供重要支持。自动咳嗽检测方法有助于提高检测结果的可靠性,并减少人为工作量。但在自然记录的语音信号中,非咳嗽信号的数量远多于咳嗽,语音流中咳嗽信号的自动检测是个典型的类别不均衡问题。针对该问题,提出一种基于偏最小二乘分类法的咳嗽信号检测模型APLSCX。利用非对称偏最小二乘分类器处理类别不均衡数据的能力,对归一化的特征向量进行特征抽取,同时基于低维数据的方差调整分类平面。实验结果显示,与LCM、SVM等主流模型相比,APLSCX兼顾了小类的召回率和精度指标,具有较高的检出率和较低的误警率,更适用于自然语流中咳嗽信号的检测。 展开更多
关键词 咳嗽信号检测 类别不均衡 偏最小二乘法 APLSCX模型 端点检测
在线阅读 下载PDF
基于改进的半监督阶梯网络SAR图像识别 被引量:2
17
作者 高春永 柏业超 王琼 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第1期160-166,共7页
针对目前SAR(Synthetic Aperture Radar)图像中样本人工标记成本高、传统算法分类识别较低的情况,提出一种基于改进半监督阶梯网络(Semi⁃supervised Ladder Network,SSLN)的SAR图像分类识别方法.首先在原SSLN模型的解码器网络中使用卷... 针对目前SAR(Synthetic Aperture Radar)图像中样本人工标记成本高、传统算法分类识别较低的情况,提出一种基于改进半监督阶梯网络(Semi⁃supervised Ladder Network,SSLN)的SAR图像分类识别方法.首先在原SSLN模型的解码器网络中使用卷积神经网络代替全连接层,对编码器输出的每层数据进行全局深度特征提取,这样做有利于图像降噪,实现对输出数据的重构.其次,为解决SAR图像各类数据集分布不均衡的问题,同时提高网络的泛化性能,对阶梯网络训练层中各类别损失函数的权重进行优化,根据各类别样本数所占总样本数的比重,对少样本类别损失函数调高权重,对多样本类别损失函数调低权重.在公开数据集MSTAR(Moving and Stationary Target Automatic Recognition)上的实验表明,改进后的半监督阶梯网络分类的识别准确度明显优于SSLN算法,且具有更好的泛化性. 展开更多
关键词 半监督学习 阶梯网络 图像识别 卷积神经网络 类别不均衡 合成孔径雷达
在线阅读 下载PDF
一种可信执行环境下的联邦逻辑回归评分卡系统 被引量:2
18
作者 史汶泽 陆林 +1 位作者 秦文杰 于涛 《应用科学学报》 CAS CSCD 北大核心 2023年第3期488-499,共12页
为了构造评分卡模型并保证数据的隐私性,提出一种可信执行环境下的联邦逻辑回归系统。该系统利用可信执行环境的强安全性来抵御参数交互过程中的推演攻击,通过联合归一化和改进的联邦平均方法分别解决局部数据尺度的不一致性和类别不均... 为了构造评分卡模型并保证数据的隐私性,提出一种可信执行环境下的联邦逻辑回归系统。该系统利用可信执行环境的强安全性来抵御参数交互过程中的推演攻击,通过联合归一化和改进的联邦平均方法分别解决局部数据尺度的不一致性和类别不均衡分布下的评分卡模型有效性问题。在一个公开信用卡违约数据集上的测试结果表明:所提出的改进联邦平均方法与典型联邦平均方法相比,能更有效地应对类别不均衡分布问题;与同态加密联邦学习系统相比,能大大提高执行效率。 展开更多
关键词 逻辑回归 联邦学习 可信执行环境 类别不均衡
在线阅读 下载PDF
基于RSKP-UNet模型的苗族服饰图案分割研究 被引量:5
19
作者 张博源 黄成泉 +2 位作者 王琴 万林江 周丽华 《丝绸》 CAS CSCD 北大核心 2022年第12期119-125,共7页
为保护苗族服饰文化的传承,以及增加对苗族文化的研究为目的,文章以苗族服饰图案分割为研究内容,提出了一种基于RSKP-UNet(Residual Selective-Kernel Parallel U-Net)模型的苗族服饰图案分割算法。算法在U-Net模型的编码器部分加入Resi... 为保护苗族服饰文化的传承,以及增加对苗族文化的研究为目的,文章以苗族服饰图案分割为研究内容,提出了一种基于RSKP-UNet(Residual Selective-Kernel Parallel U-Net)模型的苗族服饰图案分割算法。算法在U-Net模型的编码器部分加入Residual模块以提升模型的特征提取能力,在解码器部分嵌入SKNet模块和ParNet模块以增强模型的特征表达能力。通过引入的Lovász-hinge损失函数有效地解决了苗族服饰图案存在的样本类别不均衡的问题,实验结果还表明Lovász-hinge损失函数在各项分割指标上均优于最常用的BCE损失函数。文章提出的RSKP-UNet分割模型在该损失函数下进行训练,并与4种经典的深度学习分割模型进行分割性能对比,RSKP-UNet模型在各项分割指标上好于其他模型,相比于基准模型U-Net,在Dice系数、IoU、精确率、召回率及准确度等指标上分别提升了6.98%、11.07%、2.89%、6.75%及3.92%,可为苗族服饰图案分割研究提供有效可行的办法。 展开更多
关键词 苗族服饰 图案分割 注意力 样本类别不均衡 U-Net模型 深度学习
在线阅读 下载PDF
基于深度学习的SAR图像目标识别综述 被引量:5
20
作者 李永刚 朱卫纲 《电光与控制》 CSCD 北大核心 2022年第2期58-62,共5页
随着合成孔径雷达技术的不断发展,雷达图像目标识别成为重要的研究方向。近年来,深度学习技术在雷达图像目标检测与识别方面得到了广泛应用,然而,数据样本量少和数据样本类别不均衡成为制约深度学习在合成孔径雷达目标识别中的重要因素... 随着合成孔径雷达技术的不断发展,雷达图像目标识别成为重要的研究方向。近年来,深度学习技术在雷达图像目标检测与识别方面得到了广泛应用,然而,数据样本量少和数据样本类别不均衡成为制约深度学习在合成孔径雷达目标识别中的重要因素。对基于深度学习的SAR图像目标识别算法进行了分析,首先,介绍了SAR图像目标识别常用数据集和多角度SAR图像目标识别方法;然后,针对SAR图像目标识别中数据样本量少与样本类别不均衡问题分别进行了总结;最后,讨论了目前SAR图像目标识别仍然存在的问题和下一步的工作计划。 展开更多
关键词 合成孔径雷达 SAR图像目标识别 数据样本量少 类别不均衡
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部