期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于类内空间夹角约束和小样本采样的错误标签数据识别方法
1
作者 张亦翔 虞佳淼 +3 位作者 王慧芳 费正明 罗华峰 宣佳卓 《电力自动化设备》 北大核心 2025年第4期169-176,185,共9页
在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束... 在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束与小样本采样的错误标签识别方法,用于识别错误标签数据。该方法提出了特征向量类内空间夹角的概念,并将其作为模型预测结果置信度的评价标准,使得置信度具备较强的几何特性,增强了样本间的区分度;分析错误标签数据对特征向量类内空间夹角分布的影响,向类内空间夹角添加加性角度边距约束实现对错误标签数据的分离,并提出了置信度阈值的自动选取方法;提出小样本采样方法进一步提升错误标签数据的识别效果。分别采用公开的THUCNews样本集和电力现场作业文本数据集进行实验,结果验证了所提方法的有效性。 展开更多
关键词 电力领域文本分类 错误标签数据识别 类内空间夹角 加性角度边距惩罚 小样本采样
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部