期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于虚拟类别匹配的分布外文本检测方法
1
作者 虞佳淼 王慧芳 +3 位作者 张亦翔 周辉 罗华峰 宣佳卓 《电网技术》 北大核心 2025年第4期1681-1688,I0075,共9页
电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产... 电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产生的原因及检测难点,提出了基于虚拟类别匹配的分布外文本检测方法。使用特征分解方法得到主、副成分子空间,用副成分子空间构建分布外文本的虚拟类别,以放大分布内、外文本之间的差异性。分析了该方法具有融合预测概率方法与特征分布空间方法的优势。通过分布内、外文本不同词汇相似度的数据集,验证了所提方法的可行性和有效性,并展现了在电力现场作业文本自动评级中的实际应用效果,评级性能及置信度获得大幅提升。 展开更多
关键词 分布外文本检测 虚拟类别匹配 电力现场作业 电力领域文本分类 文本挖掘
在线阅读 下载PDF
基于类内空间夹角约束和小样本采样的错误标签数据识别方法
2
作者 张亦翔 虞佳淼 +3 位作者 王慧芳 费正明 罗华峰 宣佳卓 《电力自动化设备》 北大核心 2025年第4期169-176,185,共9页
在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束... 在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束与小样本采样的错误标签识别方法,用于识别错误标签数据。该方法提出了特征向量类内空间夹角的概念,并将其作为模型预测结果置信度的评价标准,使得置信度具备较强的几何特性,增强了样本间的区分度;分析错误标签数据对特征向量类内空间夹角分布的影响,向类内空间夹角添加加性角度边距约束实现对错误标签数据的分离,并提出了置信度阈值的自动选取方法;提出小样本采样方法进一步提升错误标签数据的识别效果。分别采用公开的THUCNews样本集和电力现场作业文本数据集进行实验,结果验证了所提方法的有效性。 展开更多
关键词 电力领域文本分类 错误标签数据识别 类内空间夹角 加性角度边距惩罚 小样本采样
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部