-
题名基于虚拟类别匹配的分布外文本检测方法
- 1
-
-
作者
虞佳淼
王慧芳
张亦翔
周辉
罗华峰
宣佳卓
-
机构
浙江大学电气工程学院
国网浙江省电力有限公司
国网浙江省电力有限公司电力科学研究院
-
出处
《电网技术》
北大核心
2025年第4期1681-1688,I0075,共9页
-
基金
国家电网有限公司华东分部科技项目(520800230008)。
-
文摘
电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产生的原因及检测难点,提出了基于虚拟类别匹配的分布外文本检测方法。使用特征分解方法得到主、副成分子空间,用副成分子空间构建分布外文本的虚拟类别,以放大分布内、外文本之间的差异性。分析了该方法具有融合预测概率方法与特征分布空间方法的优势。通过分布内、外文本不同词汇相似度的数据集,验证了所提方法的可行性和有效性,并展现了在电力现场作业文本自动评级中的实际应用效果,评级性能及置信度获得大幅提升。
-
关键词
分布外文本检测
虚拟类别匹配
电力现场作业
电力领域文本分类
文本挖掘
-
Keywords
out-of-distribution text detection
virtual class matching
power grid field operations
text classification in power domain
text mining
-
分类号
TM721
[电气工程—电力系统及自动化]
-