期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于虚拟类别匹配的分布外文本检测方法
1
作者
虞佳淼
王慧芳
+3 位作者
张亦翔
周辉
罗华峰
宣佳卓
《电网技术》
北大核心
2025年第4期1681-1688,I0075,共9页
电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产...
电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产生的原因及检测难点,提出了基于虚拟类别匹配的分布外文本检测方法。使用特征分解方法得到主、副成分子空间,用副成分子空间构建分布外文本的虚拟类别,以放大分布内、外文本之间的差异性。分析了该方法具有融合预测概率方法与特征分布空间方法的优势。通过分布内、外文本不同词汇相似度的数据集,验证了所提方法的可行性和有效性,并展现了在电力现场作业文本自动评级中的实际应用效果,评级性能及置信度获得大幅提升。
展开更多
关键词
分布外
文本
检测
虚拟类别匹配
电力
现场作业
电力领域文本分类
文本
挖掘
在线阅读
下载PDF
职称材料
基于类内空间夹角约束和小样本采样的错误标签数据识别方法
2
作者
张亦翔
虞佳淼
+3 位作者
王慧芳
费正明
罗华峰
宣佳卓
《电力自动化设备》
北大核心
2025年第4期169-176,185,共9页
在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束...
在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束与小样本采样的错误标签识别方法,用于识别错误标签数据。该方法提出了特征向量类内空间夹角的概念,并将其作为模型预测结果置信度的评价标准,使得置信度具备较强的几何特性,增强了样本间的区分度;分析错误标签数据对特征向量类内空间夹角分布的影响,向类内空间夹角添加加性角度边距约束实现对错误标签数据的分离,并提出了置信度阈值的自动选取方法;提出小样本采样方法进一步提升错误标签数据的识别效果。分别采用公开的THUCNews样本集和电力现场作业文本数据集进行实验,结果验证了所提方法的有效性。
展开更多
关键词
电力领域文本分类
错误标签数据识别
类内空间夹角
加性角度边距惩罚
小样本采样
在线阅读
下载PDF
职称材料
题名
基于虚拟类别匹配的分布外文本检测方法
1
作者
虞佳淼
王慧芳
张亦翔
周辉
罗华峰
宣佳卓
机构
浙江大学电气工程学院
国网浙江省电力有限公司
国网浙江省电力有限公司电力科学研究院
出处
《电网技术》
北大核心
2025年第4期1681-1688,I0075,共9页
基金
国家电网有限公司华东分部科技项目(520800230008)。
文摘
电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产生的原因及检测难点,提出了基于虚拟类别匹配的分布外文本检测方法。使用特征分解方法得到主、副成分子空间,用副成分子空间构建分布外文本的虚拟类别,以放大分布内、外文本之间的差异性。分析了该方法具有融合预测概率方法与特征分布空间方法的优势。通过分布内、外文本不同词汇相似度的数据集,验证了所提方法的可行性和有效性,并展现了在电力现场作业文本自动评级中的实际应用效果,评级性能及置信度获得大幅提升。
关键词
分布外
文本
检测
虚拟类别匹配
电力
现场作业
电力领域文本分类
文本
挖掘
Keywords
out-of-distribution text detection
virtual class matching
power grid field operations
text classification in power domain
text mining
分类号
TM721 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于类内空间夹角约束和小样本采样的错误标签数据识别方法
2
作者
张亦翔
虞佳淼
王慧芳
费正明
罗华峰
宣佳卓
机构
浙江大学电气工程学院
国家电网有限公司华东分部
国网浙江省电力有限公司电力科学研究院
出处
《电力自动化设备》
北大核心
2025年第4期169-176,185,共9页
基金
国家电网有限公司华东分部科技项目(520800230008)。
文摘
在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束与小样本采样的错误标签识别方法,用于识别错误标签数据。该方法提出了特征向量类内空间夹角的概念,并将其作为模型预测结果置信度的评价标准,使得置信度具备较强的几何特性,增强了样本间的区分度;分析错误标签数据对特征向量类内空间夹角分布的影响,向类内空间夹角添加加性角度边距约束实现对错误标签数据的分离,并提出了置信度阈值的自动选取方法;提出小样本采样方法进一步提升错误标签数据的识别效果。分别采用公开的THUCNews样本集和电力现场作业文本数据集进行实验,结果验证了所提方法的有效性。
关键词
电力领域文本分类
错误标签数据识别
类内空间夹角
加性角度边距惩罚
小样本采样
Keywords
text classification in electric power professional domain
mislabeled data identification
intraclass spatial angle
additive angular margin penalty
few-sample sampling
分类号
TM73 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于虚拟类别匹配的分布外文本检测方法
虞佳淼
王慧芳
张亦翔
周辉
罗华峰
宣佳卓
《电网技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于类内空间夹角约束和小样本采样的错误标签数据识别方法
张亦翔
虞佳淼
王慧芳
费正明
罗华峰
宣佳卓
《电力自动化设备》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部