期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于领域特定提示学习和正则化加权先验优化的藏文不良语言检测方法
1
作者
任航
李镀
+3 位作者
杨进
章菁
群诺
王鑫
《中文信息学报》
北大核心
2025年第7期44-53,共10页
社交媒体上的不良言论对人们的心理健康和社会和谐构成严重威胁。然而在藏文社交平台上,由于缺乏有效的检测工具,使得对这些内容的监督和管理面临巨大挑战。鉴于藏文语料极为有限,传统的数据密集型方法并不适用。为解决这一问题,该文提...
社交媒体上的不良言论对人们的心理健康和社会和谐构成严重威胁。然而在藏文社交平台上,由于缺乏有效的检测工具,使得对这些内容的监督和管理面临巨大挑战。鉴于藏文语料极为有限,传统的数据密集型方法并不适用。为解决这一问题,该文提出了一种基于领域特定提示学习和正则化加权先验优化的方法。此方法基于提示学习与领域知识融合,可提升模型在低资源环境下的学习效果;采用正则化加权先验优化算法,通过调整损失函数和标签分布,提升模型准确性。该文以当前领先的XLM-RoBERTa (CINO)模型为基线,对自建的领域特定藏文不良语言数据集进行全量及小样本(50%、30%、10%)实验。结果表明,相较于基线,该方法在不同数据量条件下的准确率分别提高了2.8%、1.6%、1.3%和4.4%。
展开更多
关键词
藏文不良语言检测
领域特定提示学习
正则化加权先验优化
在线阅读
下载PDF
职称材料
题名
基于领域特定提示学习和正则化加权先验优化的藏文不良语言检测方法
1
作者
任航
李镀
杨进
章菁
群诺
王鑫
机构
西藏大学信息科学技术学院
西藏信息化省部共建协同创新中心
四川大学网络空间安全学院
四川省公安厅网络安全保卫总队
出处
《中文信息学报》
北大核心
2025年第7期44-53,共10页
基金
国家自然科学基金(62162057,61872254)
西藏自治区自然科学基金(XZ202401ZR0040)
四川省科技计划项目(2021JDRC0004)。
文摘
社交媒体上的不良言论对人们的心理健康和社会和谐构成严重威胁。然而在藏文社交平台上,由于缺乏有效的检测工具,使得对这些内容的监督和管理面临巨大挑战。鉴于藏文语料极为有限,传统的数据密集型方法并不适用。为解决这一问题,该文提出了一种基于领域特定提示学习和正则化加权先验优化的方法。此方法基于提示学习与领域知识融合,可提升模型在低资源环境下的学习效果;采用正则化加权先验优化算法,通过调整损失函数和标签分布,提升模型准确性。该文以当前领先的XLM-RoBERTa (CINO)模型为基线,对自建的领域特定藏文不良语言数据集进行全量及小样本(50%、30%、10%)实验。结果表明,相较于基线,该方法在不同数据量条件下的准确率分别提高了2.8%、1.6%、1.3%和4.4%。
关键词
藏文不良语言检测
领域特定提示学习
正则化加权先验优化
Keywords
Tibetan Offensive Language Detection
domain-specific prompt learning
regularized weighted prior optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于领域特定提示学习和正则化加权先验优化的藏文不良语言检测方法
任航
李镀
杨进
章菁
群诺
王鑫
《中文信息学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部