-
题名基于知识增强多任务学习的隐式有害文本检测技术研究
- 1
-
-
作者
陈雅宁
柯亮
王文贤
陈兴蜀
王海舟
-
机构
四川大学网络空间安全学院
四川大学网络空间安全研究院
-
出处
《信息安全研究》
北大核心
2025年第8期718-726,共9页
-
基金
国家重点研发计划项目(2022YFC3303101)。
-
文摘
互联网中大量有害文本采用了隐晦的委婉表达形式,以躲避审查系统.目前大多研究都集中在明确或显性的有害言论上,无法有效地检测伪装的隐式有害文本形式.因此,开展基于多任务学习的中文隐式委婉表达有害文本检测研究,提出了一个隐式有害文本检测模型(IHTD-KML),将委婉句子识别任务用于辅助有害文本检测任务.首先,研究委婉语词汇特征融合方法,提高模型对隐含含义的表征能力;随后,研究了基于对比学习的潜在含义知识增强,学习到共享含义的隐性有害言论的共同特征;最后,联合委婉句识别任务和有害文本检测任务构建多任务学习框架,通过多任务参数共享和多特征融合损失函数提高模型的检测性能.实验结果全面展示了模型在检测隐性有害文本任务上的有效性.
-
关键词
隐性有害文本
委婉语
多任务学习
提示学习
对比学习
-
Keywords
implicit harmful text
euphemism
multi-task learning
prompt learning
contrastive learning
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-