-
题名融合前缀调优和提示学习的仇恨言论检测方法
被引量:1
- 1
-
-
作者
徐磊
胡亚豪
陈满
陈军
潘志松
-
机构
中国人民解放军陆军工程大学指挥控制工程学院
-
出处
《计算机科学与探索》
北大核心
2025年第1期97-106,共10页
-
基金
国家自然科学基金(62076251)。
-
文摘
随着网络社交平台的发展,网络暴力的危害性日益凸显,其中仇恨言论作为网络暴力的一种表现形式,对其检测方法的研究有助于构建一个健康的互联网环境。然而,一方面先前的仇恨言论检测方法主要依赖于人工监管和关键词过滤,这些方法存在人工成本高且分类效果不佳的问题;另一方面,在互联网平台的监管下,仇恨言论的表达也变得更加含蓄、隐蔽,这对检测模型的文本理解能力提出了更高的要求。以ChatGPT为代表的大模型为仇恨言论检测任务提供了新的可能性,受其在各项下游任务中出色表现的启发,提出了一种融合前缀调优和提示学习的仇恨言论检测方法P-Prompt。利用前缀调优方法将大模型在相关数据集上进行微调,同时结合提示学习方法使模型能够识别并关注待检测文本中的仇恨言论词汇,从而进一步提升模型对仇恨言论的识别能力。实验结果验证了大模型在仇恨言论检测任务的有效性,与传统方法相比P-Prompt方法在仇恨言论检测的二分类和多分类任务中各项评价指标都取得了较明显的提升。
-
关键词
仇恨言论检测
大语言模型
前缀调优
提示学习
-
Keywords
hate speech detection
large language models
prefix tuning
prompt learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多语言嵌入图卷积网络的仇恨言论检测方法
- 2
-
-
作者
赵弘毅
李志远
卜凡亮
-
机构
中国人民公安大学信息网络安全学院
-
出处
《计算机科学》
北大核心
2025年第S2期48-55,共8页
-
基金
中国人民公安大学双一流创新研究项目(2023SYL08)。
-
文摘
随着社交媒体的广泛应用,网络仇恨言论的传播问题日益严重,尤其在网络匿名性的掩护下,仇恨言论得以快速扩散,为仇恨言论检测带来严峻挑战。为了有效应对这一问题,提出了一种基于多语言嵌入图卷积网络(Multi-language Embedding Graph Convolutional Network,MEGCN)的多语言仇恨言论检测方法。该方法充分融合了序列建模与图建模的优势,利用多语言预训练模型进行特征提取,从而能够处理不同语言间的复杂关系。同时,提出了一种基于插值预测的联合训练方式,以提升模型的准确性和鲁棒性。通过在4个公开数据集上的实验,结果表明,MEGCN相比所有对比模型,均在多语言仇恨言论检测任务中取得了更优的性能。该方法不仅能够保持较高的序列建模精度,还能够有效地捕捉文本间的结构性关系,进而提升模型在多语言环境中的表现,尤其在不同语言之间的语义对应关系方面展现出显著优势。
-
关键词
仇恨言论检测
图卷积网络
多语言预训练模型
自然语言处理
-
Keywords
Hate speech detection
Graph convolutional network
Multi-language pre-trained model
Natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-