-
题名基于改进BERT模型的吸毒人员聊天文本挖掘
- 1
-
-
作者
张立
范馨月
-
机构
贵州大学数学与统计学院
-
出处
《计算机应用与软件》
北大核心
2022年第11期168-172,207,共6页
-
基金
国家自然科学基金项目(11961008)
贵州省科学技术基金项目(201942920301110098)。
-
文摘
对涉毒人员聊天文本进行语义分析,可快速精准地挖掘出海量复杂网络中涉毒人员并及时追踪调查。利用带有方言特色和特定语境的吸毒信息采集平台的吸毒人员聊天文本数据,采用改进BERT模型训练涉毒人员聊天文本,通过学习上下文语境,对聊天文本的语义挖掘效果显著,在准确率、召回率和F1值均优于贝叶斯模型,对涉毒文本正确分类准确率达到90%。对具有方言特色暗号的聊天文本数据,BERT模型可以高效地挖掘潜在涉毒人员,为禁毒部门对涉毒人员管控提供决策辅助。
-
关键词
文本挖掘
BERT模型
贝叶斯分类模型
涉毒人员挖掘
-
Keywords
Text mining
BERT model
Bayes classification model
Drug related personnel mining
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-