-
题名基于深度学习的涉密敏感信息识别技术研究
- 1
-
-
作者
曾庆瑞
-
机构
中国航发贵阳发动机设计研究所
-
出处
《现代信息科技》
2024年第11期171-175,共5页
-
文摘
为提升涉密敏感信息管理工作智能化水平,该文提出一种BERT-BGRU-CRF深度学习方法,实现对涉密敏感信息的自动识别。该方法先是采用BERT模型对文本信息进行预处理,再采用双向门控循环单元(BGRU)模型获取上下文语义特征,最后将提取后的信息输入到条件随机场模型中进行序列标注,从而得到最优解。实验结果表明,在自建数据集上,所提方法相较于BERT-CRF、BERT-LSTM-CRF、BERT-BiLSTM-CRF三个识别方法,在精确率、召回率和F1值等方面均取得了较高的分数,证明该方法是适用于涉密敏感信息智能识别工作的。
-
关键词
敏感信息识别
深度学习
门控循环单元
BERT
条件随机场
-
Keywords
sensitive information recognition
Deep Learning
Gated Recurrent Unit
BERT
Conditional Random Field
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于Elmo的高层语义敏感信息识别方法研究
- 2
-
-
作者
陈紫琴
吴鹏
李乐成
-
机构
国家计算机网络应急技术处理协调中心湖北分中心
-
出处
《长江信息通信》
2024年第7期119-122,共4页
-
文摘
社交媒体的不断发展使得网络上充斥着大量的信息,然而网络的开放性也导致了容易传播涉政敏感信息。在这样的背景下,如何高效准确地筛查出这些涉政敏感信息成为当前迫切需要解决的问题。本文旨在提出一种基于深度学习的语义层级敏感信息识别方法,以应对这一挑战。将输入的文本以基于Elmo的方法生成动态词向量,建立基于高层语义的细到粗策略和基于多上下文的混合模型,再通过基于关联规则的变体词识别算法得到识别结果。经实验证明,在新浪微博数据集上,文章提出的方法有较好的效果。尤其值得注意的是,基于Elmo的动态词向量生成方法相比传统的word2vec和glove表示法具有更突出的效果,这表明了Elmo技术在敏感信息识别任务中的潜力和优势。
-
关键词
文本检测
词向量生成
敏感信息识别
自然语言处理
深度学习
-
Keywords
text detection
word vector generation
sensitive information identification
natural language processing
decp lcarning
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于机器学习的图像敏感信息识别方法
被引量:4
- 3
-
-
作者
王海霞
李凯勇
-
机构
青海民族大学物理与电子信息工程学院
-
出处
《现代电子技术》
2021年第19期66-70,共5页
-
基金
青海省重点研发与转换计划(2019-GX-170)。
-
文摘
针对传统图像敏感信息识别方法精度不高的问题,提出一种基于机器学习的图像敏感信息识别方法。对识别图像进行去噪和细节锐化预处理操作,从颜色、形状和纹理三个角度提取预处理后的图像特征。结合所提取的图像进行图像敏感信息检索,通过图像特征提取图像敏感信息。根据机器学习中的支持向量机(SVM)原理,设计一种图像分类器实现对图像敏感信息的分类和识别。与传统的两种图像识别方法相比,该方法具有较高的识别精度,可在较短的识别时间完成图像敏感信息识别。
-
关键词
敏感信息识别
识别方法
图像信息检索
机器学习
信息提取
图像分类器
-
Keywords
sensitive information recognition
recognition method
image information retrieval
machine learning
information extraction
image classifier
-
分类号
TN915.08-34
[电子电信—通信与信息系统]
TP181
[自动化与计算机技术—控制理论与控制工程]
-