期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于软提示微调和强化学习的网络安全命名实体识别方法研究
1
作者 田泽庶 刘春雨 +3 位作者 张云婷 张嘉宇 孟超 张宏莉 《通信学报》 EI CSCD 北大核心 2024年第10期1-16,共16页
随着网络技术的迅猛发展,新型网络安全威胁不断涌现,网络安全命名实体识别重要性日益增加。针对现有基于大语言模型的命名实体识别方法在网络安全领域识别准确率差的问题,提出了一种结合软提示微调和强化学习的网络安全命名实体识别方... 随着网络技术的迅猛发展,新型网络安全威胁不断涌现,网络安全命名实体识别重要性日益增加。针对现有基于大语言模型的命名实体识别方法在网络安全领域识别准确率差的问题,提出了一种结合软提示微调和强化学习的网络安全命名实体识别方法。通过结合软提示微调技术,针对网络安全领域的复杂性,精细调整大语言模型的识别能力,提升模型对网络安全命名实体的识别准确率,同时优化训练效率。此外,提出了基于强化学习的网络安全实体筛选器,可以有效去除训练集中的低质量标注,从而提升识别准确率。在2个开源基准网络安全实体识别数据集上评估了所提方法,实验结果表明,所提方法的F1值优于现有最佳的网络安全命名实体识别方法。 展开更多
关键词 网络安全命名实体识别 软提示微调 强化学习 大规模预训练模型
在线阅读 下载PDF
基于深度学习的网络安全命名实体识别方法 被引量:1
2
作者 李大岭 张浩军 +1 位作者 王家慧 李世龙 《无线电工程》 2024年第3期644-652,共9页
针对中文网络安全领域缺乏公开数据集和有效的命名实体识别(Named Entity Recognition,NER)方法,提出一种融合汉字多源信息的网络安全NER方法。通过构建数据集中所有字符的偏旁和字频向量表,增强了中文字向量的特征表达能力,嵌入到改进... 针对中文网络安全领域缺乏公开数据集和有效的命名实体识别(Named Entity Recognition,NER)方法,提出一种融合汉字多源信息的网络安全NER方法。通过构建数据集中所有字符的偏旁和字频向量表,增强了中文字向量的特征表达能力,嵌入到改进的词汇融合模型中进行字向量与词向量的融合,输入到条件随机场(Conditional Random Fields,CRF)进行解码。实验结果表明,该方法在保持较快解码速度和占用较低计算机资源的情况下,在网络安全数据集上,其准确率、召回率和F1值分别为0.8649、0.8402和0.8523,均优于现有模型,能够为后续网络安全知识图谱的构建提供支撑。 展开更多
关键词 网络安全 中文命名实体识别 预训练模型 词向量融合 条件随机场
在线阅读 下载PDF
基于ERNIE-BiGRU-CRF模型的煤矿安全隐患命名实体智能识别研究 被引量:1
3
作者 刘飞翔 李泽荃 +1 位作者 赵嘉良 李靖 《煤炭工程》 北大核心 2024年第2期206-212,共7页
为充分挖掘煤矿安全隐患文本关键知识,帮助煤矿企业安全管理人员更好的开展隐患排查治理工作,提出一种基于预训练语言模型的命名实体识别方法。首先定义煤矿安全隐患实体类别,并采用BIO标注策略构建了7个实体类别和15个实体标签;然后将... 为充分挖掘煤矿安全隐患文本关键知识,帮助煤矿企业安全管理人员更好的开展隐患排查治理工作,提出一种基于预训练语言模型的命名实体识别方法。首先定义煤矿安全隐患实体类别,并采用BIO标注策略构建了7个实体类别和15个实体标签;然后将收集到的煤矿隐患排查数据进行预处理,由煤矿安全领域专家人工标注相关实体,得到1500条煤矿安全隐患命名实体标准数据集;最后采用ERNIE预训练模型对煤矿安全隐患文本词向量进行表征、同时利用BiGRU结构进行上下文语义特征提取以及CRF模型进行实体标签解码,完成煤矿安全隐患命名实体识别研究。实验结果表明:ERNIE-BiGRU-CRF模型在序列标注任务上的精确率、召回率和F1值分别为56.69%、69.23%和62.34%,较于BiLSTM-CRF基线模型分别提高了6.85%、13.74%和9.83%,并且实体抽取结果与实际标注结果相差不大。另外,消融实验也验证了BiGRU层能够更好的捕捉煤矿安全隐患文本上下文语义依赖关系以及CRF层能够进一步优化标签序列的有效性。 展开更多
关键词 煤矿安全隐患 ERNIE-BiGRU-CRF算法模型 命名实体识别 信息抽取
在线阅读 下载PDF
结合ChineseBERT和多特征网络的数学命名实体识别 被引量:1
4
作者 白建侠 《信息技术》 2024年第8期158-162,共5页
针对基础深度学习模型特征提取能力不足,词向量语义表达不准确等问题,提出了结合ChineseBERT和多特征网络的数学命名实体识别模型。ChineseBERT结合当前词的上下文动态调整向量表示,提高词向量语义表示准确性;多特征网络通过改进的卷积... 针对基础深度学习模型特征提取能力不足,词向量语义表达不准确等问题,提出了结合ChineseBERT和多特征网络的数学命名实体识别模型。ChineseBERT结合当前词的上下文动态调整向量表示,提高词向量语义表示准确性;多特征网络通过改进的卷积网络和双向简单循环单元同时捕捉字符局部和全局序列特征,软注意力机制识别出对实体识别影响较大的关键特征,由条件随机场输出识别结果。在真实数学数据集进行实验,结果表明该模型F1分数达到了97.67%,高于近期表现较好的深度学习模型,简单循环单元训练效率更高,证明了模型的有效性。 展开更多
关键词 命名实体识别 ChineseBERT 多特征网络 多尺度卷积 软注意力
在线阅读 下载PDF
网络威胁情报实体识别研究综述
5
作者 王旭仁 魏欣欣 +4 位作者 王媛媛 姜政伟 江钧 杨沛安 刘润时 《信息安全学报》 CSCD 2024年第6期74-99,共26页
由于网络环境愈发复杂,网络安全形势日渐严峻,保护网络免受外来攻击成为一项重要的工作。为了使网络空间攻防技术变为主动防御的形式,网络威胁情报应运而生。通过对网络威胁情报进行分析和检测,搜集情报证据,能够预防攻击行为的发生。因... 由于网络环境愈发复杂,网络安全形势日渐严峻,保护网络免受外来攻击成为一项重要的工作。为了使网络空间攻防技术变为主动防御的形式,网络威胁情报应运而生。通过对网络威胁情报进行分析和检测,搜集情报证据,能够预防攻击行为的发生。因此,通过共享网络威胁情报来抵御网络攻击变得愈发重要。然而,网络威胁情报通常以非结构化的形式共享,将其转化为半结构化或结构化数据对后续很多任务来讲尤为重要,命名实体识别技术能够实现这一点。虽然在通用领域的命名实体识别已经取得了非常不错的成果,但在网络威胁情报领域却仍然存在很多问题。本文首先介绍威胁情报相关背景,及其与命名实体识别之间的联系。然后根据命名实体识别技术发展的时间顺序总结基于规则和词典的实体识别技术、基于无监督学习的实体识别技术、基于特征的监督学习实体识别技术、基于深度学习的实体识别技术等,全面总结威胁情报领域命名实体识别的研究现状和未来的发展方向。最后,对比研究威胁情报领域命名实体识别所使用的语料库,使用SOTA深度学习方法进行实验,分析总结出威胁情报领域数据集所存在的问题。提出的BBC(BERT-BiGRU-CRF)深度学习实体识别模型具有最好的实验效果,在AutoLabel数据集、DNRTI数据集、CTIReports数据集,以及APTNER数据集上分别达到97.36%、90.40%、82.87%、73.91%的F1值。 展开更多
关键词 命名实体识别 网络威胁情报 深度学习 网络威胁情报数据集
在线阅读 下载PDF
融合词汇信息的煤矿安全事故实体提取
6
作者 吕惠林 董佳瑶 +1 位作者 袁林 李利 《工矿自动化》 北大核心 2025年第4期131-139,共9页
命名实体识别是构建煤矿安全事故领域知识图谱的基本任务,但中文缺乏明显的词汇边界特征,导致现有实体提取模型对词汇信息利用不充分。针对上述问题,提出了一种融合词汇信息的煤矿安全事故实体提取模型——融合词汇信息的RoBERTa-BiLSTM... 命名实体识别是构建煤矿安全事故领域知识图谱的基本任务,但中文缺乏明显的词汇边界特征,导致现有实体提取模型对词汇信息利用不充分。针对上述问题,提出了一种融合词汇信息的煤矿安全事故实体提取模型——融合词汇信息的RoBERTa-BiLSTM-CRF模型。首先,构建煤矿安全领域专业词典,采用RoBERTa获取字符特征向量,采用AC自动机算法进行字词匹配,得到字符对应的潜在词汇,采用Glove获取词汇特征向量。然后,通过自注意机制分配权重,将基于RoBERTa得到的字符特征向量和基于GloVe得到的词汇特征向量进行融合,得到包含词汇信息的融合向量。最后,将融合向量作为BiLSTM-CRF的输入,得到最优预测序列结果,实现煤矿安全事故实体提取。实验结果表明:(1)融合词汇信息的RoBERTa-BiLSTM-CRF模型对煤矿安全领域12种实体提取的F_1达91.63%,较RoBERTa-BiLSTM-CRF模型提高了1.63%。(2)融合词汇信息的RoBERTa-BiLSTM-CRF模型在整体实体提取任务及各类实体类型的提取任务中,综合性能优于其他模型,说明模型架构设计对不同实体类型具有广泛适用性。 展开更多
关键词 煤矿安全事故 实体提取 词汇信息 本体模型 实体标注 命名实体识别
在线阅读 下载PDF
威胁情报中命名实体识别技术研究与分析
7
作者 池亚平 徐子涵 +2 位作者 吴冰 王志强 彭文龙 《信息安全研究》 CSCD 北大核心 2024年第12期1122-1127,共6页
面对日益复杂多变的网络安全攻击,迅速获取最新的网络威胁情报对于实时识别、阻断和追踪网络攻击至关重要.解决这一问题的关键在于如何有效地获取网络威胁情报数据,而命名实体识别技术是解决这一问题的热点技术之一.系统分析了多种基于... 面对日益复杂多变的网络安全攻击,迅速获取最新的网络威胁情报对于实时识别、阻断和追踪网络攻击至关重要.解决这一问题的关键在于如何有效地获取网络威胁情报数据,而命名实体识别技术是解决这一问题的热点技术之一.系统分析了多种基于深度学习的命名实体识别方法,而后设计了一种适用于威胁情报领域的命名实体识别模型,并进行了实验验证和分析.最后对命名实体识别方法面临的挑战及其在网络安全领域的发展前景进行了分析和展望. 展开更多
关键词 网络安全攻击 威胁情报 命名实体识别 深度学习 挑战分析
在线阅读 下载PDF
基于多特征融合嵌入与DCNN的临床命名实体识别模型研究
8
作者 杨旭 梁志剑 《中北大学学报(自然科学版)》 CAS 2024年第3期265-273,共9页
针对目前最先进的临床命名实体识别(Cinical Named Entity Recognition,CNER)模型未能充分挖掘文本的全局信息和语义特征,以及未能解决文本中的字符替换等问题,改进了传统的单词嵌入模型,并在此基础上提出了一种结合深度卷积神经网络和... 针对目前最先进的临床命名实体识别(Cinical Named Entity Recognition,CNER)模型未能充分挖掘文本的全局信息和语义特征,以及未能解决文本中的字符替换等问题,改进了传统的单词嵌入模型,并在此基础上提出了一种结合深度卷积神经网络和双向短时记忆条件随机场(DCNN-BiLSTM-CRF)的临床文本命名实体识别方法。改进的单词嵌入模型融合词根、拼音和字符本身意义,使用了来自Transformers的双向编码器表示,使单词嵌入向量具有汉字和临床文本的特点,该方法通过在临床命名实体识别任务中引入深度卷积神经网络(Deep Convolutional Neural Networks,DCNN),解决了CNN预测时丢失部分信息无法找回的问题。通过使用DCNN,本文模型能够更有效地捕获全局信息、获取字符之间的权重关系和多层次语义特征信息,从而提高了临床命名实体识别的准确性。在数据集CCKS2017和CCKS2018上分别进行实验,实验结果表明,与基准模型相比,该模型F1值分别改善了0.48%,0.68%,0.6%,0.58%,0.04%和1.43%,2.36%,3.31%,1.11%,0.17%。为了进一步验证本文的模型,进行了两种消融实验。结果表明,在两个数据集CCKS2017和CCKS2018上本文模型对比变体模型M1,F1值分别改善了0.79%和0.84%;对比变体模型M2,F1值分别改善了0.53%和0.64%。这些实验结果证明了本文所提算法的可行性。 展开更多
关键词 临床命名实体识别 多特征融合嵌入 深度卷积神经网络 BLSTM-CRF BERT
在线阅读 下载PDF
一种基于混合神经网络的命名实体识别与共指消解联合模型 被引量:4
9
作者 郜成胜 张君福 +2 位作者 李伟平 赵文 张世琨 《电子学报》 EI CAS CSCD 北大核心 2020年第3期442-448,共7页
命名实体识别与共指消解均依赖于对实体相邻文本信息的学习,本文提出一种基于混合神经网络的命名实体识别与共指消解联合模型,共用双向长短时记忆模型LSTM编码层对输入序列中每个词前后方向上下文信息进行编码,并通过训练学习得到上下... 命名实体识别与共指消解均依赖于对实体相邻文本信息的学习,本文提出一种基于混合神经网络的命名实体识别与共指消解联合模型,共用双向长短时记忆模型LSTM编码层对输入序列中每个词前后方向上下文信息进行编码,并通过训练学习得到上下文信息传递到前馈神经网络FFNN模型以提高共指消解精度,通过将领域文档及篇章语义向量加入FFNN,改进共指消解算法并优化共指消解模型.基于领域文本数据集进行联合模型训练,实验结果表明该联合模型可以有效地提高共指消解精度. 展开更多
关键词 神经网络 命名实体识别 共指消解 联合神经网络模型
在线阅读 下载PDF
结合全局信息增强的医学领域命名实体识别研究
10
作者 要媛媛 付潇 +2 位作者 杨东瑛 王洁宁 郑文 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期431-439,共9页
中文医疗问诊文本中,由于口语化的不规则表达和专业术语的频繁出现,药物名称等实体难以被精准地识别出来。为了充分利用中文句子词间关系的重要作用,提出了一种用于增强全局信息的医学命名实体识别模型。模型利用注意力机制增强了词嵌... 中文医疗问诊文本中,由于口语化的不规则表达和专业术语的频繁出现,药物名称等实体难以被精准地识别出来。为了充分利用中文句子词间关系的重要作用,提出了一种用于增强全局信息的医学命名实体识别模型。模型利用注意力机制增强了词嵌入表征,并在使用双向长短时记忆网络的序列处理能力获取上下文信息的基础上,同时从两个方面丰富了句子的全局信息表示。其一是根据句法关系获取词语之间额外依赖关系构建了图卷积网络层用于丰富词间的依赖;其二是构建了辅助任务用于预测词间句法依赖关系的类别。在中文医疗问诊数据集上的实验结果表明,模型具有很好的竞争力,F1值达到94.54%。与其他模型相比,在药物和症状等实体类别的识别上取得了明显提高。在微博公开数据集上的实验也表明,模型具有通用领域的应用价值。 展开更多
关键词 注意力机制 双向长短时记忆网络 图卷积网络 医疗问诊 命名实体识别
在线阅读 下载PDF
基于多核卷积神经网络(BERT+Multi-CNN+CRF)的水产医学嵌套命名实体识别 被引量:11
11
作者 刘巨升 于红 +5 位作者 杨惠宁 邵立铭 宋奇书 李光宇 张思佳 孙华 《大连海洋大学学报》 CAS CSCD 北大核心 2022年第3期524-530,共7页
为解决水产医学命名实体识别中存在的嵌套实体识别准确率不高的问题,提出一种基于多核卷积的命名实体识别模型(BERT+Multi-CNN+CRF),采用多核卷积神经网络提取嵌套实体特征,通过BERT(bidirectional encoder representations from transf... 为解决水产医学命名实体识别中存在的嵌套实体识别准确率不高的问题,提出一种基于多核卷积的命名实体识别模型(BERT+Multi-CNN+CRF),采用多核卷积神经网络提取嵌套实体特征,通过BERT(bidirectional encoder representations from transformers)方法对输入语料进行预训练,丰富嵌套实体位置向量信息,获得嵌套实体输入特征矩阵,将提取特征矩阵与输入特征矩阵融合,以增强嵌套实体的特征表示,并进行不同模型的对比试验。结果表明,本文中提出的BERT+Multi-CNN+CRF模型,在水产医学嵌套命名实体识别任务中的准确率、召回率和F1值分别为88.04%、88.92%和88.48%,与识别准确率较高的BERT+BiLSTM+ATT+CRF模型相比,分别提高了2.25%、3.23%和2.74%。研究表明,本文中提出的BERT+Multi-CNN+CRF模型可有效解决水产医学嵌套实体识别准确率不高的问题,是一种有效的水产医学嵌套命名实体识别方法。 展开更多
关键词 水产医学 BERT 嵌套命名实体识别 卷积神经网络 多卷积核
在线阅读 下载PDF
基于Hadoop的网络行为大数据安全实体识别系统设计 被引量:15
12
作者 李芳菊 《现代电子技术》 北大核心 2019年第17期75-79,共5页
为解决大数据网络的负载拥塞问题,设计基于Hadoop的网络行为大数据安全实体识别系统。在Hadoop分布式框架中,规划网络行为大数据接收模块与识别发送模块的从属位置,实现网络行为大数据安全实体识别系统的硬件运行环境搭建。在此基础上,... 为解决大数据网络的负载拥塞问题,设计基于Hadoop的网络行为大数据安全实体识别系统。在Hadoop分布式框架中,规划网络行为大数据接收模块与识别发送模块的从属位置,实现网络行为大数据安全实体识别系统的硬件运行环境搭建。在此基础上,分析实体识别地址,在保持良好均衡处理结果的条件下,对识别信息进行导入导出与存储处理,实现系统软件运行环境搭建,结合基础硬件执行条件,完成基于Hadoop的网络行为大数据安全实体识别系统设计。对比实验结果表明,与理想状态下的识别系统相比,应用基于Hadoop的安全实体识别系统后,大流网络通道的占用率明显下降,单位时间内分流转发的安全信息总量提升,大数据网络的负载拥塞现状得到有效缓解。 展开更多
关键词 网络行为 大数据 安全实体识别 Hadoop框架 接收发送 信息存储 系统设计
在线阅读 下载PDF
基于循环和卷积神经网络融合的中文命名实体识别与应用 被引量:1
13
作者 汪小龙 吴曲宁 范佳佳 《兰州工业学院学报》 2021年第3期77-82,共6页
针对中文命名实体识别中循环神经网络不能很好地处理长序列问题,以及用单一向量去表征汉字时,由于汉字存在多义性而导致识别结果不佳的问题,提出一种识别效果更好的方法——BLDC-NER模型.首先利用BERT(Bidirectional Encoder Representa... 针对中文命名实体识别中循环神经网络不能很好地处理长序列问题,以及用单一向量去表征汉字时,由于汉字存在多义性而导致识别结果不佳的问题,提出一种识别效果更好的方法——BLDC-NER模型.首先利用BERT(Bidirectional Encoder Representations from Transformers)预训练模型根据字的上下文语境生成字的动态语义向量,然后将字向量序列分别通过双向长短时记忆网络层和膨胀卷积层进行语义编码,融合2个网络层输出的语义向量,经过条件随机场得到最终结果.试验结果表明:BLDC-NER模型在训练过程中比单一循环神经网络收敛速度更快,识别效果更好,在MSRA、RESUME公开数据集上的F 1值分别达到了94.78%、95.68%;另外,将BLDC-NER模型应用在建筑施工安全事故领域,在自制的数据集上F 1值为95.24%. 展开更多
关键词 中文命名实体识别 BERT模型 双向长短时神经网络 膨胀卷积神经网络 建筑施工安全
在线阅读 下载PDF
中文命名实体识别的傅立叶卷积网络
14
作者 李彪 《现代信息科技》 2022年第2期104-106,共3页
针对transformer编码器架构在中文命名实体识别任务上表现不佳的问题,提出使用无参数化的傅立叶子层替换编码器中自注意力子层,使用卷积神经网络替代前馈神经网络。实验表明,采用结合傅立叶变换和卷积神经网络的transformer encoder架... 针对transformer编码器架构在中文命名实体识别任务上表现不佳的问题,提出使用无参数化的傅立叶子层替换编码器中自注意力子层,使用卷积神经网络替代前馈神经网络。实验表明,采用结合傅立叶变换和卷积神经网络的transformer encoder架构的算法,可以在较小的字符嵌入和参数量下实现性能提升,且训练过程更快。 展开更多
关键词 中文命名实体识别 编码器 傅立叶变换 卷积神经网络
在线阅读 下载PDF
基于混合深度学习的藏医古籍命名实体识别研究 被引量:7
15
作者 刘佳 边俊伊 《现代情报》 CSSCI 2023年第11期37-46,共10页
[目的/意义]针对藏医古籍知识组织与开发不足的问题,利用混合深度学习方法构建面向藏医古籍的命名实体识别模型,为藏医古籍知识的深度开发与利用提供方法支持。[方法/过程]根据藏医古籍知识特点,构建ALBERT-BiLSTM-CRF模型。以《四部医... [目的/意义]针对藏医古籍知识组织与开发不足的问题,利用混合深度学习方法构建面向藏医古籍的命名实体识别模型,为藏医古籍知识的深度开发与利用提供方法支持。[方法/过程]根据藏医古籍知识特点,构建ALBERT-BiLSTM-CRF模型。以《四部医典》为数据集,在人工标注与文本预处理的基础上,进行命名实体识别实验,并将实验结果与其他3种常见模型进行对比分析。[结果/结论]ALBERT-BiLSTM-CRF模型对藏医古籍实体识别效果最好,F1-score达到96.28%,与其他方法相比提升约7个百分点。 展开更多
关键词 混合深度学习 命名实体识别 ALBERT 双向长短期记忆网络 条件随机场 藏医古籍 知识组织 《四部医典》
在线阅读 下载PDF
基于中文预训练的安全事件实体识别研究 被引量:1
16
作者 朱磊 董林靖 +4 位作者 黑新宏 王一川 彭伟 刘雁孝 盘隆 《信息安全研究》 2021年第7期652-660,共9页
为提高公共安全事件中中文命名实体识别的效率,对《中文突发事件语料库》进行研究,通过对预训练任务的优化和训练集的迁移学习,提出基于领域预训练的公共安全事件实体识别方法.首先,对预训练模型RoBERTa进行优化,更新安全领域词典,实现... 为提高公共安全事件中中文命名实体识别的效率,对《中文突发事件语料库》进行研究,通过对预训练任务的优化和训练集的迁移学习,提出基于领域预训练的公共安全事件实体识别方法.首先,对预训练模型RoBERTa进行优化,更新安全领域词典,实现数据增强,并将中文单字符的掩码机制替换为全词掩码机制,获取公共安全事件中领域实体特征和语义信息.接着,使用10万条在线新闻语料进行领域预训练,生成了公共安全领域预训练模型RoBERTa+,增强下游任务命名实体识别的能力.最后,采用双向长短时记忆网络BiLSTM获取语料文本的上下文信息特征,经过条件随机场CRF进行序列解码标注,完成公共安全领域的中文命名实体识别任务.实验结果表明,改进的模型在中文突发事件语料库中准确率平均可达到87%以上,召回率和F1值都达到了80%以上,从而证明了领域预训练可以有效提升公共安全事件中实体信息的识别能力. 展开更多
关键词 公共安全事件 中文实体识别 领域预训练 双向长短时记忆网络 条件随机场 RoBERTa预训练语言模型
在线阅读 下载PDF
跨度语义增强的命名实体识别方法 被引量:3
17
作者 耿汝山 陈艳平 +3 位作者 唐瑞雪 黄瑞章 秦永彬 董博 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第7期118-126,共9页
针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两... 针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两种向量进行拼接作为模型输入向量,对输入向量进行枚举拼接形成跨度信息矩阵;然后,使用多维循环神经网络和注意力网络对跨度信息矩阵进行运算,增强跨度之间的语义联系;最后,将跨度信息增强后的矩阵进行跨度分类以识别命名实体。实验表明:与传统的跨度方法相比该方法能够有效增强跨度之间的语义依赖特征,从而提升命名实体识别的召回率;该方法在ACE2005英文数据集上比传统的方法召回率提高了0.42%,并且取得了最高的F1值。 展开更多
关键词 命名实体识别 跨度语义增强 多维循环神经网络 ALBERT预训练语言模型
在线阅读 下载PDF
基于ELMo-GCN的核电领域命名实体识别 被引量:4
18
作者 荆鑫 王华峰 +2 位作者 刘潜峰 罗嗣梧 张凡 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第12期2556-2565,共10页
在核电领域的知识管理过程中,需要使用命名实体识别技术抽取高质量语义实体,以进行核电领域文本的智能分析和处理。在现有研究的基础上,通过增强网络对上下文信息的提取能力,提升模型对嵌套命名实体的识别准确率。经实验验证,所提方法... 在核电领域的知识管理过程中,需要使用命名实体识别技术抽取高质量语义实体,以进行核电领域文本的智能分析和处理。在现有研究的基础上,通过增强网络对上下文信息的提取能力,提升模型对嵌套命名实体的识别准确率。经实验验证,所提方法较现有方法在准确率与召回率指标上提升显著,与BiFlaG网络对比,准确率提高9.52%,召回率提高8.51%,F_(1)值提高9.02%。所提方法对嵌套命名实体识别优于BiFlaG等网络。 展开更多
关键词 命名实体识别 核电 双向语言模型 图卷积神经网络 自注意力机制
在线阅读 下载PDF
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别 被引量:17
19
作者 程名 于红 +4 位作者 冯艳红 任媛 付博 刘巨升 杨鹤 《大连海洋大学学报》 CAS CSCD 北大核心 2020年第2期296-301,共6页
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF(BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模... 为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF(BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。 展开更多
关键词 渔业标准命名实体识别 标注方法 双向长短时记忆网络(BiLSTM) 注意力机制 条件随机场
在线阅读 下载PDF
基于相对位置自注意力机制的《伤寒论》实体识别
20
作者 徐弘民 李红岩 +3 位作者 郎许锋 周作建 凌云 王子琰 《南京中医药大学学报》 CSCD 北大核心 2024年第12期1357-1365,共9页
目的《伤寒论》是中医学“四大经典”之一,其中富含大量的医疗实践经验以及用药规律,针对《伤寒论》古籍文献数据挖掘中不充分,尤其是古籍文献上下文语义关系复杂,难以全局把握其中关联等问题,对《伤寒论》进行命名实体识别,有助于深入... 目的《伤寒论》是中医学“四大经典”之一,其中富含大量的医疗实践经验以及用药规律,针对《伤寒论》古籍文献数据挖掘中不充分,尤其是古籍文献上下文语义关系复杂,难以全局把握其中关联等问题,对《伤寒论》进行命名实体识别,有助于深入挖掘其潜在知识。方法根据《伤寒论》古籍文本专业术语多、句式简练的特点,构建双向编码器表征法(Bert)-双向长短期记忆网络(BiLSTM)-相对位置自注意力(RPRSA)-条件随机场(CRF)模型,通过添加相对位置自注意力(RPRSA)层构造命名实体识别模型以识别《伤寒论》中的实体并学习不同层次的信息,从而提高对《伤寒论》中医古籍实体识别的准确度。结果通过实验验证,提出的命名实体识别模型在《伤寒论》数据集上的F1分数(F1-Score)、精确率与召回率分别能够达到88.24%、88.48%与88.00%,通过对比发现其表现优于其他常见命名实体识别模型。结论基于相对位置自注意力机制的模型相较于其他模型在《伤寒论》实体识别任务中表现更佳,为《伤寒论》乃至各类中医古籍信息抽取以及数据挖掘提供基础和助力,为中医智能辅助诊疗提供了有效手段。 展开更多
关键词 相对位置自注意力 命名实体识别 《伤寒论》 双向长短期记忆网络
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部