期刊文献+
共找到220篇文章
< 1 2 11 >
每页显示 20 50 100
中医文本命名实体识别研究综述
1
作者 时倩如 李贺 +2 位作者 于雯倩 沈旺 张承坤 《现代情报》 北大核心 2025年第2期4-16,共13页
[目的/意义]中医文本中包含了大量领域相关知识,可为准确诊断和有效的疾病防治提供指导。本文对中医文本命名实体识别(NER)研究进行系统性综述。[方法/过程]从中医文本的特征出发,探讨了中医文本NER在知识体系、语料构建和技术算法层次... [目的/意义]中医文本中包含了大量领域相关知识,可为准确诊断和有效的疾病防治提供指导。本文对中医文本命名实体识别(NER)研究进行系统性综述。[方法/过程]从中医文本的特征出发,探讨了中医文本NER在知识体系、语料构建和技术算法层次面临的挑战;梳理中医文本NER语料构建中可用的术语标准、实体类型和标注原则与方法;归纳中医文本NER技术的一般框架、常用方法和近期趋势,并总结评估指标。[结果/结论]建议未来研究可从以下方向开展:在语料层面制定标注规范并构建高质量数据集,在算法层面探索针对小样本问题的数据优化、针对复杂实体的识别模型和增强模型解释性,以提高中医NER的效果。 展开更多
关键词 命名实体识别 中医 深度学习 自然语言处理 综述
在线阅读 下载PDF
基于图文鲁棒性表征的社交媒体多模态命名实体识别
2
作者 袁一铭 郭军军 余正涛 《微电子学与计算机》 2025年第2期50-58,共9页
多模态命名实体识别(Multimodal Named Entity Recognition,MNER)旨在融合视觉图像信息提高文本实体识别的性能。以往的MNER研究主要集中多模态融合方法上,然而,文本和其对应的图像可能不完全匹配,而图文对齐噪声通常不可避免,不相关的... 多模态命名实体识别(Multimodal Named Entity Recognition,MNER)旨在融合视觉图像信息提高文本实体识别的性能。以往的MNER研究主要集中多模态融合方法上,然而,文本和其对应的图像可能不完全匹配,而图文对齐噪声通常不可避免,不相关的图像区域可能会误导文本信息,导致模型性能下降。为此,本文提出了一种基于跨模态语义交互掩码模型(Cross-Modal Semantic Interaction Mask model,CMSIM)的噪声鲁棒MNER方法。该方法通过跨模态交互掩码机制构建文本-图像关系感知注意mask矩阵,并基于文本-图像交互掩码过滤视觉噪声信息并融合鲁棒图文特征,从而提升命名实体识别的性能。在两个公开数据集上测试结果表明,该模型能够提升MNER任务实体识别的准确率,证明了所提方法的有效性。 展开更多
关键词 多模态命名实体识别 模态表征 对齐噪声 双向交互 注意力机制
在线阅读 下载PDF
基于多头注意力机制的学科知识命名实体识别研究
3
作者 孙悦 熊旭辉 刘家琳 《科学技术创新》 2025年第5期109-113,共5页
在构建学科知识图谱过程中,常规命名实体识别技术面临实体界定模糊和知识粒度大等问题,影响识别精度与效率。为此,本研究提出基于BERT-BiLSTM-CRF的模型,引入多头注意力机制,以增强模型对序列数据的整体把握力,提高识别精度。该模型结合... 在构建学科知识图谱过程中,常规命名实体识别技术面临实体界定模糊和知识粒度大等问题,影响识别精度与效率。为此,本研究提出基于BERT-BiLSTM-CRF的模型,引入多头注意力机制,以增强模型对序列数据的整体把握力,提高识别精度。该模型结合了BERT的深层语义解析、BiLSTM的序列模式捕捉和CRF的标签预测优势,与BILSTM-CRF、BERT-CRF及BERT-BiLSTM-CRF模型进行性能对比。实验结果显示,本文模型在精确率、召回率及F1值均表现最佳。 展开更多
关键词 命名实体识别 BERT-BiLSTM-CRF模型 多头注意力机制
在线阅读 下载PDF
基于RoBERTa-Span-Attack的标签指针网络军事命名实体识别 被引量:2
4
作者 罗兵 张显峰 +1 位作者 段立 陈琳 《海军工程大学学报》 CAS 北大核心 2024年第1期76-82,93,共8页
军事领域文本中存在大量军事实体信息,准确识别这些信息是军事文本信息提取和构建军事知识图谱的基础性任务。首先,提出了一种基于RoBERTa预训练模型、跨度和对抗训练的标签指针网络的融合深度模型(RoBERTa-Span-Attack),用于中文军事... 军事领域文本中存在大量军事实体信息,准确识别这些信息是军事文本信息提取和构建军事知识图谱的基础性任务。首先,提出了一种基于RoBERTa预训练模型、跨度和对抗训练的标签指针网络的融合深度模型(RoBERTa-Span-Attack),用于中文军事命名实体识别;然后,采用了一种基于Span的标签指针网络,同时完成实体的起止位置和类别的识别任务;最后,在模型训练过程中加入对抗训练策略,通过添加一些扰动来生成对抗样本进行训练。在军事领域数据集上的实验结果表明:所提出的军事领域命名实体识别模型相较于BERT-CRF、BERT-Softmax和BERT-Span,在识别准确度上具有更优的效果。 展开更多
关键词 军事命名实体识别 预训练模型 跨度 标签指针网络 对抗训练
在线阅读 下载PDF
基于命名实体识别的《神农本草经》知识图谱构建及可视化分析 被引量:1
5
作者 佟琳 张华敏 +4 位作者 佟旭 雷蕾 王程 曾子玲 杨洪军 《中国中医药信息杂志》 CAS CSCD 2024年第8期37-43,共7页
目的构建《神农本草经》知识图谱,分析本草知识、挖掘隐性知识并进行可视化展示,为古籍研究提供方法学参考。方法梳理并表述《神农本草经》文献涉及的知识实体类型和实体间关系,应用BIO序列标注方法生产训练语料数据集,使用自主研发的C... 目的构建《神农本草经》知识图谱,分析本草知识、挖掘隐性知识并进行可视化展示,为古籍研究提供方法学参考。方法梳理并表述《神农本草经》文献涉及的知识实体类型和实体间关系,应用BIO序列标注方法生产训练语料数据集,使用自主研发的CNLP文本标注系统进行文本标注,采用BERT模型识别命名实体,基于规则与语义关联设定确定实体间关系,经知识融合后,用Cypher语言导入图数据库Neo4j-community4.4.9进行存储和可视化展示,构建知识图谱。结果《神农本草经》知识图谱包含5273个节点、11064个关系,其模式层包含14种实体类、16种关系类型。可通过Cypher语言查询,从中药分类、药性理论、七情配伍、中药应用方面进行知识的可视化展示。结论本研究构建的知识图谱可直观反映《神农本草经》所载知识及隐性关系,适用于中医药古籍的知识挖掘及直观多维展示。 展开更多
关键词 知识图谱 神农本草经 本草知识 命名实体识别
在线阅读 下载PDF
基于RoBERTa_BiLSTM_CRF的文本情报命名实体识别 被引量:2
6
作者 陆泽健 赵文 尹港港 《中国电子科学研究院学报》 2024年第5期442-447,共6页
随着网络信息的爆炸式增长,威胁情报分析作为军事情报分析与战略决策的重要组成部分,其面临着来源多样化和信息结构复杂化的挑战。传统的人工信息提取方法在处理这些大量结构化及非结构化信息时效率低下,准确性有限。文中针对这一挑战,... 随着网络信息的爆炸式增长,威胁情报分析作为军事情报分析与战略决策的重要组成部分,其面临着来源多样化和信息结构复杂化的挑战。传统的人工信息提取方法在处理这些大量结构化及非结构化信息时效率低下,准确性有限。文中针对这一挑战,提出了一种结合RoBERTa、BiLSTM和条件随机场(Conditional Random Fields,CRF)的命名实体识别新算法。此算法通过Ro-BERTa模型深入挖掘文本的语义特征,BiLSTM模型捕捉序列上下文信息,CRF层用于精确的实体标记,从而有效提升信息提取的准确率和效率。本文基于开源情报语料库构建了一个涉及导弹发射事件的命名实体识别数据集,并在此基础上进行了实验,结果表明,该方法在精确率、召回率及F1值等关键指标上相较于主流深度学习方法表现出显著的性能提升,其中F1值高达94.21%。 展开更多
关键词 威胁情报分析 命名实体识别 RoBERTa BiLSTM CRF
在线阅读 下载PDF
CLGLF:置信学习引导标签融合的多模态命名实体识别方法
7
作者 王海荣 王彤 +2 位作者 徐玺 荆博祥 陈芳萍 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2429-2437,共9页
为解决多模态命名实体识别中存在的视觉语义理解和多模态语义的偏差问题,本文提出了置信学习引导标签融合的多模态命名实体识别方法 .该方法调用BLIP-2预训练模型生成图像描述,将其与输入的文本拼接,进行图文联合编码实现多模态特征融合... 为解决多模态命名实体识别中存在的视觉语义理解和多模态语义的偏差问题,本文提出了置信学习引导标签融合的多模态命名实体识别方法 .该方法调用BLIP-2预训练模型生成图像描述,将其与输入的文本拼接,进行图文联合编码实现多模态特征融合,对多模态表征和文本表征解码后得到候选标签和文本标签;在采用KL散度损失函数对齐两组标签的基础上,计算置信分数用来评估多模态表征质量,设置置信阈值辅助筛选出有偏差的候选标签,并使用相应位置的文本标签替换有偏差的候选标签,实现标签的融合,最终完成多模态命名实体识别.为了验证本文方法,在Twitter-2015和Twitter-2017多模态数据集上进行实验,并将实验结果与MSB、UMT等7种主流方法进行对比,实验结果证明了本文方法的有效性. 展开更多
关键词 多模态命名实体识别 图像描述 置信学习 多模态语义偏差 信息抽取
在线阅读 下载PDF
面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例
8
作者 刘思得 李东升 《现代情报》 CSSCI 北大核心 2024年第12期102-121,共20页
[目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧... [目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧化服务产生重要影响和价值,可有效识别信息中的人名、地名、组织机构、资源利用、服务特色和文化推广等实体,为知识组织、信息检索等提供支持。[方法/过程]本文利用命名实体识别技术分析高校图书馆智慧化服务系统的应用前景,通过构建高质量的高校图情语料库,提供高质量训练数据,以满足领域内特定的实体识别需求的准确性和适应性,为优化图书馆智慧服务系统提供基础。采用基于深度学习的ALBERT-BILSTM-CRF模型,用以验证命名实体识别任务的效果,将该模型应用于高校图书馆服务推荐和知识图谱的案例分析,并与现有的国内外主流大语言模型进行了效果比较。[结果/结论]结果表明,本文提出的方法有效地提高了高校图情领域命名实体识别的性能,有助于实现图书馆智慧化服务的推广与应用,同时也减少了资源浪费和训练成本。此外,本文还探讨了服务于图书馆领域大语言模型LibraryGPT的可能性,以便对未来高校图书馆智慧服务的推广和发展提供参考和借鉴。 展开更多
关键词 高校图书馆 智慧服务 命名实体识别 大语言模型
在线阅读 下载PDF
一种融入领域知识的领域短文本命名实体识别方法
9
作者 戎纪光 任志国 李书强 《指挥控制与仿真》 2024年第3期123-129,共7页
针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词... 针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词嵌入处理,并基于词向量相似性计算,发现与待识别领域命名实体相似的关键知识实体,将其替换为关键知识实体后生成新的领域短文本,与未替换的领域短文本一同输入模型中进行命名实体识别,使领域知识融入领域短文本的命名实体识别过程,实验结果表明本方法较现有其他同类方法获得了较优的识别能力。 展开更多
关键词 知识图谱 知识实体 命名实体识别 双向长短期记忆网络
在线阅读 下载PDF
基于深度学习的命名实体识别研究综述 被引量:1
10
作者 张继元 钱育蓉 +2 位作者 冷洪勇 侯树祥 陈嘉颖 《现代电子技术》 北大核心 2024年第6期32-42,共11页
命名实体识别是自然语言处理领域的一项关键任务,其目的在于从自然语言文本中识别出具有特定含义的实体,如人名、地名、机构名和专有名词等。在命名实体识别任务中,研究人员提出过多种方法,包括基于知识和有监督的机器学习方法。近年来... 命名实体识别是自然语言处理领域的一项关键任务,其目的在于从自然语言文本中识别出具有特定含义的实体,如人名、地名、机构名和专有名词等。在命名实体识别任务中,研究人员提出过多种方法,包括基于知识和有监督的机器学习方法。近年来,随着互联网文本数据规模的快速扩大和深度学习技术的快速发展,深度学习模型已成为命名实体识别的研究热点,并在该领域取得显著进展。文中全面回顾现有的命名实体识别深度学习技术,主要分为四类:基于卷积神经网络模型、基于循环神经网络模型、基于Transformer模型和基于图神经网络模型的命名实体识别。此外,对深度学习的命名实体识别架构进行了介绍。最后,探讨命名实体识别所面临的挑战以及未来可能的研究方向,以期推动命名实体识别领域的进一步发展。 展开更多
关键词 命名实体识别 深度学习 自然语言处理 卷积神经网络 循环神经网络 TRANSFORMER 图神经网络
在线阅读 下载PDF
基于MacBERT和R-Drop的地质命名实体识别 被引量:1
11
作者 刘昕 徐洪珍 +1 位作者 刘爱华 邓德军 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期89-95,共7页
地质命名实体识别中常用的基于BERT预训练模型的深度学习方法是基于字的方法,没有利用词信息,且神经网络中的Dropout机制会导致训练阶段和推理阶段之间存在不一致性。针对该问题,提出了一种基于MacBERT和R-Drop的地质命名实体识别模型M... 地质命名实体识别中常用的基于BERT预训练模型的深度学习方法是基于字的方法,没有利用词信息,且神经网络中的Dropout机制会导致训练阶段和推理阶段之间存在不一致性。针对该问题,提出了一种基于MacBERT和R-Drop的地质命名实体识别模型MBCR。首先,通过MacBERT学习文本特征表示,充分利用字词信息;其次,运用BiGRU编码上下文特征,有效提取完整的语义信息;最后,采用CRF获取标签间的依赖关系,生成最优标签序列。此外,在训练过程中引入R-Drop,进一步提升模型的泛化能力。结果表明:与BiLSTM-CRF、BERTBiLSTM-CRF等模型相比,所提MBCR模型在NERdata数据集上的F1值提高了2.08百分点~4.62百分点,在Boson数据集上的F1值提高了1.26百分点~17.54百分点。 展开更多
关键词 命名实体识别 地质 MacBERT BiGRU R-Drop
在线阅读 下载PDF
基于命名实体识别的铁路应急预案智能管理方法 被引量:1
12
作者 王华 《铁道运输与经济》 北大核心 2024年第4期75-82,共8页
铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首... 铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首先,应用排版样式、编辑语义、文本语义等信息,实现流式文档结构的智能解析、附件识别及时序文档的信息综合;然后,以运维知识图谱中实体及其类别构建实体类别集,嵌入实体类别信息并与字符嵌入拼接生成增强特征,对文本进行实体的命名标识及段属性标识;最后,采用递归神经网络并引入注意力机制构建命名实体层次表达,融合结构和语义因素实现检索结果的智能排序。实验证明,该方法能准确解析文档结构并在低标注下识别命名实体,实现应急预案的智能检索与排序,可有效提高铁路应急预案管理的智能化水平。 展开更多
关键词 铁路 应急预案 命名实体识别 文档结构解析 知识图谱
在线阅读 下载PDF
基于字形特征的中文医学命名实体识别方法
13
作者 孟伟伦 郭景峰 +3 位作者 邢珂萱 魏宁 王巧梭 刘滨 《电子学报》 EI CAS CSCD 北大核心 2024年第6期1945-1954,共10页
作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特... 作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特征工程来提升模型在医疗领域上的性能.这些模型大部分源自在通用数据集上表现较好的模型,没有考虑中文医学数据集的语言特性.通过在多个医学数据集上进行统计分析,发现部分类型的医学实体在字形上具有共性,如在汉字中大部分表示疾病含义的字符都包含“疒”,大部分表示身体器官的字符都包含“月”.针对这些问题,本文提出了一种基于字形特征的中文医学命名实体识别方法,该方法通过在文本表示向量上融合字形向量以及进一步利用数据集中负样本来提升模型的准确度和泛化能力.在多个公共的中文医学数据集上的实验结果表明,该方法获得了比其他模型更好的效果,并且通过消融实验证明了融合字形特征和从负样本中学习对于该任务是有效的. 展开更多
关键词 字形 负样本 两阶段 医学信息 命名实体识别 深度学习
在线阅读 下载PDF
基于软提示微调和强化学习的网络安全命名实体识别方法研究
14
作者 田泽庶 刘春雨 +3 位作者 张云婷 张嘉宇 孟超 张宏莉 《通信学报》 EI CSCD 北大核心 2024年第10期1-16,共16页
随着网络技术的迅猛发展,新型网络安全威胁不断涌现,网络安全命名实体识别重要性日益增加。针对现有基于大语言模型的命名实体识别方法在网络安全领域识别准确率差的问题,提出了一种结合软提示微调和强化学习的网络安全命名实体识别方... 随着网络技术的迅猛发展,新型网络安全威胁不断涌现,网络安全命名实体识别重要性日益增加。针对现有基于大语言模型的命名实体识别方法在网络安全领域识别准确率差的问题,提出了一种结合软提示微调和强化学习的网络安全命名实体识别方法。通过结合软提示微调技术,针对网络安全领域的复杂性,精细调整大语言模型的识别能力,提升模型对网络安全命名实体的识别准确率,同时优化训练效率。此外,提出了基于强化学习的网络安全实体筛选器,可以有效去除训练集中的低质量标注,从而提升识别准确率。在2个开源基准网络安全实体识别数据集上评估了所提方法,实验结果表明,所提方法的F1值优于现有最佳的网络安全命名实体识别方法。 展开更多
关键词 网络安全命名实体识别 软提示微调 强化学习 大规模预训练模型
在线阅读 下载PDF
基于深度学习的网络安全命名实体识别方法 被引量:1
15
作者 李大岭 张浩军 +1 位作者 王家慧 李世龙 《无线电工程》 2024年第3期644-652,共9页
针对中文网络安全领域缺乏公开数据集和有效的命名实体识别(Named Entity Recognition,NER)方法,提出一种融合汉字多源信息的网络安全NER方法。通过构建数据集中所有字符的偏旁和字频向量表,增强了中文字向量的特征表达能力,嵌入到改进... 针对中文网络安全领域缺乏公开数据集和有效的命名实体识别(Named Entity Recognition,NER)方法,提出一种融合汉字多源信息的网络安全NER方法。通过构建数据集中所有字符的偏旁和字频向量表,增强了中文字向量的特征表达能力,嵌入到改进的词汇融合模型中进行字向量与词向量的融合,输入到条件随机场(Conditional Random Fields,CRF)进行解码。实验结果表明,该方法在保持较快解码速度和占用较低计算机资源的情况下,在网络安全数据集上,其准确率、召回率和F1值分别为0.8649、0.8402和0.8523,均优于现有模型,能够为后续网络安全知识图谱的构建提供支撑。 展开更多
关键词 网络安全 中文命名实体识别 预训练模型 词向量融合 条件随机场
在线阅读 下载PDF
基于局部增强的中文医疗命名实体识别模型
16
作者 陈晶 邢珂萱 +2 位作者 孟伟伦 郭景峰 冯建周 《通信学报》 EI CSCD 北大核心 2024年第7期171-183,共13页
医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模。针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER。首先,LENER... 医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模。针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER。首先,LENER使用包括字音、字形和语义在内的多源信息来丰富底层字符表征。然后,结合相对位置编码对滑动窗口划分出的序列片段进行局部注意力计算,并通过非线性计算融合局部信息和BiLSTM得到的全局信息。最后,对识别出的实体头部和尾部进行组合,进而提取出实体。实验结果表明,LENER模型具有良好的实体识别能力,与其他模型相比,LENER模型的F1值提升了0.5%~2.0%。 展开更多
关键词 中文命名实体识别 上下文环境 注意力机制 多源信息 滑动窗口
在线阅读 下载PDF
基于两阶段网络和提示学习的少样本中文命名实体识别
17
作者 李准 宋媚 祝义 《南京邮电大学学报(自然科学版)》 北大核心 2024年第5期87-94,共8页
基于提示学习的方法在处理少样本句子级分类任务时效果较好,然而在处理字符级的命名实体识别任务时,现有采用枚举手动构建提示模板的方法效率低下且性能不稳定。针对此问题,提出基于两阶段网络和提示学习的少样本中文命名实体识别方法... 基于提示学习的方法在处理少样本句子级分类任务时效果较好,然而在处理字符级的命名实体识别任务时,现有采用枚举手动构建提示模板的方法效率低下且性能不稳定。针对此问题,提出基于两阶段网络和提示学习的少样本中文命名实体识别方法。第一阶段网络,创新性地引入文本生成模型T5,利用提示学习的思想,将文本生成任务改造为完形填空的形式以自动生成提示模板;第二阶段网络,使用当前主流的BERT-BiLSTM-CRF网络架构进行训练。通过消融实验,探讨了提示模板更合理的嵌入方式,在Weibo、Resume和MSRA语料库上的实验结果F1值分别达到了73.58%、96.63%和95.67%,在多组对比实验中效果均为最优,表明了该方法可有效提升少样本中文命名实体识别的效果。 展开更多
关键词 深度学习 命名实体识别 大语言模型 提示学习 文本生成 少样本
在线阅读 下载PDF
基于SiKuBERT与多元数据嵌入的中医古籍命名实体识别 被引量:1
18
作者 张文东 吴子炜 +2 位作者 宋国昌 霍庆澳 王博 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期128-137,共10页
中医古籍命名实体识别是构建中医知识图谱的基础,对中医知识的提取与智能化呈现具有重要意义。然而,中医知识体系结构庞大,公开可用的语料库稀少且语义复杂,当前的研究大多关注字向量的表达,对特殊汉字的结构特征中丰富的语义特点考虑... 中医古籍命名实体识别是构建中医知识图谱的基础,对中医知识的提取与智能化呈现具有重要意义。然而,中医知识体系结构庞大,公开可用的语料库稀少且语义复杂,当前的研究大多关注字向量的表达,对特殊汉字的结构特征中丰富的语义特点考虑不充分;而且,由于汉字语义丰富,还存在潜在特征表达不足及一词多义的问题。文中结合中医古籍的语料特点与古汉字结构信息,提出了一种基于SiKuBERT与多元数据嵌入的命名实体识别方法,通过SiKuBERT创建字特征信息,在此基础上嵌入词特征与部首特征来捕捉汉字的语义信息,让具有相似部首序列的字符在空间向量中彼此接近。采用该方法对本草数据集中的人名、中草药物名,病症名、病理名、经络名进行识别,实验结果表明:文中方法能够有效抽取文本中的5类实体,F1值为86.66%,精确率达86.95%,召回率达86.37%;相较于基于字特征的SiKuBERT-CRF模型,文中方法融合了字词信息与繁体汉字的结构信息,能增强实体识别效果,总体F1值提升了2.83个百分点;此外,该方法对具有显著部首特征的中草药物名和病症名的识别效果最佳,相较于基于字特征的SiKuBERT-CRF模型,F1值分别提升了3.48和0.97个百分点。总体而言,文中方法的性能指标高于其他主流的深度学习模型,且具有良好的泛化能力。 展开更多
关键词 中医古籍 命名实体识别 《本草纲目》 SiKuBERT 多元数据嵌入
在线阅读 下载PDF
威胁情报中命名实体识别技术研究与分析
19
作者 池亚平 徐子涵 +2 位作者 吴冰 王志强 彭文龙 《信息安全研究》 CSCD 北大核心 2024年第12期1122-1127,共6页
面对日益复杂多变的网络安全攻击,迅速获取最新的网络威胁情报对于实时识别、阻断和追踪网络攻击至关重要.解决这一问题的关键在于如何有效地获取网络威胁情报数据,而命名实体识别技术是解决这一问题的热点技术之一.系统分析了多种基于... 面对日益复杂多变的网络安全攻击,迅速获取最新的网络威胁情报对于实时识别、阻断和追踪网络攻击至关重要.解决这一问题的关键在于如何有效地获取网络威胁情报数据,而命名实体识别技术是解决这一问题的热点技术之一.系统分析了多种基于深度学习的命名实体识别方法,而后设计了一种适用于威胁情报领域的命名实体识别模型,并进行了实验验证和分析.最后对命名实体识别方法面临的挑战及其在网络安全领域的发展前景进行了分析和展望. 展开更多
关键词 网络安全攻击 威胁情报 命名实体识别 深度学习 挑战分析
在线阅读 下载PDF
多模态命名实体识别方法研究进展 被引量:1
20
作者 王海荣 徐玺 +1 位作者 王彤 荆博祥 《郑州大学学报(工学版)》 CAS 北大核心 2024年第2期60-71,共12页
为了解决多模态命名实体识别(MNER)研究中存在的文本特征语义不足、视觉特征语义缺失、图文特征融合困难等问题,多模态命名实体识别方法相继被提出。首先,总结了多模态命名实体识别方法的整体框架以及各部分常用的技术,随后对其进行梳... 为了解决多模态命名实体识别(MNER)研究中存在的文本特征语义不足、视觉特征语义缺失、图文特征融合困难等问题,多模态命名实体识别方法相继被提出。首先,总结了多模态命名实体识别方法的整体框架以及各部分常用的技术,随后对其进行梳理并分类为基于BiLSTM的MNER方法和基于Transformer的MNER方法,并根据模型结构将其划分为前融合模型、后融合模型、Transformer单任务模型、Transformer多任务模型等4类模型结构。其次,在Twitter-2015、Twitter-2017 2个数据集上,分别对这2类方法进行实验,结果表明:多特征协同表示能增强各模态特征的语义,多任务学习能够促进模态特征融合或者结果融合,从而提升MNER的准确性。建议在MNER的未来研究中,着重关注通过多特征协同表示来增强模态语义,通过多任务学习促进模态特征融合或结果融合等方向的研究。 展开更多
关键词 多模态命名实体识别 TRANSFORMER BiLSTM 多模态融合 多任务学习
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部