期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于ERNIE模型的雷达维修命名实体识别研究
1
作者 曾垂振 崔良中 马文卓 《计算机工程与科学》 北大核心 2025年第6期1106-1113,共8页
在雷达维修领域的知识图谱构建中,由于其专业性强、标注数据集稀缺,命名实体识别模型训练存在较大困难,传统模型训练效果达不到应用要求。在Bi GRU-CRF模型的基础上引入了预训练模型,提出了ERNIE-Bi GRU-CRF模型。首先,以某型号雷达为例... 在雷达维修领域的知识图谱构建中,由于其专业性强、标注数据集稀缺,命名实体识别模型训练存在较大困难,传统模型训练效果达不到应用要求。在Bi GRU-CRF模型的基础上引入了预训练模型,提出了ERNIE-Bi GRU-CRF模型。首先,以某型号雷达为例,收集维修数据,并进行数据的预处理,同时使用doccano平台对数据进行人工标注,获得雷达维修领域命名实体识别数据1100余条。然后,通过ERNIE预训练模型获取雷达维修训练数据的动态词向量,Bi GRU获取双向语义信息。最后,通过CRF约束得到最合理的序列标注结果。实验结果表明,在少量训练语料的条件下,所提模型具有较强的识别效果,相比于Bi GRU-CRF、Bi LSTM-CRF模型,其F1值有一定提升,有效解决了雷达维修领域训练语料缺乏、训练效果不佳的问题,在雷达维修领域知识图谱的自动化构建中具有一定的实用价值。 展开更多
关键词 雷达维修 命名实体识别 ernie模型 大语言模型
在线阅读 下载PDF
面向法律领域的实体和关系抽取
2
作者 刘美玲 梁龙昌 《深圳大学学报(理工版)》 北大核心 2025年第1期77-84,共8页
中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在... 中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在关系与全局对应(legal potential relationship and global correspondence,LPRGC)模型理解法律文本中术语、规则和上下文信息的能力,从而提高了实体和关系的识别准确性,进而提升了实体和关系抽取算法的性能.为解决重叠实体问题,设计了一种基于潜在关系和实体对齐的关系抽取方法.通过精确标注实体位置,筛选潜在关系,并利用全局矩阵对齐实体,解决重叠实体的关系抽取问题,能够更准确地捕捉到重叠实体之间的关系,并有效地将其映射到正确的实体对上,从而提高抽取结果的准确性.在中国法律智能技术评测数据集上进行实体和关系抽取实验,结果表明,LPRGC模型的准确率、召回率和F_(1)值分别为85.21%、81.19%和83.15%,均优于对比模型,特别是在处理实体重叠问题时,LPRGC模型在单实体重叠类型的抽取中,F_(1)值达到了81.45%;在多实体重叠类型的抽取中,F_(1)值达80.67%.LPRGC模型在实体和关系抽取的准确性上较现有方法有明显改进,在处理复杂法律文本中的实体重叠问题上取得了显著效果. 展开更多
关键词 人工智能 自然语言处理 司法领域关系抽取 深度学习 信息增强 重叠实体
在线阅读 下载PDF
融入结构先验知识的隐私信息抽取算法
3
作者 赵玉媛 王斌 +2 位作者 张泽丹 李青山 胡建斌 《信息安全研究》 CSCD 北大核心 2024年第2期139-147,共9页
随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统... 随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统方法在多义词表示方面的限制.然而,它们在精确判断实体边界方面仍有改进空间.提出了一种新颖的隐私信息抽取算法,该算法融合结构先验知识,通过一种隐私数据结构知识增强机制,提高模型对句子语义结构的理解,从而提高了隐私信息边界判断的准确性.此外,还在多个公开数据集上对模型进行评估,详细的实验结果展示了其有效性. 展开更多
关键词 结构先验知识 结构增强机制 隐私信息抽取算法 实体边界判断 数据脱敏 自然语言处理
在线阅读 下载PDF
基于功效特征的专利聚类方法 被引量:2
4
作者 马建红 曹文斌 +1 位作者 刘元刚 夏爽 《计算机应用》 CSCD 北大核心 2021年第5期1361-1366,共6页
当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)... 当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)相结合的功效特征联合提取(FEI-Joint)模型来提取专利文献的功效特征,并且改进自组织神经网络(SOM)算法,从而提出具有早期拒绝策略与类合并思想的自组织神经网络(ERCM-SOM)来实现基于功效特征的专利聚类。对FEI-Joint模型与TF-IDF、狄利克雷分布(LDA)、CNN在特征提取后的聚类效果上进行比较和分析,结果表明其F-measure值比其他模型有明显提高。ERCM-SOM算法与K-Means算法、SOM算法相比,在Fmeasure值提高的同时,其时间较SOM算法有明显缩短。对比使用专利分类号(IPC)的专利分类,采用基于功效特征的聚类方法可实现跨领域的专利聚类效果,为设计者借鉴其他领域的设计方法奠定了基础。 展开更多
关键词 专利聚类 信息实体语义增强表示 卷积神经网络 跨领域 自组织神经网络
在线阅读 下载PDF
基于数据增强和残差网络的敏感信息命名实体识别
5
作者 李莉 宋涵 +1 位作者 刘培鹤 陈汉林 《计算机应用》 2025年第9期2790-2797,共8页
敏感信息命名实体识别(NER)是隐私保护的关键技术之一。然而,现有的NER方法在敏感信息领域的相关数据集稀缺,且传统技术存在准确率低、可移植性差等问题。为解决这些问题,首先,从互联网中爬取并人工标注含有敏感信息的文本语料,以构建... 敏感信息命名实体识别(NER)是隐私保护的关键技术之一。然而,现有的NER方法在敏感信息领域的相关数据集稀缺,且传统技术存在准确率低、可移植性差等问题。为解决这些问题,首先,从互联网中爬取并人工标注含有敏感信息的文本语料,以构建敏感信息NER数据集SenResume;其次,提出一种基于实体掩码的数据增强模型E-MLM(Entity-based Masked Language Modeling),通过整词掩码技术生成新的数据样本,并扩充数据集以提升数据多样性;再次,提出RoBERTa-ResBiLSTM-CRF模型,该模型结合RoBERTa-WWM(Robustly optimized Bidirectional Encoder Representations from Transformers approach with Whole Word Masking)提取上下文特征以生成高质量的词向量编码,并利用残差双向长短期记忆(ResBiLSTM)增强文本特征;最后,通过多层残差网络提高训练效率和模型稳定性,并通过条件随机场(CRF)进行全局解码以提升序列标注的准确性。实验结果表明,E-MLM对数据集质量有显著的提升,并且提出的NER模型在原始和1倍扩充后的数据集上表现均为最优,F1分数分别为96.16%和97.84%。可见,E-MLM与残差网络的引入有利于提升敏感信息NER的准确度。 展开更多
关键词 敏感信息 数据集构建 数据增强 BERT 命名实体识别
在线阅读 下载PDF
基于自然语言处理的航行通告风险识别方法
6
作者 瞿也丰 辜汝桐 +2 位作者 黄文强 陈东玲 邓李明 《中国安全科学学报》 2025年第S1期33-39,共7页
为实现海量航行通告文本数据的高效精准风险识别,满足现代航班运行对航行通告风险解析的需求,提升民航领域风险识别能力,提出一种融合知识增强的语义表示(ERNIE)模型、卷积神经网络(CNN)以及双向长短期记忆神经网络(BiLSTM)的航行通告... 为实现海量航行通告文本数据的高效精准风险识别,满足现代航班运行对航行通告风险解析的需求,提升民航领域风险识别能力,提出一种融合知识增强的语义表示(ERNIE)模型、卷积神经网络(CNN)以及双向长短期记忆神经网络(BiLSTM)的航行通告风险识别模型;借助ERNIE模型进行词向量的训练,利用CNN捕捉文本局部结构的特性,并结合BiLSTM理解文本的深层次上下文关联;并开展对比试验进行验证。结果表明:相较于其他同类模型,该方法对国内中文和国际英文航行通告的识别精度分别高达92.01%和93.85%。该成果可以为航空公司在航行情报的风险解析和安全管理提供一定的数据支撑。 展开更多
关键词 自然语言处理(NLP) 航行通告 风险识别 知识增强的语义表示(ernie) 卷积神经网络(CNN) 双向长短期记忆网络(BiLSTM)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部