检索结果-维普期刊中文期刊服务平台

基于ERNIE模型的雷达维修命名实体识别研究: 1; 作者曾垂振崔良中马文卓《计算机工程与科学》北大核心 2025年第6期1106-1113,共8页; 在雷达维修领域的知识图谱构建中,由于其专业性强、标注数据集稀缺,命名实体识别模型训练存在较大困难,传统模型训练效果达不到应用要求。在Bi GRU-CRF模型的基础上引入了预训练模型,提出了ERNIE-Bi GRU-CRF模型。首先,以某型号雷达为例... 展开更多; 关键词雷达维修命名实体识别 ernie模型大语言模型; 在线阅读下载PDF 职称材料

面向法律领域的实体和关系抽取: 2; 作者刘美玲梁龙昌《深圳大学学报(理工版)》北大核心 2025年第1期77-84,共8页; 中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在... 展开更多; 关键词人工智能自然语言处理司法领域关系抽取深度学习信息增强重叠实体; 在线阅读下载PDF 职称材料

融入结构先验知识的隐私信息抽取算法: 3; 作者赵玉媛王斌 +2 位作者张泽丹李青山胡建斌《信息安全研究》 CSCD 北大核心 2024年第2期139-147,共9页; 随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统... 展开更多; 关键词结构先验知识结构增强机制隐私信息抽取算法实体边界判断数据脱敏自然语言处理; 在线阅读下载PDF 职称材料

基于功效特征的专利聚类方法被引量：2: 4; 作者马建红曹文斌 +1 位作者刘元刚夏爽《计算机应用》 CSCD 北大核心 2021年第5期1361-1366,共6页; 当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)... 展开更多; 关键词专利聚类信息实体语义增强表示卷积神经网络跨领域自组织神经网络; 在线阅读下载PDF 职称材料

基于数据增强和残差网络的敏感信息命名实体识别: 5; 作者李莉宋涵 +1 位作者刘培鹤陈汉林《计算机应用》 2025年第9期2790-2797,共8页; 敏感信息命名实体识别(NER)是隐私保护的关键技术之一。然而,现有的NER方法在敏感信息领域的相关数据集稀缺,且传统技术存在准确率低、可移植性差等问题。为解决这些问题,首先,从互联网中爬取并人工标注含有敏感信息的文本语料,以构建... 展开更多; 关键词敏感信息数据集构建数据增强 BERT 命名实体识别; 在线阅读下载PDF 职称材料

基于自然语言处理的航行通告风险识别方法: 6; 作者瞿也丰辜汝桐 +2 位作者黄文强陈东玲邓李明《中国安全科学学报》 2025年第S1期33-39,共7页; 为实现海量航行通告文本数据的高效精准风险识别,满足现代航班运行对航行通告风险解析的需求,提升民航领域风险识别能力,提出一种融合知识增强的语义表示(ERNIE)模型、卷积神经网络(CNN)以及双向长短期记忆神经网络(BiLSTM)的航行通告... 展开更多; 关键词自然语言处理(NLP) 航行通告风险识别知识增强的语义表示(ernie) 卷积神经网络(CNN) 双向长短期记忆网络(BiLSTM); 在线阅读下载PDF 职称材料

题名基于ERNIE模型的雷达维修命名实体识别研究: 1; 作者曾垂振崔良中马文卓; 机构海军工程大学电子工程学院陆军工程大学军械士官学校; 出处《计算机工程与科学》北大核心 2025年第6期1106-1113,共8页; 文摘在雷达维修领域的知识图谱构建中,由于其专业性强、标注数据集稀缺,命名实体识别模型训练存在较大困难,传统模型训练效果达不到应用要求。在Bi GRU-CRF模型的基础上引入了预训练模型,提出了ERNIE-Bi GRU-CRF模型。首先,以某型号雷达为例,收集维修数据,并进行数据的预处理,同时使用doccano平台对数据进行人工标注,获得雷达维修领域命名实体识别数据1100余条。然后,通过ERNIE预训练模型获取雷达维修训练数据的动态词向量,Bi GRU获取双向语义信息。最后,通过CRF约束得到最合理的序列标注结果。实验结果表明,在少量训练语料的条件下,所提模型具有较强的识别效果,相比于Bi GRU-CRF、Bi LSTM-CRF模型,其F1值有一定提升,有效解决了雷达维修领域训练语料缺乏、训练效果不佳的问题,在雷达维修领域知识图谱的自动化构建中具有一定的实用价值。; 关键词雷达维修命名实体识别 ernie模型大语言模型; Keywords radar maintenance named entity recognition enhanced representation through knowledge integration(ernie)model large language model; 分类号 TP391.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名面向法律领域的实体和关系抽取: 2; 作者刘美玲梁龙昌; 机构东北林业大学计算机与控制工程学院; 出处《深圳大学学报(理工版)》北大核心 2025年第1期77-84,共8页; 基金黑龙江省自然科学基金资助项目(LH2022F002)。; 文摘中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在关系与全局对应(legal potential relationship and global correspondence,LPRGC)模型理解法律文本中术语、规则和上下文信息的能力,从而提高了实体和关系的识别准确性,进而提升了实体和关系抽取算法的性能.为解决重叠实体问题,设计了一种基于潜在关系和实体对齐的关系抽取方法.通过精确标注实体位置,筛选潜在关系,并利用全局矩阵对齐实体,解决重叠实体的关系抽取问题,能够更准确地捕捉到重叠实体之间的关系,并有效地将其映射到正确的实体对上,从而提高抽取结果的准确性.在中国法律智能技术评测数据集上进行实体和关系抽取实验,结果表明,LPRGC模型的准确率、召回率和F_(1)值分别为85.21%、81.19%和83.15%,均优于对比模型,特别是在处理实体重叠问题时,LPRGC模型在单实体重叠类型的抽取中,F_(1)值达到了81.45%;在多实体重叠类型的抽取中,F_(1)值达80.67%.LPRGC模型在实体和关系抽取的准确性上较现有方法有明显改进,在处理复杂法律文本中的实体重叠问题上取得了显著效果.; 关键词人工智能自然语言处理司法领域关系抽取深度学习信息增强重叠实体; Keywords artificial intelligence natural language processing judicial field relationship extraction deep learning information enhancement overlapping entities; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名融入结构先验知识的隐私信息抽取算法: 3; 作者赵玉媛王斌张泽丹李青山胡建斌; 机构北京大学软件与微电子学院中国中医科学院中医药数据中心博雅正链(北京)科技有限公司北京大学计算机学院; 出处《信息安全研究》 CSCD 北大核心 2024年第2期139-147,共9页; 基金国家自然科学基金面上项目(82274685)。; 文摘随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统方法在多义词表示方面的限制.然而,它们在精确判断实体边界方面仍有改进空间.提出了一种新颖的隐私信息抽取算法,该算法融合结构先验知识,通过一种隐私数据结构知识增强机制,提高模型对句子语义结构的理解,从而提高了隐私信息边界判断的准确性.此外,还在多个公开数据集上对模型进行评估,详细的实验结果展示了其有效性.; 关键词结构先验知识结构增强机制隐私信息抽取算法实体边界判断数据脱敏自然语言处理; Keywords structural prior knowledge structural enhancement mechanism privacy information extraction algorithm entity boundary determination data desensitization natural language processing; 分类号 TP309.2 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于功效特征的专利聚类方法被引量：2: 4; 作者马建红曹文斌刘元刚夏爽; 机构河北工业大学人工智能与数据科学学院天津市科学技术协会天津科学技术馆; 出处《计算机应用》 CSCD 北大核心 2021年第5期1361-1366,共6页; 基金科技部创新方法工作专项(2019IM020300)。; 文摘当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)相结合的功效特征联合提取(FEI-Joint)模型来提取专利文献的功效特征,并且改进自组织神经网络(SOM)算法,从而提出具有早期拒绝策略与类合并思想的自组织神经网络(ERCM-SOM)来实现基于功效特征的专利聚类。对FEI-Joint模型与TF-IDF、狄利克雷分布(LDA)、CNN在特征提取后的聚类效果上进行比较和分析,结果表明其F-measure值比其他模型有明显提高。ERCM-SOM算法与K-Means算法、SOM算法相比,在Fmeasure值提高的同时,其时间较SOM算法有明显缩短。对比使用专利分类号(IPC)的专利分类,采用基于功效特征的聚类方法可实现跨领域的专利聚类效果,为设计者借鉴其他领域的设计方法奠定了基础。; 关键词专利聚类信息实体语义增强表示卷积神经网络跨领域自组织神经网络; Keywords patent clustering enhanced language representation with informative entities(ernie) Convolutional Neural Network(CNN) cross-domain Self-Organizing Map(SOM); 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于数据增强和残差网络的敏感信息命名实体识别: 5; 作者李莉宋涵刘培鹤陈汉林; 机构北京电子科技学院电子与通信工程系; 出处《计算机应用》 2025年第9期2790-2797,共8页; 基金中央高校基本科研业务费专项资金资助项目(3282023017,3282024006,3282023054) 多学科交叉的电子信息工程创新人才培养模式的研究与实践项目(jy202202)。; 文摘敏感信息命名实体识别(NER)是隐私保护的关键技术之一。然而,现有的NER方法在敏感信息领域的相关数据集稀缺,且传统技术存在准确率低、可移植性差等问题。为解决这些问题,首先,从互联网中爬取并人工标注含有敏感信息的文本语料,以构建敏感信息NER数据集SenResume;其次,提出一种基于实体掩码的数据增强模型E-MLM(Entity-based Masked Language Modeling),通过整词掩码技术生成新的数据样本,并扩充数据集以提升数据多样性;再次,提出RoBERTa-ResBiLSTM-CRF模型,该模型结合RoBERTa-WWM(Robustly optimized Bidirectional Encoder Representations from Transformers approach with Whole Word Masking)提取上下文特征以生成高质量的词向量编码,并利用残差双向长短期记忆(ResBiLSTM)增强文本特征;最后,通过多层残差网络提高训练效率和模型稳定性,并通过条件随机场(CRF)进行全局解码以提升序列标注的准确性。实验结果表明,E-MLM对数据集质量有显著的提升,并且提出的NER模型在原始和1倍扩充后的数据集上表现均为最优,F1分数分别为96.16%和97.84%。可见,E-MLM与残差网络的引入有利于提升敏感信息NER的准确度。; 关键词敏感信息数据集构建数据增强 BERT 命名实体识别; Keywords sensitive information dataset construction data enhancement Bidirectional Encoder representations from Transformers(BERT) Named Entity Recognition(NER); 分类号 TP391 [自动化与计算机技术]; 在线阅读下载PDF 职称材料

题名基于自然语言处理的航行通告风险识别方法: 6; 作者瞿也丰辜汝桐黄文强陈东玲邓李明; 机构中国南方航空股份有限公司; 出处《中国安全科学学报》 2025年第S1期33-39,共7页; 基金国家重点研发计划项目(2020YFA072500)。; 文摘为实现海量航行通告文本数据的高效精准风险识别,满足现代航班运行对航行通告风险解析的需求,提升民航领域风险识别能力,提出一种融合知识增强的语义表示(ERNIE)模型、卷积神经网络(CNN)以及双向长短期记忆神经网络(BiLSTM)的航行通告风险识别模型;借助ERNIE模型进行词向量的训练,利用CNN捕捉文本局部结构的特性,并结合BiLSTM理解文本的深层次上下文关联;并开展对比试验进行验证。结果表明:相较于其他同类模型,该方法对国内中文和国际英文航行通告的识别精度分别高达92.01%和93.85%。该成果可以为航空公司在航行情报的风险解析和安全管理提供一定的数据支撑。; 关键词自然语言处理(NLP) 航行通告风险识别知识增强的语义表示(ernie) 卷积神经网络(CNN) 双向长短期记忆网络(BiLSTM); Keywords natural language processing(NLP) notice to airmen risk identification enhanced representation through knowledge integration(ernie) convolutional neural networks(CNN) bidirectional long short-term memory(BiLSTM); 分类号 X913 [环境科学与工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于ERNIE模型的雷达维修命名实体识别研究	曾垂振崔良中马文卓	《计算机工程与科学》北大核心	2025	0	在线阅读下载PDF 职称材料
2	面向法律领域的实体和关系抽取	刘美玲梁龙昌	《深圳大学学报(理工版)》北大核心	2025	0	在线阅读下载PDF 职称材料
3	融入结构先验知识的隐私信息抽取算法	赵玉媛王斌张泽丹李青山胡建斌	《信息安全研究》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
4	基于功效特征的专利聚类方法	马建红曹文斌刘元刚夏爽	《计算机应用》 CSCD 北大核心	2021	2	在线阅读下载PDF 职称材料
5	基于数据增强和残差网络的敏感信息命名实体识别	李莉宋涵刘培鹤陈汉林	《计算机应用》	2025		在线阅读下载PDF 职称材料
6	基于自然语言处理的航行通告风险识别方法	瞿也丰辜汝桐黄文强陈东玲邓李明	《中国安全科学学报》	2025		在线阅读下载PDF 职称材料