期刊文献+
共找到5,556篇文章
< 1 2 250 >
每页显示 20 50 100
基于大模型检索增强生成的气象数据库问答模型实现 被引量:7
1
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
农用电机故障知识图谱的构建与应用 被引量:2
2
作者 黄友锐 荣雪 +2 位作者 徐善永 韩涛 宋奇 《农业工程学报》 北大核心 2025年第6期216-226,共11页
随着农业机械化和智能化的发展,农用电机作为主要动力来源,显著提升了农业生产效率,并推动农业向绿色化、智能化和高效化方向发展。为解决农用电机的故障可能导致的作物收获延误、经济损失和安全隐患。尽管传统机器学习和深度学习方法... 随着农业机械化和智能化的发展,农用电机作为主要动力来源,显著提升了农业生产效率,并推动农业向绿色化、智能化和高效化方向发展。为解决农用电机的故障可能导致的作物收获延误、经济损失和安全隐患。尽管传统机器学习和深度学习方法在电机故障诊断中展现出潜力,但其解释性不足和高成本限制了其广泛应用,亟需开发一种能够有效挖掘关键信息以指导故障维修的方法。该研究提出了一种基于多源数据异构融合的农用电机故障诊断知识图谱系统,旨在提升故障诊断效率和降低维修成本。通过实体识别与关系抽取,将非结构化数据转化为结构化数据,使用BERTBiLSTM-CRF模型进行实体识别,模型在实体识别任务中的准确率、召回率、F1值分别达到0.952 3、0.915 7、0.933 6,结合模式匹配与正则表达式进行关系抽取,并嵌入GPT模型构建智能问答系统,采用Neo4j图数据库存储电机故障知识,最终形成包含702个故障实体的图谱。研究表明,农用电机故障诊断知识图谱系统能够提升故障诊断效率,降低维修成本,增强农业生产的智能化水平,为农用电机故障诊断提供了一种高效、智能的解决方案,具有重要的应用前景和研究价值。 展开更多
关键词 知识图谱 农用电机 故障诊断 知识抽取 智能问答
在线阅读 下载PDF
基于XLNet和多粒度对比学习的新闻主题文本分类方法 被引量:1
3
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 XLNet 对比学习
在线阅读 下载PDF
基于全域信息融合和多维关系感知的命名实体识别模型 被引量:1
4
作者 胡婕 武帅星 +1 位作者 曹芝兰 张龑 《计算机应用》 北大核心 2025年第5期1511-1519,共9页
现有的基于双向长短时记忆(BiLSTM)网络的命名实体识别(NER)模型难以全面理解文本的整体语义以及捕捉复杂的实体关系。因此,提出一种基于全域信息融合和多维关系感知的NER模型。首先,通过BERT(Bidirectional Encoder Representations fr... 现有的基于双向长短时记忆(BiLSTM)网络的命名实体识别(NER)模型难以全面理解文本的整体语义以及捕捉复杂的实体关系。因此,提出一种基于全域信息融合和多维关系感知的NER模型。首先,通过BERT(Bidirectional Encoder Representations from Transformers)获取输入序列的向量表示,并结合BiLSTM进一步学习输入序列的上下文信息。其次,提出由梯度稳定层和特征融合模块组成的全域信息融合机制:前者使模型保持稳定的梯度传播并更新优化输入序列的表示,后者则融合BiLSTM的前后向表示获取更全面的特征表示。接着,构建多维关系感知结构学习不同子空间单词的关联性,以捕获文档中复杂的实体关系。此外,使用自适应焦点损失函数动态调整不同类别实体的权重,提高模型对少数类实体的识别性能。最后,在7个公开数据集上将所提模型和11个基线模型进行对比,实验结果表明所提模型的F1值均优于对比模型,可见该模型的综合性较优。 展开更多
关键词 命名实体识别 全域信息融合机制 梯度稳定层 多维关系感知 自适应焦点损失
在线阅读 下载PDF
现代成像技术与机器学习驱动的植物物候观测与预测研究进展 被引量:1
5
作者 张慧春 沈朱豪 边黎明 《农业工程学报》 北大核心 2025年第11期14-25,共12页
植物物候学研究植物生长周期和自然环境周期变化的关联性,传统人工监测效率低,而现代成像传感器技术通过高通量、多尺度的表型数据采集,结合机器学习构建物候模型,可精准识别关键时间节点,实现生长周期预测,为植物监测和良种选育提供技... 植物物候学研究植物生长周期和自然环境周期变化的关联性,传统人工监测效率低,而现代成像传感器技术通过高通量、多尺度的表型数据采集,结合机器学习构建物候模型,可精准识别关键时间节点,实现生长周期预测,为植物监测和良种选育提供技术支持。该研究介绍了人工以及传感器两种物候观测方法,分析了近端感知系统、物候通量塔、无人机平台、卫星遥感平台在物候观测与数据采集的应用,基于机器学习,结合影响因子模型与数据驱动模型,总结了其在种内物候、种间物候、群落物候的应用。研究表明成像技术与机器学习算法的深度耦合正推动植物物候观测的自动化以及预测的精确化。针对数据时空覆盖不足、多模态特征融合困难、模型跨尺度泛化能力弱的挑战,未来植物物候研究将围绕多尺度长周期监测、成像传感器数据融合、空天地平台协同采集、提升预测模型的自学习和优化能力,依托AI大模型实现跨平台的模型校准验证等方面开展,加速植物物候监测的自动化、数字化与信息化进程。 展开更多
关键词 传感器 机器学习 植物物候 表型数据 物候观测平台 群落物候
在线阅读 下载PDF
多域时空层次图神经网络的空气质量预测 被引量:4
6
作者 马汉达 吴亚东 《计算机应用》 北大核心 2025年第2期444-452,共9页
在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和... 在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和站点局部尺度的两级层次图,从而进行空间关系学习;其次,将一维空气质量序列转换为一组基于多个周期的二维张量,并在二维空间上通过多尺度卷积进行周期解耦以捕获频域特征;同时,在一维空间中利用长短期记忆(LSTM)网络拟合时域特征;最后,为避免聚合冗余信息,设计一种门控机制融合模块用于频域和时域特征的多域特征融合。在Urban-Air数据集和长三角城市群数据集上的实验结果表明,相较于多视图多任务时空图卷积网络模型(M2),所提模型在预测第1 h、3 h、6 h、12 h空气质量的平均绝对误差(MAE)和均方根误差(RMSE)均低于对比模型。可见,MST-HGNN能在频域上解耦复杂时间模式,利用频域信息弥补时域特征建模的局限性,并结合时域信息更全面地预测空气质量变化。 展开更多
关键词 空气质量预测 多域特征融合 时空特征 周期解耦 门控机制融合 图神经网络
在线阅读 下载PDF
PCB工艺FMEA领域知识图谱构建与应用 被引量:1
7
作者 叶进 林琦越 +2 位作者 唐欣 王秋祥 胡宁 《计算机工程与应用》 北大核心 2025年第11期227-237,共11页
随着电子产品的快速发展,产业链厂商对印制电路板(PCB)的失效模式和影响分析(FMEA)提出了更高水平要求,传统的FMEA分析方法已经不能满足复杂电子产品的需求。为此提出了一套PCB工艺FMEA知识图谱构建与应用框架,实现端到端的FMEA分析新... 随着电子产品的快速发展,产业链厂商对印制电路板(PCB)的失效模式和影响分析(FMEA)提出了更高水平要求,传统的FMEA分析方法已经不能满足复杂电子产品的需求。为此提出了一套PCB工艺FMEA知识图谱构建与应用框架,实现端到端的FMEA分析新模式。在图谱构建过程中,针对大量实体为复杂句子的特点,训练了一个加入PCB与FMEA特征词典的FLEBERT NER模型,实现对失效数据的实体识别,实验对比证明效果良好;对识别的实体采用Sentence-BERT结合FLEBERT预训练模型进行实体对齐,提升知识的质量;通过Neo4j进行知识存储完成知识图谱构建。基于已构建的知识图谱,搭建了FMEA知识图谱平台,初步实现了知识探索、知识问答和知识推荐的应用,展示了知识图谱技术在PCB工艺FMEA分析领域具备良好的应用前景。 展开更多
关键词 知识图谱 印制电路板(PCB) 失效模式和影响分析(FMEA) 命名实体识别(NER) BERT
在线阅读 下载PDF
面向对话生成和心理疾病检测的心理咨询式人机对话数据集构建 被引量:1
8
作者 徐博 郝德志 +2 位作者 于迩晨 林鸿飞 宗林林 《计算机应用》 北大核心 2025年第5期1395-1402,共8页
针对心理咨询式人机对话中缺乏用于建立有效对话模型的公开数据的问题,构建一个面向对话生成和心理疾病检测的心理医疗咨询对话数据集。首先,通过在线医疗问诊平台获取包含3 268个医生和患者之间的多轮对话数据集,并附有广泛的相关元数... 针对心理咨询式人机对话中缺乏用于建立有效对话模型的公开数据的问题,构建一个面向对话生成和心理疾病检测的心理医疗咨询对话数据集。首先,通过在线医疗问诊平台获取包含3 268个医生和患者之间的多轮对话数据集,并附有广泛的相关元数据,包括就诊医院、就诊科室、疾病类型和患者自我陈述等;其次,提出一个知识增强的对话模型——情感感知双向自回归模型(EmBART),以增强对话模型的共情能力;最后,通过心理医疗响应生成和心理疾病检测进行数据集可用性的实验评估。在心理医疗响应生成中,基于所提数据集训练的EmBART模型在自动评估与人工评估中的各项指标上均表现出色,其中困惑度较基准模型CDial-GPT(Chinese Dialogue Generative Pretrained Transformer)降低了2.31;在心理疾病检测中,基于所提数据集训练的CPT(Chinese Pre-trained unbalanced Transformer)和RoBERTa(Robustly optimized Bidirectional Encoder Representations from Transformers approach)模型具有出色的心理疾病检测能力。实验结果表明,本数据集在生成共情对话和检测心理疾病方面具有较强的实用性,能为未来基于心理咨询式人机对话研究提供数据基础。 展开更多
关键词 心理咨询对话 心理疾病检测 对话生成 共情响应 情感分析
在线阅读 下载PDF
隐式关系增强的图神经网络推荐算法 被引量:1
9
作者 熊中敏 张军 《计算机应用研究》 北大核心 2025年第5期1338-1344,共7页
在推荐任务中用户社交网络信息和用户-项目交互信息可以用来提高推荐性能。但现有的社交推荐算法往往仅使用初始的社交图与交互图,未充分挖掘用户间以及项目间潜在的链接关系,同时没有考虑社交关系中的不可靠性。为此,提出融合隐式关系... 在推荐任务中用户社交网络信息和用户-项目交互信息可以用来提高推荐性能。但现有的社交推荐算法往往仅使用初始的社交图与交互图,未充分挖掘用户间以及项目间潜在的链接关系,同时没有考虑社交关系中的不可靠性。为此,提出融合隐式关系的图神经网络推荐算法(IREGraphRec)。首先,在多视角下挖掘实体间潜在信息来获取可靠的用户社交信息及用户项目交互信息,并将其重构为基于用户偏好的异构信息网络,运用图谱嵌入和定义多种元路径方式获得特征向量表示,同时使用注意力机制为其在信息聚合中分配不同的权重。最后,在图神经网络中进行多轮学习来获得最终的预测结果。在Epinions等三个公开的数据集上与S4Rec等传统网络模型进行对比,在MAE上降低了1.65%,在RMSE上降低了2.34%。实验结果和分析证明提出模型更具优势。 展开更多
关键词 图神经网络 社交推荐 知识图谱 元路径 注意力机制
在线阅读 下载PDF
基于大语言模型的中文多义词义项融合技术研究 被引量:1
10
作者 尹宝生 宗辰 《计算机科学》 北大核心 2025年第S1期53-59,共7页
针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范... 针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范词典》等资源整合过程中“词条义项含义相同但描述不同”等问题进行了深入分析,并创新性地提出了基于大语言模型和提示学习的多义词义项融合技术,即充分利用大语言模型对常识知识的分析理解和辅助决策能力,通过有效的问题分解策略和提示模版设计,以及义项关系交叉验证等手段完成了多义词义项的自动化融合工作。实验结果表明,在通过正态分布抽取50个多义词共754个义项对的评测数据上,基于上述算法的义项融合的正确率达96.26%,Dice系数为0.973 3。该项研究验证了利用大语言模型开展中文知识资源自动化加工的可行性和有效性,与传统依赖语言专家加工模式相比,在保证较高质量的前提下,显著提升了知识加工效率。 展开更多
关键词 多义词 义项融合 大语言模型 提示学习 中文信息处理
在线阅读 下载PDF
基于知识图谱的精密传动部件工艺路线推荐模型 被引量:1
11
作者 刘利军 高亚楼 +1 位作者 曹永鹏 刘凯星 《现代制造工程》 北大核心 2025年第2期26-36,共11页
针对精密传动部件加工过程中普遍存在的工艺路线设计低效、知识重用困难的问题,提出了一种基于知识图谱的精密传动部件工艺路线推荐模型。首先,利用本体方法构建精密传动部件工艺知识模式层;其次,利用Electra+BiLSTM+CRF模型和BiLSTM+Se... 针对精密传动部件加工过程中普遍存在的工艺路线设计低效、知识重用困难的问题,提出了一种基于知识图谱的精密传动部件工艺路线推荐模型。首先,利用本体方法构建精密传动部件工艺知识模式层;其次,利用Electra+BiLSTM+CRF模型和BiLSTM+Self-Attention模型分别实现实体识别和关系抽取,并基于达梅劳编辑距离进行知识融合,完成数据层构建;然后,基于构建的工艺知识图谱,结合部件工艺单元以及工艺路线结构的相似度实现工艺路线推荐;最后,开发工艺路线推荐系统,并以某型号滚珠丝杠为例展示工艺路线推荐功能。经实验验证表明:推荐准确率达到89.5%,证明了该模型的可行性,能够提高知识重用性和工艺路线设计效率,为决策提供更加科学合理的参考。 展开更多
关键词 精密传动部件 知识图谱 工艺设计 工艺路线推荐
在线阅读 下载PDF
基于改进标签传播算法的舆情社交网络社区发现
12
作者 钱晓东 王卓 《计算机应用研究》 北大核心 2025年第1期48-55,共8页
通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点... 通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点影响力的大小更新标签。实验结果表明,该方法在最好情况下(k=0.9)相较于原算法,在稳定性和模块度指标两方面分别提高了31%和78%,并且优于其他几种改进算法。由此可见,该算法相较于原算法及其他改进算法在舆情社交网络的主题社区发现中表现更好。 展开更多
关键词 标签传播算法 舆情社交网络 HK模型 主题社区发现
在线阅读 下载PDF
利用异配及同配关系的社交机器人检测方法
13
作者 罗森林 费泽涛 +1 位作者 潘丽敏 吴舟婷 《北京理工大学学报》 EI CAS 北大核心 2025年第1期77-86,共10页
现有基于图的方法未区分用户间的异配、同配关系,造成用户表示中存在异配边带来的噪声,弱化了社交机器人与人类用户之间的差异性,检测准确率降低;社交机器人持续演化模拟人类用户的关注数、推文发布数等元数据,容易导致较难识别的仿真... 现有基于图的方法未区分用户间的异配、同配关系,造成用户表示中存在异配边带来的噪声,弱化了社交机器人与人类用户之间的差异性,检测准确率降低;社交机器人持续演化模拟人类用户的关注数、推文发布数等元数据,容易导致较难识别的仿真社交机器人比例增加,检测召回率降低.提出一种利用异配及同配关系的社交机器人检测方法,通过记忆网络构建异配、同配关系原型来识别用户关系类型,减少异配边对用户表示的干扰,增加不同类型用户的特征区分性;在损失函数中引入调节因子,提高较难分类用户在模型参数更新过程中的损失贡献,增强了模型对仿真社交机器人的识别效果.实验结果表明,提出的方法优于当前先进方法,此方法通过区分用户间的异配和同配关系,降低异配边的权重,增强了用户表示的类别区分度,即使在低同配性分数的情况下也有效提升了检测准确率. 展开更多
关键词 社交机器人 异配关系 记忆网络
在线阅读 下载PDF
基于多源信息融合的黄河上游多灾种知识图谱构建方法
14
作者 王宗敏 梁创恒 +4 位作者 刘心怡 刘奕凡 晋磊 蔡迎春 舒小颂 《人民黄河》 北大核心 2025年第7期103-107,115,共6页
为了解决多重致灾因子时空关联非一致性问题,提出一种基于多源信息融合的黄河上游多灾种知识图谱构建方法。通过数据清洗、实体识别与关系抽取,整合遥感影像、气象数据、地质资料等结构化与非结构化数据,构建本体定义核心概念,定义因果... 为了解决多重致灾因子时空关联非一致性问题,提出一种基于多源信息融合的黄河上游多灾种知识图谱构建方法。通过数据清洗、实体识别与关系抽取,整合遥感影像、气象数据、地质资料等结构化与非结构化数据,构建本体定义核心概念,定义因果关系、时空关联、参与关系等6类语义关联。采用Neo4j图数据库进行知识存储与动态推理,设计多源数据映射机制,支持灾害事件、触发因子、衍生灾害等实体及其关系的多维查询。结合贝叶斯网络概率推理与图拓扑分析算法,对灾害链传播路径进行量化评估。针对2023年黄河上游某地滑坡事件,通过图数据库推理功能可发现滑坡与泥石流之间的潜在关系链条。相比传统数据库,知识图谱查询信息速度快、精确度高。 展开更多
关键词 知识图谱 多灾种 多源信息 本体 关系映射 黄河上游
在线阅读 下载PDF
层次融合多元知识的命名实体识别框架——HTLR
15
作者 吕学强 王涛 +1 位作者 游新冬 徐戈 《计算机应用》 北大核心 2025年第1期40-47,共8页
中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hi... 中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFECNN(Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT(Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 词汇增强 字形增强
在线阅读 下载PDF
融合词汇增强和跨度方法的中医药命名实体识别
16
作者 叶青 赖煊 +1 位作者 程春雷 杨琴 《计算机工程与应用》 北大核心 2025年第17期222-231,共10页
中医药命名实体识别旨在从非结构化的中医药文本中识别出相应的实体及其类别,采用人工识别效率不高。然而,传统的中文命名实体识别模型缺少中医药文本中的特征信息且一般采用序列标注方式解码,无法解决中医药实体识别中突出存在的实体... 中医药命名实体识别旨在从非结构化的中医药文本中识别出相应的实体及其类别,采用人工识别效率不高。然而,传统的中文命名实体识别模型缺少中医药文本中的特征信息且一般采用序列标注方式解码,无法解决中医药实体识别中突出存在的实体边界识别模糊和实体嵌套性错误等问题。为解决上述问题,提出融合词汇增强与跨度方法的中医药命名实体识别模型TCM-NER来提升实体识别性能。根据词汇匹配获得文本中的词汇信息并利用相对位置构建中医药文本词格结构;通过特征提取模块分别提取字、词汇和相对位置编码向量;采用FLAT(flatlattice Transformer)模型进行特征整合,从而获得<字-词汇-跨度>混合特征,提高模型边界识别性能;将混合特征输入双仿射分类器预测实体及其类别。实验结果表明,TCM-NER模型在两个中医药数据集的Micro-F1值分别达到了70.53%和75.91%,证明了该模型在中医药实体识别中的实用价值。 展开更多
关键词 词汇增强 跨度方法 命名实体识别 中医药(TCM) 双仿射分类器
在线阅读 下载PDF
基于多特征融合的外来入侵植物细粒度命名实体识别
17
作者 尚俊平 程春畅 +3 位作者 卢洋 席磊 程金鹏 刘合兵 《农业工程学报》 北大核心 2025年第12期230-239,共10页
外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模... 外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。 展开更多
关键词 命名实体识别 多特征融合 卷积残差结构 多头自注意力机制 外来入侵植物
在线阅读 下载PDF
RNSQL:融合逆规范化的Text2SQL生成
18
作者 帖军 范子琪 +2 位作者 孙翀 郑禄 朱柏尔 《计算机应用与软件》 北大核心 2025年第9期31-37,86,共8页
Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及... Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及多表连接的SQL生成仍存在大量错误。因此,提出一种基于神经网络的Text2SQL方法,该方法通过逆规范化技术,对数据库模式进行重构,关注SQL句法生成的正确性,称为逆规范化网络(Reverse Normalization SQL,RNSQL)。经理论分析和在公共数据集Spider上实验验证,RNSQL能有效提升Text2SQL任务的质量。 展开更多
关键词 逆规范化 语义解析 Text2SQL 槽填充
在线阅读 下载PDF
基于格点网格与段尺度注意力机制的知识图谱构建
19
作者 王体春 李昊 王贤伟 《计算机集成制造系统》 北大核心 2025年第4期1368-1382,共15页
为解决当前知识图谱构建模型过程中训练样本特征单一、关系抽取准确率低下的问题,建立一种基于格点网格与段尺度注意力机制的知识图谱自动构建模型(KG-GSAM)。针对实体识别任务,引入格点网格结构对双向门控循环神经网络进行改进;针对关... 为解决当前知识图谱构建模型过程中训练样本特征单一、关系抽取准确率低下的问题,建立一种基于格点网格与段尺度注意力机制的知识图谱自动构建模型(KG-GSAM)。针对实体识别任务,引入格点网格结构对双向门控循环神经网络进行改进;针对关系抽取任务,引入段尺度注意力机制,搭建关系抽取神经网络。在公开数据集和近三年自动导引车领域的专利文本构建的数据集上分别进行实验,结果表明所建立模型在Precision、Recall和F1-score三个指标上与其他知识图谱构建模型相比有一定的优越性。 展开更多
关键词 知识图谱 格点网格 段尺度注意力机制 BERT模型 关系抽取神经网络 自动导引车
在线阅读 下载PDF
不连续创新视角下技术演进-知识流动的新兴技术识别方法
20
作者 赵又霖 崔淦 +2 位作者 王嘉杰 封丽 石燕青 《情报杂志》 北大核心 2025年第10期144-154,共11页
[研究目的]在全球科技竞争态势深度重构的背景下,新兴技术识别亟须突破传统的技术导向分析范式,迈向理论与技术融合的研究方向。为此从不连续创新的视角出发,提出基于“技术演进-知识流动”的新兴技术识别方法。[研究方法]通过追踪技术... [研究目的]在全球科技竞争态势深度重构的背景下,新兴技术识别亟须突破传统的技术导向分析范式,迈向理论与技术融合的研究方向。为此从不连续创新的视角出发,提出基于“技术演进-知识流动”的新兴技术识别方法。[研究方法]通过追踪技术的非线性演进轨迹和知识流动特征,实现对新兴技术的精准识别。在通过SimCSE模型对专利摘要进行表征并计算相似度的基础上,以科学知识采纳对知识流动进行测度,构建包含技术新颖、发展潜力和科学知识采纳三个维度的识别特征体系,运用多种机器学习模型进行训练,并基于评估结果选取最优模型,实现对新兴技术的精准识别。[研究结果/结论]以无人机领域为例进行实证研究,该方法的有效性得到充分验证,明晰了无人机领域新兴技术的发展态势,不仅能够为我国产业发展提供科学意见,还推动新兴技术识别向理论与技术融合的多维度研究范式转型。 展开更多
关键词 不连续创新 新兴技术识别 技术演进 知识流动 无人机 知识采纳
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部