期刊文献+
共找到1,018篇文章
< 1 2 51 >
每页显示 20 50 100
Automatic Generation of Artificial Space Weather Forecast Product Based on Sequence-to-sequence Model
1
作者 罗冠霆 ZOU Yenan CAI Yanxia 《空间科学学报》 CAS CSCD 北大核心 2024年第1期80-94,共15页
Both analyzing a large amount of space weather observed data and alleviating personal experience bias are significant challenges in generating artificial space weather forecast products.With the use of natural languag... Both analyzing a large amount of space weather observed data and alleviating personal experience bias are significant challenges in generating artificial space weather forecast products.With the use of natural language generation methods based on the sequence-to-sequence model,space weather forecast texts can be automatically generated.To conduct our generation tasks at a fine-grained level,a taxonomy of space weather phenomena based on descriptions is presented.Then,our MDH(Multi-Domain Hybrid)model is proposed for generating space weather summaries in two stages.This model is composed of three sequence-to-sequence-based deep neural network sub-models(one Bidirectional Auto-Regressive Transformers pre-trained model and two Transformer models).Then,to evaluate how well MDH performs,quality evaluation metrics based on two prevalent automatic metrics and our innovative human metric are presented.The comprehensive scores of the three summaries generating tasks on testing datasets are 70.87,93.50,and 92.69,respectively.The results suggest that MDH can generate space weather summaries with high accuracy and coherence,as well as suitable length,which can assist forecasters in generating high-quality space weather forecast products,despite the data being starved. 展开更多
关键词 Space weather Deep learning Data-to-text Natural language generation
在线阅读 下载PDF
A survey of deep learning-based visual question answering 被引量:1
2
作者 HUANG Tong-yuan YANG Yu-ling YANG Xue-jiao 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第3期728-746,共19页
With the warming up and continuous development of machine learning,especially deep learning,the research on visual question answering field has made significant progress,with important theoretical research significanc... With the warming up and continuous development of machine learning,especially deep learning,the research on visual question answering field has made significant progress,with important theoretical research significance and practical application value.Therefore,it is necessary to summarize the current research and provide some reference for researchers in this field.This article conducted a detailed and in-depth analysis and summarized of relevant research and typical methods of visual question answering field.First,relevant background knowledge about VQA(Visual Question Answering)was introduced.Secondly,the issues and challenges of visual question answering were discussed,and at the same time,some promising discussion on the particular methodologies was given.Thirdly,the key sub-problems affecting visual question answering were summarized and analyzed.Then,the current commonly used data sets and evaluation indicators were summarized.Next,in view of the popular algorithms and models in VQA research,comparison of the algorithms and models was summarized and listed.Finally,the future development trend and conclusion of visual question answering were prospected. 展开更多
关键词 computer vision natural language processing visual question answering deep learning attention mechanism
在线阅读 下载PDF
大语言模型参数高效微调技术综述 被引量:1
3
作者 秦董洪 李政韬 +3 位作者 白凤波 董路宽 张慧 徐晨 《计算机工程与应用》 北大核心 2025年第16期38-63,共26页
近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,... 近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,显著降低成本并保持性能。对近年来参数高效微调技术中最具代表性和最前沿的方法进行了简要介绍和系统分析,涵盖设计理念与核心算法,并对不同方法的特性、优势、不足以及适用场景进行了归纳和分析,并进一步对比了不同种类中同系列的多种方法,分析了同系列方法在设计理念上的演进趋势,提供了当前研究现状的全面概述。最后对参数高效微调技术进行整体的分析与展望,提出未来该技术可能的优化方向,并结合实践提出该技术在实际工程应用中可行的技术方案。 展开更多
关键词 参数高效微调技术 深度学习 自然语言处理 模型优化
在线阅读 下载PDF
深入理解“稳中求进”,整体把握统编初中语文教材 被引量:2
4
作者 尤炜 《课程.教材.教法》 北大核心 2025年第1期61-69,共9页
“稳中求进”是统编初中语文教材修订的原则,它在很大程度上决定了教材的面貌,也是整体把握教材的重要视角。这一原则的确立体现了教材建设国家事权,遵循党和国家工作总基调,充分考虑教育发展规律和统编教材实际。教材修订,是在认真分... “稳中求进”是统编初中语文教材修订的原则,它在很大程度上决定了教材的面貌,也是整体把握教材的重要视角。这一原则的确立体现了教材建设国家事权,遵循党和国家工作总基调,充分考虑教育发展规律和统编教材实际。教材修订,是在认真分析新旧课程标准、新课标与原教材关系的基础上,将新旧课标的衔接和贯通作为教材修订“稳中求进”最重要的课程依据,将在不同层面、以多种方式落实学习任务群作为教材修订工作的重点,以促进学生核心素养的发展。 展开更多
关键词 统编语文教材 修订原则 “稳中求进” 学习任务群
在线阅读 下载PDF
基于知识图谱的钻井顶部驱动装置故障智能诊断方法 被引量:1
5
作者 陈冬 肖远山 +2 位作者 尹志勇 张彦龙 叶智慧 《天然气工业》 北大核心 2025年第2期125-135,共11页
钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井... 钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井顶部驱动装置故障诊断方法,利用以Transformer为基础的双向编码器模型(Bidirectional Encoder Representations from Transformers,BERT)构建了混合神经网络模型BERT-BiLSTM-CRF与BERT-BiLSTM-Attention,分别实现了顶驱故障文本数据的命名实体识别和关系抽取,并通过相似度计算,实现了故障知识的有效融合和智能问答,最终构建了顶部驱动装置故障诊断方法。研究结果表明:①在故障实体识别任务上,BERT-BiLSTM-CRF模型的精确度达到95.49%,能够有效识别故障文本中的信息实体;②在故障关系抽取上,BERT-BiLSTM-Attention模型的精确度达到93.61%,实现了知识图谱关系边的正确建立;③开发的问答系统实现了知识图谱的智能应用,其在多个不同类型问题上的回答准确率超过了90%,能够满足现场使用需求。结论认为,基于知识图谱的故障诊断方法能够有效利用顶部驱动装置的先验知识,实现故障的快速定位与智能诊断,具备良好的应用前景。 展开更多
关键词 钻井装备 顶部驱动装置 故障诊断 深度学习 知识图谱 自然语言处理 命名实体识别 智能问答系统
在线阅读 下载PDF
结合对比学习和提示调优的层次文本分类方法
6
作者 郑诚 纪子威 《小型微型计算机系统》 北大核心 2025年第8期1878-1885,共8页
层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和... 层次文本分类是文本分类领域一项重要的子任务,但复杂的标签层次结构使其具有挑战性.目前最先进的方法通过预训练语言模型对文本进行编码,并结合图编码器处理标签结构信息.但是,独立建模文本和标签信息可能导致信息利用率不高,预训练和微调阶段的不同策略也限制了模型挖掘预训练模型的知识.本文提出一种结合对比学习和提示调优的层次文本分类方法,将层次标签信息嵌入到文本编码过程,同时设计提示模板整合标签信息,捕获文本与标签的关联性,弥合预训练模型与下游任务间的差距.借助对比学习,根据标签信息生成正样本,强化模型对关键特征的学习与保留,使模型有效指导文本特征表示的学习.在两个公开数据集上的大量实验表明了方法的有效性. 展开更多
关键词 层次文本分类 提示调优 对比学习 深度学习 自然语言处理
在线阅读 下载PDF
面向跨域自然语言生成SQL语句的超图神经网络
7
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成SQL语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
基于句法、语义和情感知识的方面级情感分析
8
作者 郑诚 杨楠 《计算机科学》 北大核心 2025年第7期218-225,共8页
方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定... 方面级情感分析的目标是识别句子中特定方面词的情感极性。近年来,许多工作都是利用句法依赖关系和自注意力机制分别获得句法知识和语义知识,并通过图卷积网络融合这两种信息更新节点的表示。然而句法依赖关系和自注意力机制都不是特定用于情感分析的工具,不能直接有效地捕获方面词的情感表达,而这一点正是方面级情感分析的关键之处。为了更准确地识别方面词的情感表达,构造了融合句法、语义和情感知识的网络。具体来说,利用句法依赖树中的句法知识构建句法图,并将外部情感知识库信息融合在句法图中。同时,采用自注意力机制获得句子中各单词的语义知识,并通过方面感知注意力机制使语义图关注与方面词相关的信息。此外,采用双向消息传播机制同时学习这两个图中的信息并更新节点表示。在3个基准数据集上的实验结果验证了所提模型的有效性。 展开更多
关键词 方面级情感分析 图卷积网络 注意力机制 句法依赖树 情感知识 自然语言处理 深度学习
在线阅读 下载PDF
基于多路局部特征整合的嵌套命名实体识别方法
9
作者 王进 蒋诗琪 《江苏大学学报(自然科学版)》 北大核心 2025年第4期431-437,共7页
为了解决嵌套命名实体识别中边界模糊和嵌套实体提取困难的问题,提出了基于多路局部特征整合的嵌套命名实体识别方法.新方法先采用双向长短时记忆网络拆解序列的正反向特征,然后按实体长度对嵌套命名实体识别任务进行拆分,使用不同大小... 为了解决嵌套命名实体识别中边界模糊和嵌套实体提取困难的问题,提出了基于多路局部特征整合的嵌套命名实体识别方法.新方法先采用双向长短时记忆网络拆解序列的正反向特征,然后按实体长度对嵌套命名实体识别任务进行拆分,使用不同大小的卷积网络对固定长度的局部信息进行整合,最后将正反向特征进行匹配得到预测结果.引入前置加权方法来解决多层模型中层间信息传递误差大的问题.将新方法与其他的嵌套命名实体识别方法在ACE2005和GENIA两个数据集上进行对比试验.结果表明:新方法在两个数据集上均表现出了更好的效果,比其他方法中最优的Dependency Parsing在ACE2005和GENIA数据集上F_(1)分数分别提升0.18和0.03百分点,新方法相比目前主流方法有一定的性能提升. 展开更多
关键词 自然语言处理 嵌套命名实体识别 深度学习 卷积神经网络 长短时记忆网络 特征融合 自适应学习
在线阅读 下载PDF
面向法律领域的实体和关系抽取
10
作者 刘美玲 梁龙昌 《深圳大学学报(理工版)》 北大核心 2025年第1期77-84,共8页
中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在... 中文司法领域的实体和关系抽取技术在提高办案效率方面具有重要作用,但现有的关系抽取模型缺乏领域知识且难以处理重叠实体,造成难以准确区分和提取实体与关系等问题.通过引入领域知识,提出一种法律信息增强模块,增强了用所提法律潜在关系与全局对应(legal potential relationship and global correspondence,LPRGC)模型理解法律文本中术语、规则和上下文信息的能力,从而提高了实体和关系的识别准确性,进而提升了实体和关系抽取算法的性能.为解决重叠实体问题,设计了一种基于潜在关系和实体对齐的关系抽取方法.通过精确标注实体位置,筛选潜在关系,并利用全局矩阵对齐实体,解决重叠实体的关系抽取问题,能够更准确地捕捉到重叠实体之间的关系,并有效地将其映射到正确的实体对上,从而提高抽取结果的准确性.在中国法律智能技术评测数据集上进行实体和关系抽取实验,结果表明,LPRGC模型的准确率、召回率和F_(1)值分别为85.21%、81.19%和83.15%,均优于对比模型,特别是在处理实体重叠问题时,LPRGC模型在单实体重叠类型的抽取中,F_(1)值达到了81.45%;在多实体重叠类型的抽取中,F_(1)值达80.67%.LPRGC模型在实体和关系抽取的准确性上较现有方法有明显改进,在处理复杂法律文本中的实体重叠问题上取得了显著效果. 展开更多
关键词 人工智能 自然语言处理 司法领域关系抽取 深度学习 信息增强 重叠实体
在线阅读 下载PDF
三种多次波自适应匹配相减方法的对比 被引量:1
11
作者 包培楠 石颖 +1 位作者 韩宏伟 尚新民 《石油地球物理勘探》 北大核心 2025年第2期354-362,共9页
多次波降低了地震资料的信噪比,影响有效波的识别,从而使地震处理难度增加、地震成像的真实性及可靠性降低,甚至形成地质假象,影响后续的地震勘探与开发。基于波动理论的预测相减多次波压制方法能更好地适应复杂介质情况,主要分为两步:... 多次波降低了地震资料的信噪比,影响有效波的识别,从而使地震处理难度增加、地震成像的真实性及可靠性降低,甚至形成地质假象,影响后续的地震勘探与开发。基于波动理论的预测相减多次波压制方法能更好地适应复杂介质情况,主要分为两步:多次波预测和自适应匹配相减。这两个步骤都影响最终的多次波压制精度。文中对比了三种自适应匹配相减方法:基于能量最小原则的自适应匹配减法、模式识别匹配减法以及深度学习自适应匹配减法,并分析了各方法优缺点及适应性条件。含表面多次波的模型数据和含层间多次波的实际资料测试结果表明,基于能量最小原则的自适应相减算法存在子波一致性假设条件,基于模式识别的自适应相减技术对地震数据横向一致性等要求较高。与前两种传统的自适应减法相比,基于深度学习的自适应匹配减法能够避免假设条件,可有效保护一次波,计算精度较高。 展开更多
关键词 多次波压制 自适应匹配相减 能量最小原则 模式识别 深度学习
在线阅读 下载PDF
大模型时代下的汉语自然语言处理研究与探索 被引量:5
12
作者 黄施洋 奚雪峰 崔志明 《计算机工程与应用》 北大核心 2025年第1期80-97,共18页
自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然... 自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然而,相较于英语大模型,汉语大模型在逻辑推理和文本理解能力方面仍存在不足。介绍了图神经网络在特定CNLP任务中的优势,进行了量子机器学习在CNLP发展潜力的调查。总结了大模型的基本原理和技术架构,详细整理了大模型评测任务的典型数据集和模型评价指标,评估比较了当前主流的大模型在CNLP任务中的效果。分析了当前CNLP存在的挑战,并对CNLP任务的未来研究方向进行了展望,希望能帮助解决当前CNLP存在的挑战,同时为新方法的提出提供了一定的参考。 展开更多
关键词 汉语自然语言处理 图神经网络 量子机器学习 汉语大模型
在线阅读 下载PDF
基于大语言模型的智能问答系统研究综述 被引量:19
13
作者 任海玉 刘建平 +4 位作者 王健 顾勋勋 陈曦 张越 赵昌顼 《计算机工程与应用》 北大核心 2025年第7期1-24,共24页
智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥... 智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。 展开更多
关键词 大语言模型 智能问答 自然语言处理 检索增强生成 提示学习 知识图谱
在线阅读 下载PDF
基于集成学习算法的尾气处理装置SO_(2)排放预测模型 被引量:1
14
作者 张宝东 杜支文 +1 位作者 闫昭 侯磊 《石油与天然气化工》 北大核心 2025年第1期9-17,共9页
目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排... 目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排放质量浓度的预测任务,采用了随机森林(Random Forest)、梯度提升(Gradient Boost)和极值梯度提升(XGBoost)3种集成学习算法,以及基于径向基(RBF)内核的支持向量机(SVM)替代仿真模型进行建模。结果3种集成学习模型比SVM单模型的预测效果更为精准,而Random Forest模型展现出最佳性能,决定系数为0.89,均方误差为1250.59,相对于8800个真实测试集样本数据,其预测偏差为9.86%,相比于Random Forest模型(数据未处理),其决定系数提高了61.82%。结论Random Forest模型在准确预测尾气处理装置SO_(2)排放质量浓度方面具有实际生产应用价值,可为后续尾气处理装置的工艺参数优化提供可靠的模型支持。 展开更多
关键词 天然气净化 硫磺回收 尾气处理 二氧化硫排放 预测模型 集成学习算法
在线阅读 下载PDF
中医文本命名实体识别研究综述 被引量:1
15
作者 时倩如 李贺 +2 位作者 于雯倩 沈旺 张承坤 《现代情报》 北大核心 2025年第2期4-16,共13页
[目的/意义]中医文本中包含了大量领域相关知识,可为准确诊断和有效的疾病防治提供指导。本文对中医文本命名实体识别(NER)研究进行系统性综述。[方法/过程]从中医文本的特征出发,探讨了中医文本NER在知识体系、语料构建和技术算法层次... [目的/意义]中医文本中包含了大量领域相关知识,可为准确诊断和有效的疾病防治提供指导。本文对中医文本命名实体识别(NER)研究进行系统性综述。[方法/过程]从中医文本的特征出发,探讨了中医文本NER在知识体系、语料构建和技术算法层次面临的挑战;梳理中医文本NER语料构建中可用的术语标准、实体类型和标注原则与方法;归纳中医文本NER技术的一般框架、常用方法和近期趋势,并总结评估指标。[结果/结论]建议未来研究可从以下方向开展:在语料层面制定标注规范并构建高质量数据集,在算法层面探索针对小样本问题的数据优化、针对复杂实体的识别模型和增强模型解释性,以提高中医NER的效果。 展开更多
关键词 命名实体识别 中医 深度学习 自然语言处理 综述
在线阅读 下载PDF
E-Learning学习资源的交互设计研究 被引量:44
16
作者 杨彦军 郭绍青 《现代远程教育研究》 CSSCI 2012年第1期62-67,共6页
E-Learning学习资源交互设计是E-Learning研究的重要任务之一。当前E-Learning学习资源交互设计研究主要集中在多媒体课件、网络课程和网络学习系统三个方面,体现出对交互设计内涵认识含混、交互设计缺乏科学依据、各项设计工作缺乏系... E-Learning学习资源交互设计是E-Learning研究的重要任务之一。当前E-Learning学习资源交互设计研究主要集中在多媒体课件、网络课程和网络学习系统三个方面,体现出对交互设计内涵认识含混、交互设计缺乏科学依据、各项设计工作缺乏系统性等问题。E-Learning学习资源的设计,关键是要解决资源的结构化程度与资源的交互性之间的关系问题。E-Learning学习资源交互设计应当以认知负荷理论、多媒体学习理论等作为交互设计的认知理论依据,以系统观来指导教学交互各层次的交互设计,在交互设计中应当坚持一体化设计、有限交互、通道平衡等基本原则。 展开更多
关键词 E-learning 学习资源 交互设计 理论依据 设计原则
在线阅读 下载PDF
基于标签感知增强的社交媒体心理亚健康归因方法 被引量:1
17
作者 梁怡萍 肖路巍 王琳琳 《华东师范大学学报(自然科学版)》 北大核心 2025年第1期124-137,共14页
在大量的网络社交媒体中,存在一些表达了潜在的心理健康障碍和精神疾病的帖子,根据帖子文本识别用户产生心理健康障碍的原因是一项重要任务.观察这些帖子发现,其上下文中存在标签共现现象,即上下文中同时出现了多个候选标签的语义,干扰... 在大量的网络社交媒体中,存在一些表达了潜在的心理健康障碍和精神疾病的帖子,根据帖子文本识别用户产生心理健康障碍的原因是一项重要任务.观察这些帖子发现,其上下文中存在标签共现现象,即上下文中同时出现了多个候选标签的语义,干扰了标签表征的建模与预测.为缓解该现象带来的影响,提出了一种标签感知增强分类的方法,该方法利用大规模预训练语言模型识别潜在的候选标签,并通过估计样本独立的标签语义强度作为增强数据以消减共现标签带来的噪声,基于增强数据构建了性能良好的预训练语言模型分类器.在数据集Intent_SDCNL和SAD上进行的实验验证了该方法的有效性. 展开更多
关键词 心理亚健康归因 自然语言处理 提示学习
在线阅读 下载PDF
基于增强CNN获取丰富匹配特征的文本匹配方法 被引量:1
18
作者 汤福平 陈红英 《计算机应用与软件》 北大核心 2025年第2期210-215,共6页
在文本匹配问题中,为了获取两个文本表达中的匹配特征,提出一种基于增强的卷积神经网络来获取丰富匹配特征的文本匹配方法。通过多层对齐机制捕获句子交互特征,同时采用增强CNN获取的关键词特征进一步捕捉句子关键特征信息;接着通过一... 在文本匹配问题中,为了获取两个文本表达中的匹配特征,提出一种基于增强的卷积神经网络来获取丰富匹配特征的文本匹配方法。通过多层对齐机制捕获句子交互特征,同时采用增强CNN获取的关键词特征进一步捕捉句子关键特征信息;接着通过一种基于门控机制的融合方法,融合句子内的关键特征和句子间的匹配特征,由门控网络选择加强关键匹配信息和弱化与匹配文本无关的局部信息。实验结果验证了该模型的有效性。 展开更多
关键词 自然语言处理 文本匹配 注意力机制 门控网络 深度学习
在线阅读 下载PDF
多任务增强的文本生成式事件要素抽取方法
19
作者 史张龙 周喜 +2 位作者 王震 马博 杨雅婷 《计算机工程与应用》 北大核心 2025年第9期168-176,共9页
事件要素抽取旨在从非结构化文本中抽取结构化的事件数据,为下游任务提供结构化输入。近年来,许多研究采用预训练语言模型加提示学习的方式实现事件要素抽取,以模板槽位填空的形式完成该任务。然而,以往的研究主要采用单模板单任务的方... 事件要素抽取旨在从非结构化文本中抽取结构化的事件数据,为下游任务提供结构化输入。近年来,许多研究采用预训练语言模型加提示学习的方式实现事件要素抽取,以模板槽位填空的形式完成该任务。然而,以往的研究主要采用单模板单任务的方法,但单一模板难以很好地捕捉事件要素实体间的结构依赖关系,其设计质量会影响最终的抽取结果;并且忽视了在进行多任务学习时,相似任务之间的促进作用。因此,设计了一种基于多任务增强的文本生成式事件要素抽取方法。具体地,分别构建了多模板指令增强任务模块与跨任务协同增强任务模块,以生成式模型作为共享主干网络,多种任务统一训练实现知识高效共享。该方法通过不同模板的指令增强,加强额外语义约束,提高了模型对指令的理解能力,通过跨任务的协同增强,使模型通过不同任务的互相监督,提高了模型对事件文本的理解分析能力。在ACE05数据集和RAMS数据集上的全样本实验中,该方法的Arg-C值分别达到了74.1%和52.4%,达到了最优水平。同时具有优异的少样本性能,在少样本场景下实验,仅需一半的数据量就可以达到阅读理解方法的抽取效果。 展开更多
关键词 事件要素抽取 信息抽取 提示学习 多任务学习 自然语言处理
在线阅读 下载PDF
机器学习辅助高通量筛选金属有机骨架用于富碳天然气中分离CO_(2) 被引量:1
20
作者 周印洁 吉思蓓 +2 位作者 何松阳 吉旭 贺革 《化工学报》 北大核心 2025年第3期1093-1101,共9页
在碳达峰和碳中和目标的推动下,开发绿色化学技术,如利用海上风电电解水生产的绿色氢气和从富碳天然气中分离出来的CO_(2)合成绿甲醇具有重要的社会经济意义。但如何高效分离海洋富碳天然气中的二氧化碳成为其中的关键技术难点,常规的... 在碳达峰和碳中和目标的推动下,开发绿色化学技术,如利用海上风电电解水生产的绿色氢气和从富碳天然气中分离出来的CO_(2)合成绿甲醇具有重要的社会经济意义。但如何高效分离海洋富碳天然气中的二氧化碳成为其中的关键技术难点,常规的高通量筛选方法用于金属有机骨架(MOFs)分离实际天然气组分CO_(2)面临着模型复杂性高、求解时间长的问题。提出了一种机器学习辅助的高通量筛选策略,其在训练集和测试集上的R^(2)值分别超过了0.98和0.92,可用于快速从富碳天然气六元混合物(N_(2)、CO_(2)、CH_(4)、C_(2)H_(6)、C_(3)H_(8)、H_(2)S)中分离出CO_(2)。 展开更多
关键词 金属有机骨架 高通量筛选 CO_(2)分离 机器学习 分子模拟 富碳天然气
在线阅读 下载PDF
上一页 1 2 51 下一页 到第
使用帮助 返回顶部