期刊文献+
共找到800篇文章
< 1 2 40 >
每页显示 20 50 100
面向研究生招生咨询的中文Text-to-SQL模型
1
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 text-to-sql数据集
在线阅读 下载PDF
基于关系感知图神经网络的Text-to-SQL方法
2
作者 曹渝昆 王天浩 +3 位作者 李云峰 陈明 李晶晶 刘元旻 《计算机工程》 北大核心 2025年第9期129-138,共10页
Text-to-SQL语义解析任务旨在将自然语言问题转化为可执行的SQL语句。近年来,许多研究将预训练模型等方法应用到该任务中,并取得了一定的进展。然而,现有的预训练模型没有针对Text-to-SQL任务进行重新训练,不能很好地适应任务的场景语... Text-to-SQL语义解析任务旨在将自然语言问题转化为可执行的SQL语句。近年来,许多研究将预训练模型等方法应用到该任务中,并取得了一定的进展。然而,现有的预训练模型没有针对Text-to-SQL任务进行重新训练,不能很好地适应任务的场景语义特征信息,从而影响模型的解析性能。同时,许多方法还容易忽略自然语言问题与数据库模式间的关系,造成解析过程中语义模糊的问题。为解决这些问题,提出一种新的RGA-T5模型来完成Text-to-SQL语义解析任务。该模型在预训练模型T5中引入了关系感知异构图神经网络(HGNN),将输入的实体与关系构建为异构图上的节点,并通过应用图神经网络(GNN)实现模型对输入序列的语义关系感知。同时,还提出空间门控适配器,对其参数进行训练实现对预训练模型的微调,使模型能够针对该任务适应不同场景下的语义特征信息,减少无关信息的引入。实验结果表明,该模型在Spider数据集上相较于其他先进的Text-to-SQL解析方法取得了一定程度的性能提升,验证了所提方法的有效性。 展开更多
关键词 语义解析 预训练模型 异构图神经网络 空间门控单元 适配器
在线阅读 下载PDF
Improved head-driven statistical models for natural language parsing 被引量:1
3
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2013年第10期2747-2752,共6页
Head-driven statistical models for natural language parsing are the most representative lexicalized syntactic parsing models, but they only utilize semantic dependency between words, and do not incorporate other seman... Head-driven statistical models for natural language parsing are the most representative lexicalized syntactic parsing models, but they only utilize semantic dependency between words, and do not incorporate other semantic information such as semantic collocation and semantic category. Some improvements on this distinctive parser are presented. Firstly, "valency" is an essential semantic feature of words. Once the valency of word is determined, the collocation of the word is clear, and the sentence structure can be directly derived. Thus, a syntactic parsing model combining valence structure with semantic dependency is purposed on the base of head-driven statistical syntactic parsing models. Secondly, semantic role labeling(SRL) is very necessary for deep natural language processing. An integrated parsing approach is proposed to integrate semantic parsing into the syntactic parsing process. Experiments are conducted for the refined statistical parser. The results show that 87.12% precision and 85.04% recall are obtained, and F measure is improved by 5.68% compared with the head-driven parsing model introduced by Collins. 展开更多
关键词 VALENCE structure SEMANTIC dependency head-driven statistical SYNTACTIC parsing SEMANTIC role labeling
在线阅读 下载PDF
基于语义增强模式链接的Text-to-SQL模型 被引量:1
4
作者 吴相岚 肖洋 +1 位作者 刘梦莹 刘明铭 《计算机应用》 CSCD 北大核心 2024年第9期2689-2695,共7页
为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加... 为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化;最后,使用改良的关系图注意力网络(RGAT)图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码,并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言(SQL)语句解码。在Spider数据集上的实验结果表明,使用ELECTRA-large预训练模型时,SELSQL模型比最佳基线模型的准确率提升了2.5个百分点,对于复杂SQL语句生成的提升效果很大。 展开更多
关键词 模式链接 图结构学习 预训练语言模型 text-to-sql 异构图
在线阅读 下载PDF
RNSQL:融合逆规范化的Text2SQL生成
5
作者 帖军 范子琪 +2 位作者 孙翀 郑禄 朱柏尔 《计算机应用与软件》 北大核心 2025年第9期31-37,86,共8页
Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及... Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及多表连接的SQL生成仍存在大量错误。因此,提出一种基于神经网络的Text2SQL方法,该方法通过逆规范化技术,对数据库模式进行重构,关注SQL句法生成的正确性,称为逆规范化网络(Reverse Normalization SQL,RNSQL)。经理论分析和在公共数据集Spider上实验验证,RNSQL能有效提升Text2SQL任务的质量。 展开更多
关键词 逆规范化 语义解析 Text2SQL 槽填充
在线阅读 下载PDF
船舶能效管理平台串口型数据配置化采集方法研究
6
作者 童大鹏 李鹏蕾 +1 位作者 刘杰 杨永康 《船海工程》 北大核心 2025年第1期76-80,共5页
针对船舶能效管理系统软件在串口数据采集和数据解析环节的紧密耦合,导致代码固化调整不便等问题,提出基于配置化的串口数据采集改进方法,将串口基于不同的通讯协议和数据解析方法提炼为配置化信息。软件可读取配置信息自动对串口进行... 针对船舶能效管理系统软件在串口数据采集和数据解析环节的紧密耦合,导致代码固化调整不便等问题,提出基于配置化的串口数据采集改进方法,将串口基于不同的通讯协议和数据解析方法提炼为配置化信息。软件可读取配置信息自动对串口进行初始化和解析,实现在不修改代码的前提下,用户可以根据需求修改、增加或删除配置信息调整软件处理方式,实现软件功能的扩展性。该成果目前已经运用到船舶能效系统中,效果显著。 展开更多
关键词 串口解析 数据自动采集 配置信息
在线阅读 下载PDF
基于先验知识的问诊系统文本结构化解析方法
7
作者 刘耀 翟雨 周家辉 《计算机应用研究》 北大核心 2025年第4期1143-1149,共7页
对医学书籍等领域文本与患者自述等患者相关文本结构化解析,能够为问诊系统构建提供结构化资源支撑,有助于辅助医生诊断。为此,提出一种文本结构化解析方法。该方法利用工程方式获取领域先验知识与训练数据;基于BERT模型,通过掩码语言... 对医学书籍等领域文本与患者自述等患者相关文本结构化解析,能够为问诊系统构建提供结构化资源支撑,有助于辅助医生诊断。为此,提出一种文本结构化解析方法。该方法利用工程方式获取领域先验知识与训练数据;基于BERT模型,通过掩码语言模型与实体排序任务将医学领域先验知识融入模型,获得先验知识增强的MedReBERT模型;设计文本生成模板构造概念标引模型与概念关系标引模型,实现概念及关系的标引,并提出一种工程处理与算法协同学习框架。实验证明该方法能够实现问诊系统文本的结构化解析。提出的方法框架能够建立各算法间的接口,实现问诊系统文本结构化解析相关算法的低门槛迭代应用。 展开更多
关键词 先验知识 结构化解析 问诊系统
在线阅读 下载PDF
面向跨域自然语言生成SQL语句的超图神经网络
8
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成SQL语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
汉语“状语+述语+宾语”序列结构的层次切分
9
作者 王红旗 孙停停 《汉语学习》 北大核心 2025年第2期3-12,共10页
汉语“状语+述语+宾语”序列结构(如“努力学习外语”)层次切分问题一直没有得到很好的解决,文章首先批评了“多切分结构”的观点,并对以往层次切分的依据进行了修正和补充。根据修正和补充的层次切分依据,汉语“状语+述语+宾语”序列... 汉语“状语+述语+宾语”序列结构(如“努力学习外语”)层次切分问题一直没有得到很好的解决,文章首先批评了“多切分结构”的观点,并对以往层次切分的依据进行了修正和补充。根据修正和补充的层次切分依据,汉语“状语+述语+宾语”序列结构只能切分为“状语/+述语+宾语”。为了证明这样切分的正确性,文章对每一类“状语+述语+宾语”序列结构都做了细致的描写和分析。 展开更多
关键词 层次分析 多切分结构 述语 宾语 状语
在线阅读 下载PDF
基于深度语义解析的API越权漏洞攻击主动防御方法
10
作者 冯景瑜 潘濛 +1 位作者 王佳林 赵翔 《信息网络安全》 北大核心 2025年第6期933-942,共10页
静态化防御机制因特征与语义理解有限,难以应对API越权漏洞的动态隐蔽威胁,主动防御已逐渐成为增强网络安全的有效手段。文章提出一种融合动态语义感知与对抗验证的主动防御方法,有效阻断API越权漏洞攻击威胁;设计一种高效的动态网页爬... 静态化防御机制因特征与语义理解有限,难以应对API越权漏洞的动态隐蔽威胁,主动防御已逐渐成为增强网络安全的有效手段。文章提出一种融合动态语义感知与对抗验证的主动防御方法,有效阻断API越权漏洞攻击威胁;设计一种高效的动态网页爬取策略,以充分获取页面信息,结合 MiniLM 模型分析响应包内容与 URL信息的关联性,实现有效载荷的构造。文章通过微调 BERT 模型对 URL 进行自定义类别划分,以此为基础,采用 Trans-LVD 模型进行页面相似度分析,量化 URL 之间的相似程度,识别可能存在的越权漏洞,实现对网络系统安全漏洞的修补和相关配置,提升系统对未知威胁的适应性与防护能力。最后,在业界工具基准测试下进行实验分析,证明该方法在检测精度、适应性及主动防御能力方面的优越性。 展开更多
关键词 深度语义解析 主动防御 越权漏洞 对抗验证
在线阅读 下载PDF
基于CLIP增强细粒度特征的换装行人重识别方法
11
作者 耿霞 汪尧 《计算机工程》 北大核心 2025年第4期293-302,共10页
换装行人重识别旨在检索穿着不同服装的目标行人。现有方法通过引入额外信息(如轮廓、步态、3D信息)辅助学习服装无关特征。但受光照、姿态变化等因素的影响,提取的生物特征可能存在误差。为提高准确性,探索对比语言-图像预训练(CLIP)... 换装行人重识别旨在检索穿着不同服装的目标行人。现有方法通过引入额外信息(如轮廓、步态、3D信息)辅助学习服装无关特征。但受光照、姿态变化等因素的影响,提取的生物特征可能存在误差。为提高准确性,探索对比语言-图像预训练(CLIP)在该任务的应用,提出CLIP驱动的细粒度特征增强方法(CFFE)。首先建模CLIP提取的类文本特征和图像特征的潜在内在联系,然后引入显著性特征保留模块和显著性特征引导模块。显著性特征保留模块利用注意力掩码定位服装相关的前景区域,进而擦除该部分特征,使网络关注有效的非服装特征,显著性特征引导模块通过注意力机制进一步关注行人的重要局部和全局特征。实验结果表明,该方法在LTCC、PRCC和VC-Clothes数据集上的检测精度分别达到42.1%、71.1%和89.9%,与AIM、CAL等算法相比,能够提取到更细粒度的特征,在多项指标上有明显提升。 展开更多
关键词 换装行人重识别 对比语言-图像预训练 特征保留策略 注意力机制 语义解析
在线阅读 下载PDF
IPv6环境下无线网络入侵行为动态取证系统设计 被引量:2
12
作者 王庆刚 顾峰 +1 位作者 陈华春 张林 《现代电子技术》 北大核心 2025年第5期115-119,共5页
为在IPv6网络协议环境下对无线网络中的入侵行为进行准确监控和记录,以收集、保存无线网络入侵相关的证据,设计IPv6环境下无线网络入侵行为动态取证系统。该系统通过无线网卡连接IPv6环境下以太网,使用数据包捕获模块获取无线网络数据包... 为在IPv6网络协议环境下对无线网络中的入侵行为进行准确监控和记录,以收集、保存无线网络入侵相关的证据,设计IPv6环境下无线网络入侵行为动态取证系统。该系统通过无线网卡连接IPv6环境下以太网,使用数据包捕获模块获取无线网络数据包后,将其输入到IPv6协议解析模块内,通过该模块对无线网络数据包实施解析处理,得到无线网络数据属性值参数。再将无线网络数据属性值参数输入到入侵行为取证模块内,该模块对无线网络数据属性值参数进行量化后,运用Clameleon聚类算法对量化后的无线网络数据属性值参数进行聚类处理,得到无线网络数据属性值参数中的入侵行为参数,实现无线网络入侵行为动态取证。实验结果表明,该系统具备较强的无线网络数据包捕获能力和无线网卡驱动能力,并可有效对不同类型的网络入侵行为进行动态取证,应用效果较佳。 展开更多
关键词 IPV6环境 无线网络 入侵行为 动态取证 Clameleon聚类 网卡驱动 数据解析 数据量化
在线阅读 下载PDF
汉语被动结构解析及其在CAMR中的应用研究
13
作者 胡康 曲维光 +3 位作者 魏庭新 周俊生 李斌 顾彦慧 《中文信息学报》 北大核心 2025年第9期23-31,共9页
汉语被动句是一种重要的语言现象。该文采用BIO结合索引的标注方法,对被动句中的被动结构进行了细粒度标注,提出了一种基于BERT-wwm-ext预训练模型和双仿射注意力机制的CRF序列标注模型,实现对汉语被动句中内部结构的自动解析,F_(1)值达... 汉语被动句是一种重要的语言现象。该文采用BIO结合索引的标注方法,对被动句中的被动结构进行了细粒度标注,提出了一种基于BERT-wwm-ext预训练模型和双仿射注意力机制的CRF序列标注模型,实现对汉语被动句中内部结构的自动解析,F_(1)值达到97.31%。该文提出的模型具有良好的泛化性,实验证明,基于该模型解析出被动结构,进一步对CAMR图进行后处理操作,能有效提高CAMR被动句解析性能。 展开更多
关键词 被动结构解析 双仿射注意力 CRF CAMR 后处理
在线阅读 下载PDF
基于前置数据处理框架的新能源一体化监控方案
14
作者 张亦乐 胡波 +4 位作者 张津 宋美艳 皇晓军 李家港 薛建中 《热力发电》 北大核心 2025年第4期77-84,共8页
当前新能源场站在各个生产环节所使用的硬件及监控系统由不同厂家提供,导致各业务系统间的数据格式和通信规约无法统一。这种数据的不统一性使各业务系统只能相互独立运行,为现场运维人员的操作维护和协调控制带来了诸多不便,部分系统... 当前新能源场站在各个生产环节所使用的硬件及监控系统由不同厂家提供,导致各业务系统间的数据格式和通信规约无法统一。这种数据的不统一性使各业务系统只能相互独立运行,为现场运维人员的操作维护和协调控制带来了诸多不便,部分系统甚至因此陷入了无人维护的局面。针对新能源场站的数据特点,提出了一种基于前置数据处理框架的一体化监控方案,在介绍其架构设计和工作流程的基础上,提出新能源场站一体化监控适用的综合数据处理驱动和基于混合架构的场站数据存储技术,详述了数据的采集、标准化和存储的实现思路,并结合应用案例验证了此方案带来的系统性能提升。该方案可以适应不同规模的新能源监控需求,在高并发的处理场景下确保海量数据处理的实时性和安全性,并显著提升了新能源场站的数据分析能力,为相关系统的开发和改进提供了重要参考。 展开更多
关键词 数据采集 规约解析 数据存储
在线阅读 下载PDF
IL-29对胰蛋白酶诱导的肥大细胞PARs表达的调节作用 被引量:5
15
作者 隋丽 陈冬 +1 位作者 张慧云 何韶衡 《中国免疫学杂志》 CAS CSCD 北大核心 2014年第5期609-612,622,共5页
目的:检测白细胞介素29(Interleukin-29,IL-29)对胰蛋白酶引起的肥大细胞蛋白酶激活受体(Protease activated receptor,PAR)-1,2,3,4表达的调节作用。方法:P815肥大细胞培养后,用不同浓度的IL-29、胰蛋白酶单独或联合激发肥大细胞,在不... 目的:检测白细胞介素29(Interleukin-29,IL-29)对胰蛋白酶引起的肥大细胞蛋白酶激活受体(Protease activated receptor,PAR)-1,2,3,4表达的调节作用。方法:P815肥大细胞培养后,用不同浓度的IL-29、胰蛋白酶单独或联合激发肥大细胞,在不同时间点收集激发细胞,用流式细胞术(FCM)及实时定量PCR检测P815肥大细胞蛋白酶激活受体的表达。结果:IL-29单独作用能够下调肥大细胞PAR-1蛋白及mRNA水平的表达,上调PAR-3、PAR-4 mRNA的表达,与对照组相比差异有统计学意义(P<0.05);以IL-29预处理肥大细胞后,IL-29对胰蛋白酶诱导的肥大细胞PAR-2、PAR-3、PAR-4表达起促进作用,与对照组相比差异具有统计学意义(P<0.05)。结论:IL-29能够调节胰蛋白酶引起的肥大细胞PARs表达,从而参与肥大细胞相关的炎症反应。 展开更多
关键词 肥大细胞 白细胞介素29(IL-29) 胰蛋白酶 蛋白酶激活受体(pars) 流式细胞术
在线阅读 下载PDF
结合依存图卷积的中文文本相似度计算研究 被引量:1
16
作者 胡书林 张华军 +1 位作者 邓小涛 王征华 《计算机工程》 北大核心 2025年第3期76-85,共10页
目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能... 目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能使用静态词嵌入来表征词的语义向量。针对此问题,根据依存句法分析构建依存图,通过分词掩码映射与注意力混合池化的方法实现动态词嵌入表征词节点的语义特征,然后使用图卷积网络提取依存图中词节点之间的依存关系信息,最终读出依存图,将其作为句子的特征向量,从语义与句法2个层面计算句子间的相似度。在表示型与交互型2种结构模型上应用所提方法,并在BQ_Corpus与ATEC数据集上进行实验,结果显示,该模型的准确率最高分别达到87.12%与88.33%,结合依存句法信息后模型的各项评估指标均有提升。 展开更多
关键词 图卷积神经网络 依存句法分析 动态词嵌入 文本相似度 注意力机制
在线阅读 下载PDF
融合词性提示学习的大语言模型依存句法分析
17
作者 张振国 李英 +1 位作者 余正涛 黄于欣 《厦门大学学报(自然科学版)》 北大核心 2025年第4期606-615,共10页
[目的]针对大语言模型(LLMs)在依存句法分析任务上的性能尚未得到系统性探索的问题进行研究.[方法]首先设计多种提示策略对富资源语言中文和低资源语言越南语进行全面的LLMs依存句法分析性能评估,用于确定LLMs中蕴含句法知识的程度;然... [目的]针对大语言模型(LLMs)在依存句法分析任务上的性能尚未得到系统性探索的问题进行研究.[方法]首先设计多种提示策略对富资源语言中文和低资源语言越南语进行全面的LLMs依存句法分析性能评估,用于确定LLMs中蕴含句法知识的程度;然后将词性信息作为外部知识来构建提示模板,进一步激活LLMs对于词法和句法的理解能力,提高依存句法分析的性能.[结果]实验结果表明,LLMs在富资源语言中文上的句法解析能力更强,而对于低资源语言越南语的解析能力较弱.通过对比实验,证明了外部词法知识的融入可以进一步提高其句法分析的能力,其中带标签依存分数(LAS)在中文上提升了13.11%,在越南语上提升了2.26%.[结论]设计合理的提示策略可以显著提升LLMs在句法分析任务上的表现,且在不同提示策略下,词性信息的加入对模型性能均产生了积极的影响. 展开更多
关键词 大语言模型 依存句法分析 词性信息 提示策略
在线阅读 下载PDF
基于结构化案例推理的SQL生成模型
18
作者 罗明全 王静 魏英 《无线电通信技术》 北大核心 2025年第3期478-485,共8页
自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例... 自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例连接到模型中,进而使解码器产生偏差,不能充分利用案例中逻辑形式的结构。基于上述情况,提出一种基于结构化案例推理(Structured Case Reasoning Model,SCRM)的SQL生成模型,充分利用案例的逻辑形式和候选输出之间的子树级相似性,以此生成更好的解码器决策;提出一个可训练的组合子树相似函数,与全树嵌入相比,该函数对于大型搜索边界的评分更为准确。SCRM结合新的结构化案例记忆及可训练的查询子树相似度模块,可以提升推理过程中正确输出的得分。在5种不同的数据集上进行实验,相对于其他模型,所提出的SCRM凭借结构化案例的优势,在不同性能指标上均取得了最佳结果。 展开更多
关键词 text-to-sql 子树级相似性 结构化案例 解码器 相似函数
在线阅读 下载PDF
基于效率导向的自适应大语言模型日志解析方法
19
作者 黄岩 罗朝彤 +5 位作者 左金虎 肖忠良 陈晓磊 陈佳 王鹏 汪卫 《计算机应用与软件》 北大核心 2025年第10期124-132,共9页
日志数据包含了软件服务运行过程中关键的行为信息,因而具有重要的研究与应用价值。日志解析作为日志处理流程中的核心步骤,通过将半结构化数据转化为结构化数据,显著提升了对日志信息的分析能力和利用效率。然而,现有基于大语言模型的... 日志数据包含了软件服务运行过程中关键的行为信息,因而具有重要的研究与应用价值。日志解析作为日志处理流程中的核心步骤,通过将半结构化数据转化为结构化数据,显著提升了对日志信息的分析能力和利用效率。然而,现有基于大语言模型的日志解析方法存在冷启动困难和效率低下的问题。基于效率导向的自适应解析方法(EGAP)通过在传统解析方法的基础上,引入大语言模型的在线优化策略,有效提升了解析的精度与效率。EGAP利用模板缓存机制实现日志模板的快速匹配,并通过效率估算机制,灵活控制大语言模型的使用,以确保解析过程在高效性和准确性之间取得平衡。实验结果表明,EGAP在显著提升日志解析准确性的同时,大幅提高了解析效率。 展开更多
关键词 日志解析 大语言模型 数据挖掘
在线阅读 下载PDF
多维上下文关系感知的SQL自动生成方法
20
作者 刘晨旭 王邦平 +3 位作者 宋海权 韩楠 杨春芳 乔少杰 《重庆理工大学学报(自然科学)》 北大核心 2025年第9期124-132,共9页
结构化查询语言(structured query language,SQL)生成技术能将自然语言(natural language,NL)自动转换为SQL,成为当前研究热点。现有SQL自动生成方法仍存在诸多不足:无法在复杂情况下准确生成SQL;无法充分建模NL及数据库元素间的关系;... 结构化查询语言(structured query language,SQL)生成技术能将自然语言(natural language,NL)自动转换为SQL,成为当前研究热点。现有SQL自动生成方法仍存在诸多不足:无法在复杂情况下准确生成SQL;无法充分建模NL及数据库元素间的关系;在上下文相关环境下的多轮对话处理能力不足。针对上述问题,提出多维上下维关系感知的SQL自动生成方法MCRA(multi-dimensional context-relation awareness),集成了多维关系图构建模块、多维关系感知编码器、辅助任务模块等关键组件,能够更加全面地建模各元素间的关系,在一定程度上克服多轮对话生成的SQL准确率较低的问题。在标准数据集上进行实验,结果表明:MCRA算法SQL生成准确率优于主流模型。 展开更多
关键词 SQL生成器 语义解析 人机交互 NL-to-SQL
在线阅读 下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部