期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于树状模型的复杂自然语言查询转SQL技术研究 被引量:5
1
作者 赵猛 陈珂 +2 位作者 寿黎但 伍赛 陈刚 《软件学报》 EI CSCD 北大核心 2022年第12期4727-4745,共19页
自然语言查询转SQL(NL2SQL)是指将自然语言表达的查询文本自动转化成数据库系统可以理解并执行的结构化查询语言SQL表达式的技术.NL2SQL可以为普通用户提供数据库查询访问的自然交互界面,从而实现基于数据库的自然问答.复杂查询的NL2SQ... 自然语言查询转SQL(NL2SQL)是指将自然语言表达的查询文本自动转化成数据库系统可以理解并执行的结构化查询语言SQL表达式的技术.NL2SQL可以为普通用户提供数据库查询访问的自然交互界面,从而实现基于数据库的自然问答.复杂查询的NL2SQL是当前数据库学术界的研究热点,主流方法采用序列到序列(Seq2seq)的编解码方式对问题进行建模.然而,已有的工作大多基于英文场景,面向中文领域实际应用时,中文特殊的口语化表达导致复杂查询转化困难;此外,现有工作难以正确输出包含复杂计算表达式的查询子句.针对上述问题,提出一种树状模型取代序列表示,将复杂查询自顶向下分解为多叉树,树结点代表SQL的各组成元素,采用深度优先搜索来预测生成SQL语句.在Du SQL中文NL2SQL竞赛的两个官方测试集中,该方法分别取得了第1名和第2名的成绩,验证了其有效性. 展开更多
关键词 自然语言查询转sql 语义解析 自然语言处理
在线阅读 下载PDF
数据库自然语言查询系统Nchiql中语义依存树向SQL的转换 被引量:16
2
作者 孟小峰 王珊 《中文信息学报》 CSCD 北大核心 2001年第5期40-45,共6页
本文介绍了关系数据库受限自然语言查询系统NChiql中语义依存树向SQL的转换算法。文章首先介绍了集合块的概念、划分方法以及集合块向SQL的转换算法 ,然后再给出最大集合块的再次划分方法 。
关键词 语义依存树 sql语言 自然语言接口 关系数据库 自然语言查询系统 换算法 NCHIQL
在线阅读 下载PDF
融合LSTM的自然语言转结构化查询语句算法的研究与设计 被引量:4
3
作者 孙红 黄瓯严 《小型微型计算机系统》 CSCD 北大核心 2023年第1期63-67,共5页
自然语言转结构化查询语句(Natural Language to SQL,NL2SQL)是信息领域一个重要课题.目前前沿的NL2SQL工作都是针对英文数据集,而处理英文数据的方法直接应用到中文上往往难以取得很好的效果.本文首先对传统的SQLNet模型进行了改进,在... 自然语言转结构化查询语句(Natural Language to SQL,NL2SQL)是信息领域一个重要课题.目前前沿的NL2SQL工作都是针对英文数据集,而处理英文数据的方法直接应用到中文上往往难以取得很好的效果.本文首先对传统的SQLNet模型进行了改进,在其中融入了预训练模型,增强了其提取特征的能力;之后又分别对分类模型和条件值模型进行了改进:在分类模型中增加了LSTM进一步捕捉特征,在条件值模型中使用正则表达式等手段对特殊的条件子句进行了预处理.实验表明,本文对分类模型和条件值模型所做的改进都能有效提升模型的表达效果. 展开更多
关键词 自然语言处理 自然语言结构化查询语句 长短时记忆网络 预训练模型 查询化结构语言网络模型
在线阅读 下载PDF
自然语言生成多表SQL查询语句技术研究 被引量:18
4
作者 曹金超 黄滔 +2 位作者 陈刚 吴晓凡 陈珂 《计算机科学与探索》 CSCD 北大核心 2020年第7期1133-1141,共9页
自然语言生成SQL查询不仅是构建智能数据库查询系统的一个重要组成部分,亦是新型供电轨道交通系统混合时态大数据个性化运维的难点之一。目前利用深度学习模型的方法专注于数据库中单表SQL查询生成,无法解决数据库中多表SQL查询生成。... 自然语言生成SQL查询不仅是构建智能数据库查询系统的一个重要组成部分,亦是新型供电轨道交通系统混合时态大数据个性化运维的难点之一。目前利用深度学习模型的方法专注于数据库中单表SQL查询生成,无法解决数据库中多表SQL查询生成。针对这个问题,采用一种基于SQL语句模板填充的方法,将序列生成问题转化为多个分类问题,在训练深度学习模型的过程中充分利用SQL子句不同预测成分之间的依赖关系。在FROM子句的多表JOIN路径生成方面,将其建模为斯坦纳树问题,采用一种全局最优的算法来进行求解。在一个开放的文本生成SQL数据集Spider上对模型和算法进行实验验证,实验结果表明该方法能有效地提升多表SQL查询生成的查询匹配准确率。 展开更多
关键词 自然语言 sql查询生成 多表 模板填充 深度学习
在线阅读 下载PDF
基于Ontology的数据库自然语言查询接口的研究 被引量:8
5
作者 李虎 田金文 +1 位作者 王缓缓 石勇 《计算机科学》 CSCD 北大核心 2010年第6期200-205,共6页
提出了一种基于Ontology的关系数据库自然语言查询接口的系统模型及设计框架。采用WordNet作为基本数据库并在WordNet之上定义领域词库,可以提高语法分析的识别率;同时利用Ontlogly知识表达能力存储关系数据库概念模型,并对概论模型的... 提出了一种基于Ontology的关系数据库自然语言查询接口的系统模型及设计框架。采用WordNet作为基本数据库并在WordNet之上定义领域词库,可以提高语法分析的识别率;同时利用Ontlogly知识表达能力存储关系数据库概念模型,并对概论模型的内容进行扩充;另外对Ontology和WordNet的同义词集进行关联,可以提高语义的识别率。用户的输入查询语句通过语法分析、语义分析生成中间表达式语言DRS,然后通过模板技术转换成SQL,通过DBMS执行SQL并返回结果。实验证明,这种方案不但实用可行,而且通过逐步完善Ontology知识库的定义,可以大大提高查询的命中率;另外通过WordNet和Ontology定义领域词库和领域知识,提高了系统的可移植性。最后,所提供的方法可以很容易地移植到其他领域。 展开更多
关键词 本体 数据库自然语言查询接口 篇章表述结构 数据库管理系统 sql OWL
在线阅读 下载PDF
基于自然语言的数据库查询生成研究综述 被引量:5
6
作者 刘喜平 舒晴 +2 位作者 何佳壕 万常选 刘德喜 《软件学报》 EI CSCD 北大核心 2022年第11期4107-4136,共30页
数据库能够提供对大量数据的高效存储和访问,然而查询数据库需要掌握数据库查询语言SQL,对于普通用户而言存在一定的门槛.基于自然语言的数据库查询(即text-to-SQL)在最近几年受到了广泛的关注.对text-to-SQL问题的当前进展进行了系统... 数据库能够提供对大量数据的高效存储和访问,然而查询数据库需要掌握数据库查询语言SQL,对于普通用户而言存在一定的门槛.基于自然语言的数据库查询(即text-to-SQL)在最近几年受到了广泛的关注.对text-to-SQL问题的当前进展进行了系统的分析.首先介绍了问题背景,并对问题进行了描述;其次,重点分析了目前提出的text-to-SQL技术,包括基于流水线的方法、基于统计学习的方法,以及为多轮text-to-SQL而开发的技术,对每种方法都进行了深入的分析和总结.再次,进一步讨论了text-to-SQL所属的语义解析(semantic parsing)这一领域的研究.接着,总结了目前研究中广泛采用的数据集和评价指标,并从多个角度对主流模型进行了比较和分析.最后,总结了text-to-SQL任务面临的挑战,以及未来的研究方向. 展开更多
关键词 自然语言 数据库查询 sql text-to-sql 语义解析 自然语言处理
在线阅读 下载PDF
基于字段嵌入的数据库自然语言查询接口 被引量:3
7
作者 田野 寿黎但 +2 位作者 陈珂 骆歆远 陈刚 《计算机科学》 CSCD 北大核心 2020年第9期60-66,共7页
将自然语言转化成数据库可以执行的查询语句,是目前智能交互和人机对话系统的核心难题,也是新型供电列车大数据运用支撑平台对接应用平台及建立城轨列车个性化运维系统的难点。现有的基于神经网络的方法没有充分利用数据表的丰富信息,... 将自然语言转化成数据库可以执行的查询语句,是目前智能交互和人机对话系统的核心难题,也是新型供电列车大数据运用支撑平台对接应用平台及建立城轨列车个性化运维系统的难点。现有的基于神经网络的方法没有充分利用数据表的丰富信息,影响了查询的准确率。针对数据表内容作为输入的情况下,如何提升自然语言查询接口的查询准确率的问题,文中创新地提出了基于数据表内容的字段嵌入方法,利用数据表中每个字段存储的内容对字段进行嵌入表示,并据此提出了新的模型嵌入层结构;此外,提出了一种基于数据表内容的数据增强方法,通过用数据表相同字段中的其他记录去代替查询语句中的属性值,来产生新的训练样本。最后,针对提出的字段嵌入表示和数据增强方法,在WikiSQL数据集上进行了对比实验。实验结果显示,相比当前效果最好的模型,单独使用这两种方法时能够提升0.6%~0.8%的查询准确率,共同使用时则能够提升接近1%的查询准确率,证明所提字段嵌入和数据增强方法对查询准确率有一定的提升作用。 展开更多
关键词 数据库查询 自然语言处理 sql 词嵌入
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型
8
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本结构化查询语言 自然语言查询 中文sql语句生成 预训练模型 Text-to-sql数据集
在线阅读 下载PDF
融合表字段的NL2SQL多任务学习方法
9
作者 刘洋 廖薇 徐震 《计算机应用研究》 CSCD 北大核心 2024年第9期2800-2804,共5页
现有的自然语言转SQL(NL2SQL)方法没有充分利用数据表的字段信息,而这对于问题的语义理解和SQL语句的逻辑生成有着重要作用。为了提高SQL生成的整体准确性,提出一种融合数据表字段的NL2SQL方法(FC-SQL)。首先,利用BERT预训练模型对问题... 现有的自然语言转SQL(NL2SQL)方法没有充分利用数据表的字段信息,而这对于问题的语义理解和SQL语句的逻辑生成有着重要作用。为了提高SQL生成的整体准确性,提出一种融合数据表字段的NL2SQL方法(FC-SQL)。首先,利用BERT预训练模型对问题和数据库表字段进行合并编码表示;其次,采用多任务学习的方式,结合并联和级联的方式构建多任务网络,以预测不同子任务;最后,针对条件值提取子任务,通过融合字段信息计算问题中词与表字段的相似度,并以相似度值作为权重来计算每个词语作为条件值的概率,从而提高条件值预测的准确率。在TableQA数据集上的逻辑形式准确率与SQL执行准确率分别达到88.23%和91.65%。设计消融实验验证表字段信息对于模型的影响,实验结果表明融入表字段后,条件值抽取子任务效果有所提升,进而改善了NL2SQL任务的整体准确率,相较于对比模型有更好的SQL生成效果。 展开更多
关键词 多任务学习 自然语言sql 自然语言处理 表字段
在线阅读 下载PDF
融合字段类型与文本匹配的中文问句解析
10
作者 纪相存 李大林 彭晓东 《计算机应用与软件》 北大核心 2024年第7期184-191,共8页
自然语言转SQL语句技术可以帮助用户使用数据库,而WikiSQL数据集对表格内容的保护一定程度上限制了模型的使用,基于此,提出一种融合字段类型与文本匹配的中文问句解析方法。基于SQL结构分解问句解析任务,通过字段类型相关的分隔符将表... 自然语言转SQL语句技术可以帮助用户使用数据库,而WikiSQL数据集对表格内容的保护一定程度上限制了模型的使用,基于此,提出一种融合字段类型与文本匹配的中文问句解析方法。基于SQL结构分解问句解析任务,通过字段类型相关的分隔符将表结构信息结合到RoBERTa编码器输入中,并使用结合编辑距离与语义词典的文本匹配来使模型更加鲁棒。在中文数据集TableQA进行测试,该方法取得了最好的效果,正确率达到93.44%。 展开更多
关键词 自然语言sql语句 表结构信息 sql结构 文本匹配
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部