-
题名知识迁移驱动的跨油田存储分类模型
- 1
-
-
作者
贡玉军
-
机构
黔南民族职业技术学院大数据与电子商务系
-
出处
《无线电通信技术》
北大核心
2025年第3期447-453,共7页
-
基金
国家自然科学基金(62272066)。
-
文摘
油气数据中的知识对于储层自动分类至关重要,合理管理并利用油气数据可以帮助石油公司做出最佳决策,从而大大降低成本。现有方法主要集中在单个地质区块进行储层分类,但在新的区块中效果不佳。如何跨地质油田传递地底特征,并准确进行储层分类是一个非常重要且具有挑战性的问题。提出了知识迁移驱动的跨油田存储(Knowledge Transfer-driven Cross-oilfield Storage,KTCS)分类模型,包含一个多尺度传感器提取(Multi-scale Sensor Extraction,MSE)模块,用于从多变量测井曲线中提取地质特征的多尺度特征表示。设计了特定特征学习(Specific Feature Learning,SFL)模块,充分利用不同油田的特定信息,使用知识注意力迁移(Knowledge Attention Transfer,KAT)模块学习不变的特征表示,将源油田的地质知识迁移到目标油田。通过对现实世界的工业数据集进行大量的实验来评估所提KTCS模型的性能,与非迁移方法相比,KTCS模型的F1分数至少提高了15.7%。
-
关键词
储层分类
知识迁移
多尺度传感器
地质知识
工业数据集
-
Keywords
reservoir classification
knowledge transfer
multi-scale sensor
geological knowledge
industrial datasets
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向工业生产的中文Text-to-SQL模型
被引量:3
- 2
-
-
作者
吕剑清
王先兵
陈刚
张华
王明刚
-
机构
空天信息安全与可信计算教育部重点实验室(武汉大学)
武汉大学计算机学院
遵义铝业股份有限公司
-
出处
《计算机应用》
CSCD
北大核心
2022年第10期2996-3002,共7页
-
基金
国家自然科学基金资助项目(51977155)。
-
文摘
英文自然语言查询转SQL语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模型精确匹配率变低。针对迁移过程中出现的问题,提出了对应的解决方法并构建修改后的模型。首先,在数据使用过程中融入工厂元数据信息以解决表示形式不一致以及列名隐含在语义中的问题;然后,根据中文语言表达方式的特性,使用基于相对位置的自注意力模型直接通过问句以及数据库模式信息识别出where子句的value值;最后,根据工业问句查询内容的特性,使用微调后的基于变换器的双向编码器表示技术(BERT)对问句进行分类以提高模型对SQL语句结构预测的准确率。构建了一个基于铝冶炼行业的工业数据集,并在该数据集上进行实验验证。结果表明所提模型在工业测试集上的精确匹配率为74.2%,对比英文数据集Spider上各阶段主流模型的效果后可以看出,所提模型能有效处理中文工业Text-to-SQL任务。
-
关键词
中文Text-to-SQL任务
工业数据集
元数据
自注意力模型
基于变换器的双向编码器表示技术
-
Keywords
Chinese Text-to-SQL task
industrial dataset
metadata
self-attention model
Bidirectional Encoder Representation from Transformers(BERT)
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-