题名 基于迁移学习及通道先验注意力机制的地质构造识别
1
作者
刘俊杰
马凯
黄泽华
田苗
邱芹军
陶留锋
谢忠
机构
湖北省水电工程 智能视觉监测重点实验室 (三峡大学)
三峡大学计算机与信息 学院
地质探测与评估教育部重点实验室 (中国地质大学(武汉))
中国地质大学(武汉)计算机学院
地理信息系统国家地方联合工程实验室 (中国地质大学(武汉))
出处
《广西师范大学学报(自然科学版)》
北大核心
2025年第2期107-120,共14页
基金
国家自然科学基金(42301492)
国家重点研发计划项目(2022YFB3904200,2022YFF0711601)
+1 种基金
湖北省自然科学基金(2022CFB640)
地质探测与评估教育部重点实验室主任基金(GLAB2023ZR01)。
文摘
针对平面地质图件中地质构造背景复杂、符号表示多样化而导致识别效果不佳的问题,本文提出一种基于迁移学习和通道先验注意力机制的地质构造识别模型MsAttenEfficientNet。该模型以EfficientNet为主干网络架构,并使用通道先验注意力(channel prior convolution attention,CPCA)模块替换EfficientNet特征提取模块MBConv中的压缩和激励网络(squeeze-and-excitation net,SENet),使模型能够动态地分配通道和空间注意力权重,更准确地捕捉到图像中的重要区域和空间结构;其次对顶层预测模块进行改进,引入Swish激活函数和Dropout层,加强模型的泛化性能;最后使用Adam优化算法提高网络的收敛速度,并利用迁移学习实现特征参数共享。通过在地质构造数据集GeoStr18上进行训练及测试,实验结果表明,MsAttenEfficientNet模型对地质构造的识别精准率为96.92%,召回率为96.89%,F 1分数为96.90%,优于ResNet50、ShuffleNetV2和DenseNet121等主流分类识别模型,可有效用于地质构造识别。
关键词
图像识别
地质构造
EfficientNet网络
通道先验注意力
迁移学习
Keywords
image recognition
geological structure
EfficientNet network
CPCA
transfer learning
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
TP391
[自动化与计算机技术—计算机应用技术]
题名 人在回路学习增强的地理命名实体识别
被引量:4
2
作者
杨盈
邱芹军
谢忠
田苗
郑诗语
郑帅
机构
深圳市规划和自然资源数据管理中心
自然资源部城市国土资源监测与仿真重点实验室
中国地质大学(武汉)计算机学院
地理信息系统国家地方联合工程实验室
三峡大学计算机与信息 学院
出处
《测绘通报》
CSCD
北大核心
2023年第8期155-160,177,共7页
基金
国家重点研发计划(2022YFB3904200,2022YFF0711601)
国家自然科学基金原创探索计划项目(42050101)
+1 种基金
湖北省自然科学基金(2022CFB640)
自然资源部城市国土资源监测与仿真重点实验室开放基金(KF-2022-07-014)。
文摘
地理命名实体识别是高质量地理知识图谱构建的重要环节,被广泛应用于地理编码、语义检索及地理知识推理等方面。主流的深度学习模型存在标注语料库耗时费力、模型可解释性差等问题。为发挥人在回路机制推动学习模型利用少量样本学习的优势,本文提出了一种人在回路学习增强的地理命名实体识别方法。即以部分标注及未标注地理语料为输入,基于BERT-BiLSTM-CRF模型进行训练并对待标注语料库进行识别,对于模型识别错误的句子提供人工干预形式对其进行纠正,并将纠正之后的句子重新输送到学习模型中进行迭代训练,最终形成标准地理命名实体数据集及人在回路强化后的抽取模型。以地理大百科全书数据为例进行模型性能评估,该方法对于多数地理命名实体识别解析准确率达90%以上,相比已有深度学习模型,该方法仅需要少量标注样本且识别效果更优,对多种地理命名实体识别类型能够保持较好性能。
关键词
地理命名实体识别
人在回路
深度学习
预训练模型
BERT-BiLSTM-CRF
Keywords
geographical named entity recognition
human-in-the-loop
deep learning
pre-trained models
BERT-BiLSTM-CRF
分类号
P208
[天文地球—地图制图学与地理信息工程]
题名 面向地质图的知识图谱构建及智能问答应用
被引量:6
3
作者
段雨希
邱芹军
田苗
马凯
谢忠
陶留锋
刘俊杰
机构
国家 地理 信息 系统 工程 技术研究中心
中国地质大学(武汉)计算机与信息 学院
地理信息系统国家地方联合工程实验室
中国地质大学(武汉)地质探测与评估教育部重点实验室
三峡大学
湖北省水电工程 智能视觉监测重点实验室
出处
《地质科学》
CAS
CSCD
北大核心
2024年第2期588-602,共15页
基金
国家自然科学基金项目(编号:42301492)
国家重点研发计划项目(编号:2022YFB3904200,2022YFF0711601)
+1 种基金
湖北省基金项目:自然科学基金项目(编号:2022CFB640)
地质探测与评估教育部重点实验室主任基金项目(编号:GLAB2023ZR01)资助。
文摘
海量地质图件蕴含着丰富的地学基础知识及专家经验知识。地质图主要表达了通过区域地质调查、矿产地质调查所获取的地球表面的地质知识(如地层单元、岩体、断裂等)。如何快速地从矢量地质图件中抽取地质知识并形成知识服务是目前地学知识图谱及知识服务研究的前沿。由于传统的地质图知识抽取主要依赖人工方式进行综合分析,本文聚焦于矢量地质图件知识表达与抽取研究,提出了一种地质图知识表达框架,提取地质图中所包含的地质实体及关系,将地质图信息以知识图谱的形式表达,并开展了基于地质矢量知识图谱的智能问答应用。最后以江西省于都县银坑幅矢量数据集为例开展实验验证分析,结果表明,本文方法能够较为全面地获取地质图中各个地质对象的信息,提高了地质图语义表达的效果,同时也可以提高地质学习人员对地质图的理解和认识,让计算机能够大规模获取地质图的知识内容。
关键词
地质图知识表达模型
地质知识图谱
地质矢量图件
智能问答
空间认知
Keywords
Geological map knowledge expression model
Geological knowledge graph
Geological vector map
Intelligent question and answer
Spatial cognition
分类号
P628.4
[天文地球—地质矿产勘探]
TP391
[自动化与计算机技术—计算机应用技术]
题名 多模态数据的地质图关联网络构建及知识服务
被引量:1
4
作者
邱芹军
段雨希
田苗
吴麒瑞
马凯
陶留锋
谢忠
机构
自然资源部城市国土资源监测与仿真重点实验室
中国地质大学(武汉)计算机与信息 学院
地理信息系统国家地方联合工程实验室
国家 地理 信息 系统 工程 技术研究中心
中国地质大学(武汉)地质探测与评估教育部重点实验室
中国地质大学(武汉)未来技术学院
湖北省水电工程 智能视觉监测重点实验室
三峡大学计算机与信息 学院
出处
《地质论评》
CAS
CSCD
北大核心
2024年第4期1469-1482,共14页
基金
国家自然科学基金资助项目(编号:42301492)
国家重点研发计划项目(编号:2022YFB3904200,2022YFF0711601)
+2 种基金
湖北省自然科学基金资助项目(编号:2022CFB640)
自然资源部城市国土资源监测与仿真重点实验室基金资助项目(编号:KF-2022-07-014)
地质探测与评估教育部重点实验室主任基金资助项目(编号:GLAB2023ZR01)的成果。
文摘
地质图件及其附属资源(如描述文本)作为地质知识的重要存储媒介,蕴含着大量的地学知识及专家经验知识及隐式知识。快速精准地对多模态地质数据进行知识规范化定义、形式化表达、语义化关联和精准化推理是目前地学知识抽取及挖掘的前沿。当前,海量的地学数据中图件及附属描述信息知识分布零散,图件中的信息无法有效地与描述信息进行关联并提供知识服务。笔者等以多模态地质数据为数据源,建立了多源数据驱动下的地质图知识表达模型,通过地质基础知识、规则知识及决策知识来表达图件中蕴含的显隐式地质知识,从语义、空间、属性3个维度表示地质对象间的关系;并基于领域知识针对地质图件及描述信息开展了地质实体及关系的精准抽取及存储研究,最后以江西省于都县银坑幅G50E011007图幅1∶50000矿产地质调查矢量数据为例进行了验证与分析,实验结果验证了笔者等所提出的知识表达模型及知识抽取方法,能够较好地解决地质知识建模中图文关联弱、知识挖掘不充分等问题。
关键词
地质知识模型
地质图件
知识图谱
决策知识
智能问答
Keywords
Geological knowledge model
Geological artefacts
Knowledge graph
Decision-making knowledge
Intelligent Q&A
分类号
P623
[天文地球—地质矿产勘探]
题名 区域地质调查文本中文命名实体识别
被引量:7
5
作者
邱芹军
田苗
马凯
谢忠
金相国
段雨希
陶留锋
机构
中国地质大学(武汉)计算机学院
中国地质大学(武汉)地理信息系统国家地方联合工程实验室
湖北省水电工程 智能视觉监测重点实验室
三峡大学计算机与信息 学院
中国地质大学(武汉)国家 地理 信息 系统 工程 技术研究中心
出处
《地质论评》
CAS
CSCD
北大核心
2023年第4期1423-1433,共11页
基金
国家重点研发计划(编号:2022YFF0711601)
国家自然科学基金资助项目(编号:42050101)
中国博士后科学基金资助项目(编号:2021M702991)的成果~。
文摘
作为我国地质调查领域最重要的数据源之一,地质调查报告中蕴含着丰富的地学知识及地质体描述等关键信息,准确高质量地抽取地质命名实体为地学知识图谱构建、知识推理及知识演化提供基础。笔者等在阐述地质命名实体识别任务基础上,分析地质实体不仅包含大量专业术语,还存在实体嵌套、大量长实体等领域特性,进一步增加了地质命名实体识别难度。笔者等提出一种基于轻量级预训练模型(ALBERT)—双向长短时记忆网络(BiLSTM)—条件随机场(CRF)模型的地质命名实体识别方法。首先利用ALBERT对输入字符上下文特征进行建模,并采用BiLSTM对其进行进一步上下文特征表征,最后采用CRF实现标注序列预测。实验结果表明,在构建的地质命名实体识别数据集上,相比于主流的命名实体识别模型算法,本文所提出的方法具有更好的抽取性能,提出的命名实体识别模型能为领域实体识别提供借鉴,同时为地学领域实体关系抽取和地学知识图谱构建提供有力方法支撑。
关键词
地质命名实体识别
轻量级预训练模型
ALBERT
知识图谱
地质报告
Keywords
Geological named entity recognition
ALBERT pre-trained models
knowledge graph
regional geological survey
分类号
P622
[天文地球—地质矿产勘探]
题名 顾及中文汉字多特征的矿产资源实体识别
被引量:3
6
作者
刘志豪
金相国
邱芹军
陶留锋
黄振
谢忠
机构
国家 地理 信息 系统 工程 技术研究中心
中国地质大学(武汉)计算机学院
自然资源部城市国土资源监测与仿真重点实验室
地理信息系统国家地方联合工程实验室
出处
《地质科学》
CAS
CSCD
北大核心
2023年第4期1535-1553,共19页
基金
国家重点研发计划项目(编号:2022YFF0711601)
湖北省自然科学基金项目(编号:2022CFB640)
+2 种基金
中国博士后科学基金项目(编号:2021M702991)
地质探测与评估教育部重点实验室主任基金项目(编号:GLAB2023ZR01)
自然资源部城市国土资源监测与仿真重点实验室开放基金课题项目(编号:KF-2022-07-014)资助。
文摘
矿产资源地质报告中蕴含大量专家经验及基础地质知识。快速准确地从海量矿产资源文本中抽取形成结构化知识已成为目前研究热点,命名实体识别是信息抽取与知识挖掘的重要步骤。针对矿产资源地质文本中存在实体长度长、专业术语多、实体嵌套等问题,已有基于深度学习的命名实体识别直接应用在矿产资源领域性能低下,本文提出了一种矿产资源命名实体识别深度学习模型:ALBERT(A Lite Bidirectional Encoder Representations from Transformers)-BiLSTM(Bi-directional Long Short-Term Memory)-CRF(Conditional Random Field),通过ALBERT预训练语言模型获取地质文本丰富语义特征,同时结合汉字拼音、字形和词边界特征来共同作为嵌入层,从而提高对复杂实体的识别能力。本文方法在人民日报、电子简历数据集及构建的矿产资源数据集上进行实验,结果表明提出方法在准确率、召回率、F1值上分别达到70.97%、64.33%、67.49%。
关键词
矿产资源报告
命名实体识别
预训练模型
多特征融合
Keywords
Mineral resources report
Named entity recognition
Pre-training model
Multi-feature fusion
分类号
P628.4
[天文地球—地质矿产勘探]
TP391
[自动化与计算机技术—计算机应用技术]