-
题名基于多阶门控聚合网络的光学化学结构识别
- 1
-
-
作者
林帆
李建华
-
机构
华东理工大学信息科学与工程学院
-
出处
《计算机工程》
北大核心
2025年第8期364-372,共9页
-
基金
国家科技重大专项(2018ZX09735002)。
-
文摘
在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而影响识别效率。针对这些限制,将多阶门控聚合网络(MogaNet)和引入相对位置编码的Transformer构成的编码解码架构用于OCSR领域,提出一种基于多阶门控聚合网络的光学化学结构识别模型。该模型首先在图像特征提取时通过MogaNet空间聚合模块,捕获多尺度特征并减少特征冗余,并且通过MogaNet通道聚合模块改善通道维度的多样性;其次在序列解码时采用引入相对位置编码的Transformer作为解码器,精准捕捉序列单词之间的相对位置关系。为了训练和验证该模型,构建一个包含40万个分子的化学结构数据集,其中包含Markush结构与非Markush结构。实验结果表明,该模型的准确率达到了92.36%,优于其他现有的模型。
-
关键词
光学化学结构识别
编码解码架构
深度学习
SMILES表达式
多阶门控聚合网络
-
Keywords
Optical Chemical Structure Recognition(OCSR)
encoder-decoder architecture
deep learning
SMILES notation
Multi-order gated aggregation Network(MogaNet)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-