-
题名面向化学结构的线段聚类算法
- 1
-
-
作者
朱哲清
耿海军
钱宇华
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西大学大数据科学与产业研究院
-
出处
《计算机科学》
CSCD
北大核心
2022年第5期113-119,共7页
-
基金
国家自然科学基金(61672332)
山西省重点研发计划(201903D421003)
+2 种基金
山西省教育厅科技成果转化培育项目(2020CG001)
山西省应用基础研究计划(20210302123444)
中国高校产学研创新基金(2021FNA02009)。
-
文摘
化学键识别是化学结构识别任务的重要组成部分。化学键中的单键、双键和三键都是由线段组成的,采用霍夫变换进行线段检测时容易产生冗余数据和干扰数据。为此,提出了一种面向化学键的线段聚类算法,对霍夫变换检出的线段进行聚类,进而合并冗余线段。具体而言,基于线段间空间关系的分析,定义线段间的相对相似性与间隔相似性度量;利用这两种度量,进行基于线段合并的聚类方法。实验结果表明,所提出的相似性度量可以全面地刻画线段间的相似关系;该算法能获得较好的聚类结果,同时能够准确复原化学键组成线段的真实位置,是一种有效的化学结构图像预处理方法。
-
关键词
化学结构式识别
HOUGH变换
化学键
线段聚类
-
Keywords
Chemical structure recognition
Hough transform
Chemical bond
Clustering of line segments
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-