期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于序列相似性计算的甲骨残片缀合算法 被引量:1
1
作者 张重生 王斌 《电子学报》 EI CAS CSCD 北大核心 2023年第4期860-869,共10页
甲骨残片缀合一直是甲骨学研究中最急迫最具基础性的工作,它使得甲骨残片经过拼接,复原为更加完整的原始材料.尽管前人及同行曾提出若干计算机辅助的甲骨缀合方法,但这些方法缀合准确度不足,未能真正投入使用,并不能真正帮助专家解决甲... 甲骨残片缀合一直是甲骨学研究中最急迫最具基础性的工作,它使得甲骨残片经过拼接,复原为更加完整的原始材料.尽管前人及同行曾提出若干计算机辅助的甲骨缀合方法,但这些方法缀合准确度不足,未能真正投入使用,并不能真正帮助专家解决甲骨缀合问题,导致当前的甲骨缀合工作仍旧依靠人工、依旧费时费力.为了更好地研究甲骨残片的机器缀合问题,本文使用一个较大规模甲骨缀合基准数据集OB-Rejoin,该数据集包含了约一千幅甲骨拓片图像,且融入了大量的甲骨学界已缀成果,用于算法评估.基于该数据集,本文设计了一种基于斜率变化量序列匹配的甲骨缀合算法(Slope United Sequence Matching for Oracle Bone Fragments Conjugation,SUM),该方法将甲骨残片的断边碴口图像匹配问题转化为数值型的序列数据和序列相似性比对问题,以将尚不够非常精密的计算机视觉领域的碴口图像匹配问题转换为数据科学领域较为成熟的序列数据相似性匹配问题.SUM将数值型的碴口序列数据进一步转换为斜率变化量序列和字符序列数据,最后利用字符序列的模糊匹配完成甲骨残片的碴口匹配.在实验环节,SUM算法与经典的序列相似性计算方法在精确率、召回率、漏检率方面进行了对比,并与两个较新的基于深度学习的序列匹配算法和形状匹配算法进行了性能对比.整体而言,SUM在OB-Rejoin数据集上的Top-15缀合召回率达到了95.181%,超越了对比算法.重要出土文献的精准复原本身是历史学和古文字研究中客观存在的重大现实需求,具有重要的史学价值和意义,因此,本文的研究成果,不但有助于解决甲骨残片的机器缀合问题,还对秦汉简牍和敦煌遗书等重要出土文献的精准复原具有重要的参考价值. 展开更多
关键词 甲骨文 甲骨缀合 序列相似性计算 形状匹配 边缘匹配
在线阅读 下载PDF
基于锚点的字符级甲骨图像自动标注算法研究 被引量:5
2
作者 史先进 曹爽 +3 位作者 张重生 陶月锋 吕灵灵 沈夏炯 《电子学报》 EI CAS CSCD 北大核心 2021年第10期2020-2031,共12页
甲骨文是中国最早的系统文字,是目前能见到的最早的成熟汉字.甲骨文的研究对历史探究和文化传承具有重要的意义.但是要实现字符级别的甲骨字符图像标注,在现有技术环境下,只能通过资深甲骨学专家进行人工标注,不仅耗费人力资源,而且效... 甲骨文是中国最早的系统文字,是目前能见到的最早的成熟汉字.甲骨文的研究对历史探究和文化传承具有重要的意义.但是要实现字符级别的甲骨字符图像标注,在现有技术环境下,只能通过资深甲骨学专家进行人工标注,不仅耗费人力资源,而且效率低下.针对这一问题,在前期工作中的甲骨字符图像识别模型的基础上,本文提出了一种甲骨字符图像自动标注算法.该算法通过先分列后切割的思想,先将甲骨拓片上的每一个字符图像归结到某一个特定列,再以锚点甲骨字为参考点,根据空间近邻关系找到甲骨原文中的字所对应的甲骨字符图像,从而实现了甲骨字符图像的自动标注.同时,将标注好的甲骨字符图像添加到样本数据集,并利用增广后的数据集(增加6~10倍)重新训练甲骨字符图像识别模型,有利于提高基于深度学习的甲骨文识别算法的识别准确度;以较小的成本大幅增加样本数量,也可以节约专家大量的时间和人力. 展开更多
关键词 甲骨文 图像标注 数据增广 锚点 空间近邻 模式识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部