基于视觉相似性的中文古籍内容检索方法被引量：10

Content-Based Chinese Antique Books Retrieval Through Visual Similarity Criteria

在线阅读下载PDF

导出

摘要人类文化遗产的数字化应用是数字图书馆计划的重要组成部分 .目前 ,数字化手书中文古籍尚缺乏有效的内容检索手段 .提出了一种基于视觉相似性的计算机古籍内容检索方法 ,研制出关键支撑技术 .该方法提取视觉对象的形态特征、全局位置特征和页面特征 ,采用高维空间索引技术组织形态特征构成的特征空间 ,完成视觉相似对象的快速检索 ,定义精度控制参数 ,动态调整由形态到语义的映射 ,借助约束验证技术提高一组相关对象的检索精度 .原型系统证实了新方法的可行性 ,获得了直接在数字化图像上自动完成古籍内容检索的技术效果 . The application of digitized civilization legacy plays an important role in the digital library project. Due to the intrinsic handwritten nature, it lacks effective mechanisms to perform content retrieval on digitized Chinese antique books. An original method for content retrieval based on visual similarity is proposed and some key techniques are studied. By extracting morphological, positional and page features from images, the method makes up a feature space and applies spatial indexing to it. A range searching strategy is then employed to get all analogs to the query sample. In addition, a precision parameter is defined to dynamically adjust the mapping from morphological feature to semantics, and a constraint verifying technique is developed to improve the overall precision. The operational prototypical system demonstrates its feasibility and gets the effectiveness of automatic content-based retrieval directly on page images.

作者施伯乐张亮王勇陈智峰

机构地区复旦大学计算机科学与技术系

出处《软件学报》 EI CSCD 北大核心 2001年第9期1336-1342,共7页 Journal of Software

基金国家自然科学基金资助项目 (6 99330 10 ) 上海市自然科学基金资助项目 (0 0 ZD140 0 6 )~~

关键词图像检索特征提取空间索引古籍检索中文古籍计算机检索视觉相似性 Constraint theory Digital libraries Feature extraction Image processing Indexing (of information) Semantics Software prototyping

分类号 G354.49 [文化科学—情报学]

引文网络
相关文献

参考文献2

1朱岩.《四库全书》电子版问世的启迪[J].中国图书馆学报,1999,25(6):82-84. 被引量：11
2张炘中.计算机汉字识别技术[J].语文建设,1992(10):34-38. 被引量：5

共引文献14

1胡恒.从数字典藏走向数字人文:中国大陆数字史学发展浅思[J].数字人文研究,2021,1(4):38-43. 被引量：8
2陈立新.数字图书馆与古籍数字化[J].现代图书情报技术,2002(S1):56-58. 被引量：6
3冯志伟.汉字和汉语的计算机处理[J].当代语言学,2001,3(1):1-21. 被引量：23
4不识庐山真面目只缘身在此山中[J].石油化工建设,2006,28(6):1-1.
5刘成先.促进人的全面发展实现小馆藏大利用[J].滁州学院学报,2010,12(3):123-125.
6王强,马利庄.图像二值化时图像特征的保留[J].计算机辅助设计与图形学学报,2000,12(10):746-750. 被引量：65
7赵鹏飞,李铁威,马洁.前列腺癌的生物标记物——外分泌miRNAs[J].科技信息,2013(16):149-150.
8吴小君,龚捷.大数据时代古典文献出版发展新趋势[J].出版发行研究,2013(9):76-79. 被引量：7
9游战洪,叶金菊,戴吾三.论古籍善本数据库在数字图书馆工程建设中的重要地位[J].大学图书馆学报,2001,19(2):20-23. 被引量：4
10王浩军,赵南元,邓钢轶.藏文识别的预处理[J].计算机工程,2001,27(9):93-96. 被引量：20

同被引文献44

1陈淑贞.语文知识的另一章:汉字传统查检与中文现代信息[J].陕西师范大学学报（哲学社会科学版）,2009,38(S1):251-254. 被引量：1
2龚平如.统一汉文辞书检索与编排体例探究[J].辞书研究,1990(6):38-45. 被引量：1
3李公宜.“一竿子到底”的检索法——《汉字信息字典》检索法简介[J].辞书研究,1989(5):99-103. 被引量：1
4刘蕴璇.特种字典类型初探[J].内蒙古社会科学,1995,16(2):91-94. 被引量：1
5杨东华,李建中,张文平.基于数据网格环境的连接操作算法[J].计算机研究与发展,2004,41(10):1848-1855. 被引量：8
6赵春江,施文康,邓勇.具有鲁棒性的图像骨架提取方法[J].计算机应用,2005,25(6):1305-1306. 被引量：9
7章夏芬,庄越挺,鲁伟明,吴飞.根据形状相似性的书法内容检索[J].计算机辅助设计与图形学学报,2005,17(11):2565-2569. 被引量：13
8曹进军.基于PATTree的半结构化文本信息抽取范式研究[J].情报杂志,2007,26(7):55-58. 被引量：2
9Palmondon R, Srihari S N. On-line and off-line handwriting recognition :a comprehensive survey [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence ,2000,22 (1) ;63-84.
10Rath T M, Kane S, Lehman A, et al. Indexing for a digital library of George Washington's manuscripts: a study of word matching techniques[ R]. Massachusetts: Center for Intelligent Information Retrieval, Computer Science Department, University of Massachusetts ,2004.

引证文献10

1刘莉,张亮,张琪,周向东,施伯乐.相关反馈在古籍页面图像内容检索中的应用[J].计算机工程,2003,29(z1):10-12.
2章夏芬,庄越挺,鲁伟明,吴飞.根据形状相似性的书法内容检索[J].计算机辅助设计与图形学学报,2005,17(11):2565-2569. 被引量：13
3庄毅,庄越挺,吴飞.基于数据网格的书法字k近邻查询[J].软件学报,2006,17(11):2289-2301. 被引量：3
4庄毅,庄越挺,吴飞.基于混合距离树的海量书法字索引[J].计算机辅助设计与图形学学报,2007,19(2):233-239. 被引量：1
5章夏芬,庄越挺,吴江琴,吴飞.Hierarchical Approximate Matching for Retrieval of Chinese Historical Calligraphy Character[J].Journal of Computer Science & Technology,2007,22(4):633-640. 被引量：4
6杨志芹.基于信息抽取的古籍知识检索系统研究[J].情报科学,2009,27(8):1219-1221. 被引量：2
7陈颉,朱福喜.根据骨架结构相似性的书法内容分层检索[J].小型微型计算机系统,2010,31(1):138-142. 被引量：5
8张维加,俞杭杰,邹晓东,雷扬,徐静,孙秀红.书法字典检索方法及其计算机技术研究[J].语文学刊（高等教育版）,2010(7):86-91.
9Tuo Chen,Chen Zhao,Shiqin Jiang,Peter Van Leeuwen,Dietrich Grnemeyer.Noninvasively diagnosing coronary artery disease with 61-channel MCG data[J].Chinese Science Bulletin,2014,59(11):1123-1128. 被引量：3
10陈国梁,童茵,胡江.数字博物馆应用研究[J].计算机应用与软件,2004,21(5):50-52. 被引量：10

二级引证文献34

1冯健.西方学术界有关中国书法跨学科研究进展及知识图谱分析:基于现代文献学的视角[J].书法赏评,2021(1):7-14. 被引量：2
2彭隽,朱德海.农业信息系统在不同平台上性能的比较[J].农业工程学报,2006,22(9):254-256. 被引量：9
3庄毅,庄越挺,吴飞.基于混合距离树的海量书法字索引[J].计算机辅助设计与图形学学报,2007,19(2):233-239. 被引量：1
4柳伯超,秦茂玲,刘弘.一种基于分布的形状特征描述子[J].计算机技术与发展,2007,17(12):86-88.
5胡洋.黔南州民族数字化博物馆应用研究[J].黔南民族师范学院学报,2007,27(6):16-19. 被引量：2
6周勇,于雷,李荆荆,郧文聚.基于WebGIS的数字土地博物馆系统的分析与设计[J].华中师范大学学报（自然科学版）,2007,41(4):622-626. 被引量：5
7鲁伟明,吴江琴,庄越挺.计算机辅助书法牌匾设计[J].计算机辅助设计与图形学学报,2008,20(4):469-475. 被引量：5
8童茵.信息资源整合技术研究及在文博领域中的实践[J].计算机应用与软件,2009,26(1):192-194. 被引量：8
9陈燮琪.论数字图书馆系统中WEB服务器性能优化的方法[J].计算机应用与软件,2009,26(1):195-196. 被引量：1
10陈颉,朱福喜.根据骨架结构相似性的书法内容分层检索[J].小型微型计算机系统,2010,31(1):138-142. 被引量：5

1包和平.民族古籍检索的原理和方法[J].现代情报,2004,24(9):128-130. 被引量：2
2许磊,张莉萍.中文古籍检索及其数字化趋势[J].聊城大学学报（哲学社会科学版）,2002(5):121-123. 被引量：1
3费愉庆.数字环境下图书馆的古籍整理与保护[J].新世纪图书馆,2014(5):23-26. 被引量：7
4贾卫华.试论视觉传播理论在高校学报版面策划中的应用[J].济南职业学院学报,2012(4):114-116.
5杜敏.中医古籍检索途径初探[J].津图学刊,1997(2):88-93.
6郭伟玲,戴艳清.论古籍数字化的检索问题[J].图书馆理论与实践,2011(10):13-16. 被引量：10
7舒琼.浅谈古籍的保护与利用[J].图书情报论坛,2004(1):61-62. 被引量：1
8陈迹.构建传媒品牌的“532”法则[J].暨南学报（哲学社会科学版）,2007,29(4):145-148. 被引量：2
9李明,李卉.1+1的创造性[J].中国发明与专利,2007(2):54-55. 被引量：1
10傅春春.浅议利用科技档案提高经济效益[J].才智,2008,0(10):260-260.

软件学报

2001年第9期

浏览历史

内容加载中请稍等...

基于视觉相似性的中文古籍内容检索方法被引量：10

参考文献2

共引文献14

同被引文献44

引证文献10

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于视觉相似性的中文古籍内容检索方法 被引量：10

参考文献2

共引文献14

同被引文献44

引证文献10

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于视觉相似性的中文古籍内容检索方法被引量：10