LDA单词图像表示的蒙古文古籍图像关键词检索方法被引量：7

LDA-Based Word Image Representation for Keyword Spotting on Historical Mongolian Documents

在线阅读下载PDF

导出

摘要 [目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论 ]同时,该方法的性能比Bo VW方法有显著提高。 [Objective]In order to overcome the problem of ignoring the spatial relations and semantic information between visual words in traditional visual word bag(Bag-of-Visual-Words).[Methods]In this paper,a LDA-based topic model was adopted which was linearly combined with a visual language model for each word image.And the basic query likelihood model was used for realizing the procedure of retrieval.[Results]The experimental results on our dataset showed that the proposed LDA-based representation approach could effi ciently and accurately attain to the aim of keyword spotting on a collection of historical Mongolian documents.[Conclusions]Meanwhile,the proposed approach improved the performance signifi cantly than the original BoVW approach.

作者白淑霞鲍玉来 Bai Shuxia;Bao Yulai(Library,Inner Mongolia University,Hohhot 010021,China)

机构地区内蒙古大学图书馆

出处《现代情报》 CSSCI 北大核心 2017年第7期51-54,88,共5页 Journal of Modern Information

基金国家自然科学基金项目"基于领域本体的蒙古文数字资源整合机制研究"(项目编号:71163029)

关键词隐含狄利克雷分配(LDA) 主题模型视觉语言模型蒙古文古籍关键词检索查询似然模型 latent dirichlet allocation (LDA) topic model visual language model historical Mongolian documents keyword spotting query likelihood model

分类号 TP393 [自动化与计算机技术—计算机应用技术]

作者简介白淑霞（1982-），女，馆员，研究方向：信息检索，蒙古文信息检索。;通讯作者：鲍玉来（1975-），男，副研究馆员，研究方向：蒙古文信息检索。

引文网络
相关文献

同被引文献154

1焦艳鹏,刘葳.知识获取、人工智能与图书馆精神[J].中国图书馆学报,2021,47(5):20-32. 被引量：17
2张力元,王军.古籍数据库分面分类体系设计研究[J].图书馆建设,2021(3):56-61. 被引量：17
3聂锦燃,魏蛟龙,唐祖平.基于变分自编码器的无监督文本风格转换[J].中文信息学报,2020(7):79-88. 被引量：4
4俞敬松,魏一,张永伟,杨浩.基于非参数贝叶斯模型和深度学习的古文分词研究[J].中文信息学报,2020(6):1-8. 被引量：19
5程宁,李斌,葛四嘉,郝星月,冯敏萱.基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究[J].中文信息学报,2020(4):1-9. 被引量：25
6李敏.《中国图书馆分类法》组织民族古籍的可行性、局限及其改造[J].图书馆建设,2009(7):16-18. 被引量：5
7何琳,曹玲.农业古籍本体的构建及其检索机制研究[J].现代图书情报技术,2006(12):37-39. 被引量：14
8常娥,侯汉清,曹玲.古籍自动校勘的研究和实现[J].中文信息学报,2007,21(2):83-88. 被引量：17
9常娥,侯汉清.农业古籍自动编纂的设计和研究[J].南京农业大学学报（社会科学版）,2007,7(1):99-104. 被引量：9
10陈天莹,陈蓉,潘璐璐,李红军,于中华.基于前后文n-gram模型的古汉语句子切分[J].计算机工程,2007,33(3):192-193. 被引量：28

引证文献7

1李建平.手法治疗骶髂关节错缝52例[J].按摩与导引,2000,16(3):52-53.
2李静静,木特力甫·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于层级匹配的维吾尔文关键词文档图像检索[J].计算机工程与设计,2020,41(4):1062-1069. 被引量：4
3徐学斌,阿里木江·阿布迪日依木,朱亚俐,阿力木江·艾沙,库尔班·吾布力.基于空间关系的维吾尔文图像关键词检索[J].计算机工程与设计,2021,42(2):497-503.
4白曙光,林民,李艳玲,张树钧.文本关键词抽取方法及在几种民族语言上的应用[J].内蒙古师范大学学报（自然科学版）,2021,50(2):134-144. 被引量：1
5刘忠宝,赵文娟.古籍信息处理回顾与展望[J].大学图书馆学报,2021,39(6):38-47. 被引量：12
6宋志平,朱亚俐,吾尔尼沙·买买提,徐学斌,库尔班·吾布力.基于层次匹配的维吾尔文关键词图像检索[J].计算机工程与设计,2022,43(12):3461-3467. 被引量：1
7武帅,杨秀璋,何琳,公佐权.基于SWPF2vec和DJ-TextRCNN的古籍文本主题分类研究[J].情报学报,2024,43(5):601-615. 被引量：1

二级引证文献19

1李建平.手法治疗骶髂关节错缝52例[J].按摩与导引,2000,16(3):52-53.
2白曙光,林民,李艳玲,张树钧.文本关键词抽取方法及在几种民族语言上的应用[J].内蒙古师范大学学报（自然科学版）,2021,50(2):134-144. 被引量：1
3宋志平,朱亚俐,徐学斌,吾尔尼沙·买买提,库尔班·吾布力.基于灰度直方图与改进Hu不变矩的维吾尔文关键词图像二次检索[J].新疆大学学报（自然科学版）（中英文）,2022,39(3):323-330. 被引量：4
4许莉.基于用户需求视角的古籍数字资源获取路径研究[J].图书馆,2022(9):61-67. 被引量：13
5孔令云,陈进东.全国电子电器行业质量安全现状与对策建议[J].系统科学与数学,2022,42(10):2602-2615. 被引量：2
6宋志平,朱亚俐,吾尔尼沙·买买提,徐学斌,库尔班·吾布力.基于层次匹配的维吾尔文关键词图像检索[J].计算机工程与设计,2022,43(12):3461-3467. 被引量：1
7王厅.《关于推进新时代古籍工作的意见》的解读与思考[J].办公室业务,2022(23):102-104. 被引量：1
8李文林,杨丽丽,杨斓.地方性知识传承视阈下江苏古医籍文献整理研究的思路探讨[J].新世纪图书馆,2022(12):35-40.
9王厅.基于中华民族共同体意识的广西古籍档案工作建议[J].文化产业,2023(3):13-15. 被引量：1
10孙燕,刘浏,王东波.《春秋左传正义》引书计算人文研究[J].图书情报工作,2023,67(2):119-130. 被引量：10

1魏宏喜,高光来.基于Word Spotting技术的蒙古文古籍图像检索中的特征选择[J].计算机应用,2011,31(11):3038-3041. 被引量：2
2朱寒婷,尹敏,贺樑.基于首播前搜索数据的电视剧流行度预测[J].计算机工程,2017,34(7):1-8. 被引量：3
3余琨,伍孝金.区域相关融合纹理特征FDPC图书馆文档图像检索[J].西南师范大学学报（自然科学版）,2017,42(7):91-98. 被引量：4
4毕晓君,潘铁文.基于教与学优化算法的相关反馈图像检索[J].电子学报,2017,45(7):1668-1676. 被引量：4
5张开兴,杭晟煜,赵秀艳,王金星,宋正河,刘贤喜.面向设计重用的三维CAD模型局部结构检索方法[J].农业机械学报,2017,48(7):405-412. 被引量：6
6郑江龙,陈锦秀.基于混合树结构神经网络的隐式篇章关系识别[J].厦门大学学报（自然科学版）,2017,56(4):576-583.

现代情报

2017年第7期

浏览历史

内容加载中请稍等...

LDA单词图像表示的蒙古文古籍图像关键词检索方法被引量：7

同被引文献154

引证文献7

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

LDA单词图像表示的蒙古文古籍图像关键词检索方法 被引量：7

同被引文献154

引证文献7

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

LDA单词图像表示的蒙古文古籍图像关键词检索方法被引量：7