期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
引入源端信息的IPC和CLC类目自动映射研究
1
作者 钟易佳 李茂西 +2 位作者 王倩 黄琪 何彦青 《中文信息学报》 北大核心 2025年第3期159-168,共10页
国际专利分类法(International Patent Classification,IPC)是专利文献分类和检索的国际标准;中国图书馆分类法(Chinese library classification,CLC)是我国图书期刊的大型综合性分类法。自动准确地建立IPC类目和CLC类目之间的映射对实... 国际专利分类法(International Patent Classification,IPC)是专利文献分类和检索的国际标准;中国图书馆分类法(Chinese library classification,CLC)是我国图书期刊的大型综合性分类法。自动准确地建立IPC类目和CLC类目之间的映射对实现专利文献和图书期刊文献的跨库检索和交叉浏览有着重要的意义。针对当前研究中仅使用IPC中文译本类目描述文本来建立其与CLC类目之间的映射,完全忽略IPC原版英语类目描述文本信息的不足,该文提出了一种基于神经网络的IPC和CLC类目自动映射方法,通过引入源端信息(英语端信息)实现自动映射。首先分别通过预训练语言模型BERT和XLM-R生成IPC类目描述文本和CLC类目描述文本的词表征;然后利用多头注意力机制融合IPC类目的BERT模型词表征和XLM-R模型词表征,以及CLC类目的BERT模型词表征和XLM-R模型词表征,最后使用两个前馈神经网络层建立IPC类目和CLC类目之间的映射。在公开数据集上的实验结果表明,该文提出的方法显著优于当前最优方法,且其性能更稳定、泛化性更强。 展开更多
关键词 国际专利分类法 中国图书馆分类法 BERT XLM-R 多头注意力机制
在线阅读 下载PDF
基于预训练语言模型的IPC与高相似CLC类目自动映射
2
作者 黄敏 魏嘉琴 李茂西 《中文信息学报》 北大核心 2025年第2期153-161,共9页
专利和图书期刊是产业界与学术界的科技创新信息来源,专利通常采用国际专利分类法(International Patent Classification,IPC)标识,而中文图书期刊则采用中国图书馆分类法(Chinese Library Classification,CLC),不同的分类标识体系给专... 专利和图书期刊是产业界与学术界的科技创新信息来源,专利通常采用国际专利分类法(International Patent Classification,IPC)标识,而中文图书期刊则采用中国图书馆分类法(Chinese Library Classification,CLC),不同的分类标识体系给专利、图书期刊信息整合共享和跨库检索浏览带来了挑战。针对IPC类目和高相似的CLC类目难以准确映射的问题,对于计算资源受限的场景,该文提出结合预训练语言模型BERT和文本蕴含模型ESIM的IPC与CLC类目自动映射方法;对于计算资源充足的场景,该文提出了基于大语言模型ChatGLM2-6B的IPC与CLC类目自动映射方法。在公开的IPC与CLC类目映射数据集和在其基础上构建的IPC类目与高相似的CLC类目映射数据集上的实验结果表明,该文所提出的两种方法均统计显著地优于对比的基线方法,包括当前最先进的Sia-BERT等基于深度神经网络的科技文献类目自动映射方法。消融实验和详细的映射实例分析进一步揭示了该文所提方法的有效性。 展开更多
关键词 国际专利分类法 中国图书馆分类法 预训练语言模型 大语言模型 类目映射
在线阅读 下载PDF
探索信息资源管理的跨学科性:基于多标签分类的分析 被引量:1
3
作者 刘清民 王芳 《情报学报》 北大核心 2025年第1期75-92,共18页
当代社会面临着复杂、多元且相互关联的问题,传统学科的单一视角难以全面解决。跨学科研究通过整合多学科的知识、理论、方法和技术,为解决复杂问题提供了新的路径。为揭示信息资源管理研究的跨学科趋势和特点,本文以中图分类号为学科... 当代社会面临着复杂、多元且相互关联的问题,传统学科的单一视角难以全面解决。跨学科研究通过整合多学科的知识、理论、方法和技术,为解决复杂问题提供了新的路径。为揭示信息资源管理研究的跨学科趋势和特点,本文以中图分类号为学科分类依据,针对文献作者自标注存在的中图分类号不准确的问题,采用大语言模型进行数据增强优化,并基于BERT-CNN算法对中图分类号进行修正,对信息资源管理领域的文献进行系统分析。在跨学科多样性方面,构建了包容性与渗透性两个新指标,衡量学科间的知识吸纳能力与扩散影响力。利用中图分类号对高频持续性交叉研究主题和递增新兴热点主题进行挖掘分析,揭示了健康信息学、数字人文等新兴领域的快速发展以及学科间的持续交叉研究。研究结果表明,信息资源管理领域呈现丰富多元的学科格局,各学科之间联系紧密、相互影响,其发展是多学科交叉融合的结果。跨学科研究在信息资源管理领域发挥着重要作用并且呈现增长趋势,指导性二级学科的设置在理论基础、实践应用和跨学科合作方面都体现了一定的合理性和有效性。 展开更多
关键词 多标签分类 跨学科 信息资源管理 中图分类号
在线阅读 下载PDF
基于词汇相似度的IPC与CLC映射 被引量:11
4
作者 周林志 齐建东 +1 位作者 王建新 朱礼军 《计算机工程》 CAS CSCD 北大核心 2010年第23期274-276,279,共4页
专利作为一种具有特殊性质的文献,包含先进的技术方案,但存在管理困难、相对孤立、使用率低等弊端。针对该问题,定义分类法类目的概念模型,通过计算类目之间的概念相似度,为国际专利分类法与中国图书分类法建立类目映射。在计算类目相... 专利作为一种具有特殊性质的文献,包含先进的技术方案,但存在管理困难、相对孤立、使用率低等弊端。针对该问题,定义分类法类目的概念模型,通过计算类目之间的概念相似度,为国际专利分类法与中国图书分类法建立类目映射。在计算类目相似度中引入与类目相关的词汇语义相似度计算,综合考虑类目的上下文环境对类目间关系的影响,降低专利数据的孤立性,实现专利数据与其他期刊数据的交互操作。实验表明,该方法能有效提高类目间相似度计算的准确率。 展开更多
关键词 分类法映射 国际专利分类法 中国图书分类法 词汇相似度
在线阅读 下载PDF
基于大模型微调的生成式文献层次分类标引
5
作者 胡忠义 税典程 吴江 《情报学报》 北大核心 2025年第4期425-437,共13页
对文献进行自动的分类标引,有利于实现文献的分类存储、排列和检索。已有研究通常采用判别式模型对文献的浅层类别进行自动识别,而在深层次类别划分和准确性方面能力不足。鉴于此,本研究将文献的层次分类问题转换为文献层次类别标签的... 对文献进行自动的分类标引,有利于实现文献的分类存储、排列和检索。已有研究通常采用判别式模型对文献的浅层类别进行自动识别,而在深层次类别划分和准确性方面能力不足。鉴于此,本研究将文献的层次分类问题转换为文献层次类别标签的生成任务,并构建了基于大模型微调的生成式文献层次分类标引框架。首先,该框架采用自然语言的形式对文献的层次分类号进行标签解释;其次,采用高效微调技术对开源大语言模型进行有监督微调;最后,采用微调后的大模型直接生成文献的多层分类标签,通过标签映射得到文献的中图分类号。在经济、医药卫生和工业技术三类学科数据上进行实验检验,结果表明,有监督微调能够有效提升通用大语言模型在文献层次分类标引任务上的理解与推理能力,也取得了比传统判别式模型更好的分类性能;整合文献的摘要、题名和关键词,可以有效提升微调大语言模型的分类性能;通过对比不同参数规模的Baichuan2和Qwen1.5大模型,发现微调后的Qwen1.5-14B Chat模型表现最佳,其在一级类目上能够达到98%的分类性能,在最具挑战性的五级类目上也达到了80%的准确性;典型样例分析展示了微调后的Qwen1.5-14B-Chat具备一定的纠错能力。 展开更多
关键词 大语言模型 文献分类标引 层次分类 《中国图书馆分类法》
在线阅读 下载PDF
基于标引经验和机器学习相结合的多层自动分类 被引量:20
6
作者 何琳 侯汉清 +1 位作者 白振田 张雪英 《情报学报》 CSSCI 北大核心 2006年第6期725-729,共5页
由于《中国图书馆分类法》类目数目庞大且各类目上文献分布不均衡,导致基于机器统计学习的自动分类技术在这种多层分类体系上力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引... 由于《中国图书馆分类法》类目数目庞大且各类目上文献分布不均衡,导致基于机器统计学习的自动分类技术在这种多层分类体系上力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词申对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过将两种分类技术相结合的方法对信息资源进行分类,提出了用相关度来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。 展开更多
关键词 中国图书馆分类法 分类矩阵 自动分类 自动标引 语料库
在线阅读 下载PDF
文献分类法自动映射系统的构建——以《中国图书馆分类法》与《杜威十进分类法》为例 被引量:21
7
作者 戴剑波 侯汉清 《情报学报》 CSSCI 北大核心 2006年第5期594-599,共6页
实现文献分类法之间的互操作是信息组织和检索的迫切需要。目前在国内外大多数分类法之间互操作研究项目中,基本上是采用人工判断的方法来建立类目映射关系。笔者认为,《中国图书馆分类法》(CLC)和《杜威十进分类法}(DDC)的类目... 实现文献分类法之间的互操作是信息组织和检索的迫切需要。目前在国内外大多数分类法之间互操作研究项目中,基本上是采用人工判断的方法来建立类目映射关系。笔者认为,《中国图书馆分类法》(CLC)和《杜威十进分类法}(DDC)的类目表达的整体概念可以分解成多个概念因素,整体相似可以建立在部分相似的基础上,可通过计算类目概念因素的相似度得到类目整体概念之间的相似度。在CLC与DDC自动映射系统中,类目表达的概念可以分解成类名词、注释词、下位词、上位词,根据相似值最大原则对概念因素进行配对,通过配对概念的加权,实现类目之间相似度的自动计算。根据类目相似值、类目对应概念因素(即对应词)的差额、相等概念因素(即等价词)的类别3个参数制订了详细的类目映射规则。本文还介绍了CLC与DDC自动映射系统的结构、功能和使用。 展开更多
关键词 图书分类法 互操作 自动映射系统 中国图书馆分类法 杜威十进分类法
在线阅读 下载PDF
基于多特征的个性化图书推荐算法 被引量:26
8
作者 李克潮 梁正友 《计算机工程》 CAS CSCD 2012年第11期34-37,共4页
现有推荐算法计算读者之间或图书之间的相似性不准确、推荐精确度不高。为此,提出一种基于多特征的个性化图书推荐算法。根据中图分类法及图书的特征向量计算图书的相似性,依据读者的特征向量及借阅记录计算读者的相似性。在此基础上产... 现有推荐算法计算读者之间或图书之间的相似性不准确、推荐精确度不高。为此,提出一种基于多特征的个性化图书推荐算法。根据中图分类法及图书的特征向量计算图书的相似性,依据读者的特征向量及借阅记录计算读者的相似性。在此基础上产生2种预测结果并对其进行加权,产生最终推荐。实验结果表明,该算法具有较高的图书推荐精确度。 展开更多
关键词 中图分类法 图书特征向量 读者特征向量 相似性 推荐算法 中图分类树 专业分类树
在线阅读 下载PDF
WaveWatch Ⅲ和SWAN模型嵌套技术在业务化海浪预报系统中的应用及检验 被引量:17
9
作者 徐丽丽 肖文军 +4 位作者 石少华 堵盘军 郑晓琴 张婕 何佩东 《海洋通报》 CAS CSCD 北大核心 2015年第3期283-294,共12页
根据钓鱼岛海域海监巡航执法保障预报、重点海洋安全保障目标精细化预报等海浪业务化预报工作的新需求,基于WRF海面风场预报模型,利用结构网格海浪模型Wave WatchⅢ和非结构网格海浪模型SWAN(Simulating Waves Nearshore)的嵌套计算,建... 根据钓鱼岛海域海监巡航执法保障预报、重点海洋安全保障目标精细化预报等海浪业务化预报工作的新需求,基于WRF海面风场预报模型,利用结构网格海浪模型Wave WatchⅢ和非结构网格海浪模型SWAN(Simulating Waves Nearshore)的嵌套计算,建立一套适用于东海区和上海近海的海浪数值预报系统。通过不同数值实验,证明此系统的稳定性和时效性。利用观测数据对连续2个月的有效波高值的预报结果进行检验,结果表明:24小时预报平均绝对误差在0.3 m以下;48小时预报平均绝对误差在0.5 m以下;72小时预报平均绝对误差在0.7 m以下,且误差极值主要是由台风过程引起,但预报趋势仍值得参考。对2次台风过程采用不同风场源数据进行对比试验,结果显示采用实况路径的后报风场,海浪预报精度明显改善。对于近岸区域采用嵌套计算的SWAN模型预报结果比Wave Watch III模型预报结果精度显著提高,证明建立的海浪数值预报系统在满足"稳定性"和"时效性"的基础上,各尺度和分辨率的预报产品"准确性"也能得到保证。 展开更多
关键词 WAVEWATCH SWAN 嵌套计算 业务化预报系统 数值模拟
在线阅读 下载PDF
基于中图分类法的用户兴趣模型研究 被引量:9
10
作者 邵志峰 李荣陆 胡运发 《计算机应用与软件》 CSCD 北大核心 2007年第8期85-86,108,共3页
提出一种基于中图分类法的用户兴趣模型,形式化地描述了用户兴趣模型的建立和学习过程。在建立用户兴趣模型时,需要对代表用户兴趣的中图分类号进行挖掘,由于传统的Apriori数据挖掘算法更适合于处理无序的集合,而中图分类号中的号码是... 提出一种基于中图分类法的用户兴趣模型,形式化地描述了用户兴趣模型的建立和学习过程。在建立用户兴趣模型时,需要对代表用户兴趣的中图分类号进行挖掘,由于传统的Apriori数据挖掘算法更适合于处理无序的集合,而中图分类号中的号码是有序的。提出了一种改进的算法来自动构建用户兴趣模型,并据此开发了一个科技文献过滤系统作为典型应用。 展开更多
关键词 信息过滤 数据挖掘 用户兴趣模型 中图分类法
在线阅读 下载PDF
从合作博弈视角看数字信息组织环境下《中图法》之走向 被引量:2
11
作者 姜世香 张明伟 曲章义 《现代情报》 CSSCI 2012年第12期22-24,共3页
本文探讨了数字信息组织与《中图法》之间的合作博弈关系,并提出了数字信息组织对《中图法》修订的要求及合作博弈模式下《中图法》修订和改进的具体措施。
关键词 《中图法》 修订 数字信息组织 合作博弈
在线阅读 下载PDF
基于语料和基于标引经验的自动分类模式比较 被引量:10
12
作者 薛春香 夏祖奇 侯汉清 《南京农业大学学报(社会科学版)》 2005年第4期85-92,共8页
从原理、系统设计、知识库构建、分类算法、性能等方面对自动分类的两种模式———基于训练语料和基于人工标引经验———进行介绍和比较,这两种分类模式都具有一定的可行性。基于训练语料的自动分类模式完全依靠机器学习从训练集中发... 从原理、系统设计、知识库构建、分类算法、性能等方面对自动分类的两种模式———基于训练语料和基于人工标引经验———进行介绍和比较,这两种分类模式都具有一定的可行性。基于训练语料的自动分类模式完全依靠机器学习从训练集中发现类目的特征,数学论证充分,易于维护,比较适合于面向行业和主题的粗分类,但是过分强调了机器学习的效能,忽略了人工智力劳动成果的利用,训练过程和分类过程运算量,算法复杂;而基于标引经验的自动分类模式利用简单的统计学方法从书目数据库中挖掘人工标引经验,适用于面向体系分类法的详细分类,分类算法简单,运算量小,但过分依赖经验,缺乏有说服力的数学证明。知识库的完备性和合理性是影响两者分类效能的主要因素,是两者面临的共同问题。 展开更多
关键词 自动分类 自动标引 语料库 知识库 《中国图书馆分类法》
在线阅读 下载PDF
借鉴搜索引擎分类体系对《中图法》旅游学科类目进行改造 被引量:5
13
作者 吴钢 易芳 《现代情报》 2004年第7期175-176,共2页
本文分析了《中图法》 (第四版 )旅游学科的相关类目设置中存在的问题 ,对旅游学在网上的分类体系做出分析和研究 ,就旅游学在《中图法》中的位置作了探讨 。
关键词 旅游学 类目设置 搜索引擎 《中图法》
在线阅读 下载PDF
《中国图书馆分类法》(第5版)的特殊仿分及其分类方法研究 被引量:3
14
作者 宋晓丹 李雪垠 李晋瑞 《国家图书馆学刊》 CSSCI 北大核心 2014年第4期75-79,共5页
《中国图书馆分类法》(第5版)中个别类目的仿分规定了仿分组号时采用特殊的取号方法,即特殊仿分。其设置特殊仿分规则的原因是:避免类目扩充造成号码冲突,适应被仿分类目的特殊编号方式,使类目仿分符合逻辑性要求。实际分类工作中,工作... 《中国图书馆分类法》(第5版)中个别类目的仿分规定了仿分组号时采用特殊的取号方法,即特殊仿分。其设置特殊仿分规则的原因是:避免类目扩充造成号码冲突,适应被仿分类目的特殊编号方式,使类目仿分符合逻辑性要求。实际分类工作中,工作人员需要根据不同类型的特殊仿分规则,如:具体类目仿"一般性问题"分、被仿分类目采用特殊编号方法仿分、复分依据转换仿分、越级仿分等,选择不同的分类标引方法。图1。表6。参考文献4。 展开更多
关键词 中国图书馆分类法 特殊仿分 文献分类 文献标引
在线阅读 下载PDF
《中图法》第4版图书馆学与情报学类目设置浅议 被引量:10
15
作者 覃华兵 《大学图书馆学报》 CSSCI 北大核心 2005年第2期68-70,19,共4页
《中图法》第4版图书馆学与情报学类目设置在实际分类标引工作中有不太适用的情况,主要是类目设置陈旧过时、类目划分过细、类目设置交叉重复太多。根据学科发展现状与趋势,设想将两类类目整合,并提出整合的思路。
关键词 《中图法》 类目设置 图书馆学 情报学 第4版 分类标引工作 类目划分 发展现状
在线阅读 下载PDF
《中图法》四版使用心得 被引量:6
16
作者 毛凌文 《图书馆论坛》 CSSCI 北大核心 2001年第2期77-78,共2页
简述了使用《中图法》
关键词 《中图法》 图书分类 第四版 体系完善 体系结构 类目设置
在线阅读 下载PDF
基于中图分类号的图书情报学期刊发文现状分析 被引量:6
17
作者 魏瑞斌 田大芳 武夷山 《现代情报》 CSSCI 2014年第3期93-103,共11页
分类号是反映学术论文研究内容的重要途径之一。根据中图分类号,对CSSCI收录的14种图书情报学学术期刊发文进行了统计分析,并利用期刊——分类号网络研究了期刊与分类号之间的关系。研究发现,14种图书情报学期刊的发文内容有非常强的稳... 分类号是反映学术论文研究内容的重要途径之一。根据中图分类号,对CSSCI收录的14种图书情报学学术期刊发文进行了统计分析,并利用期刊——分类号网络研究了期刊与分类号之间的关系。研究发现,14种图书情报学期刊的发文内容有非常强的稳定性;同时,分类号位次的变化又反映了期刊发文的动态性。 展开更多
关键词 中图分类号 学术期刊 图书情报学 期刊——分类号网络
在线阅读 下载PDF
文本自动分类技术及其对图书馆学的影响 被引量:4
18
作者 蔡代纯 谭新良 《现代情报》 北大核心 2006年第9期13-14,共2页
在迅速发展的网络技术的影响下,图书馆学进一步偏重信息技术。文章通过对文本自动分类技术的分析,指出自动分类技术不但不能替代图书馆分类对纸质图书进行分类,而且自动分类技术的发展需要图书学家提供支持。
关键词 图书馆学 自动分类 中文分词 特征提取 分类算法
在线阅读 下载PDF
基于OWL方法的分类法本体语义描述探索 被引量:7
19
作者 白华 《情报杂志》 CSSCI 北大核心 2012年第2期124-129,共6页
中文分类法实现本体化的关键是实现本体建构和本体描述,以《中图法》为例,以OWL语言为工具,探讨了如何建构分类本体并描述分类本体中的复杂关系,针对《中图法》的设类情况,提出了一个本体框架,以此框架为依据详细分析了描述中的各种方... 中文分类法实现本体化的关键是实现本体建构和本体描述,以《中图法》为例,以OWL语言为工具,探讨了如何建构分类本体并描述分类本体中的复杂关系,针对《中图法》的设类情况,提出了一个本体框架,以此框架为依据详细分析了描述中的各种方法问题。 展开更多
关键词 分类法 分类本体 OWL 语义描述 《中国图书馆图书分类法》
在线阅读 下载PDF
融合实用性与科学性的互联网信息分类体系构建 被引量:8
20
作者 路永和 彭燕虹 《图书与情报》 CSSCI 北大核心 2015年第3期118-124,144,共8页
分类体系是信息组织的有效形式,传统文献分类体系难以适用分类对象的转变,实用性不足,已有的网络分类体系则缺乏科学性。构建融合实用性与科学性的互联网信息分类体系,能够有效满足用户信息需求,且是自动文本分类技术研究的基础。文章... 分类体系是信息组织的有效形式,传统文献分类体系难以适用分类对象的转变,实用性不足,已有的网络分类体系则缺乏科学性。构建融合实用性与科学性的互联网信息分类体系,能够有效满足用户信息需求,且是自动文本分类技术研究的基础。文章分别以中图法、新浪门户为例,研究传统文献分类法与网络信息分类法的优缺点,提出互联网信息分类体系的实用性、科学性以及均衡性设计原则,基于三个设计原则构建了互联网信息分类体系。为了验证所构建的分类体系的有效性,通过网络爬虫抓取网易门户以及腾讯网的语料作为实验数据,与复旦语料库的分类体系进行对比实验。实验结果表明,相比于复旦语料库的分类体系,文章所提出的互联网信息分类体系具有更高的实用性,且能更为全面地涵盖各种互联网信息,类目之间交叉度小,各个类目信息量接近,文本分类效果更为理想。 展开更多
关键词 互联网信息 分类体系 中图法 语料库
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部