期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于文本数据挖掘的蛋白功能预测:机遇与挑战 被引量:1
1
作者 张成辛 《合成生物学》 北大核心 2025年第3期603-616,共14页
理解蛋白质的生物学功能是定量合成生物学成功的前提。然而,除了少数模式生物外,大多数生物中有许多蛋白质的功能尚未通过实验进行解析。因此,开发自动、准确的蛋白质功能预测算法尤为重要。近年来,以深度学习为代表的人工智能算法成为... 理解蛋白质的生物学功能是定量合成生物学成功的前提。然而,除了少数模式生物外,大多数生物中有许多蛋白质的功能尚未通过实验进行解析。因此,开发自动、准确的蛋白质功能预测算法尤为重要。近年来,以深度学习为代表的人工智能算法成为蛋白质生物信息学发展的主流。在蛋白质功能预测领域,深度学习尤为显著。例如,在最近几届国际蛋白质功能预测大赛(Critical Assessment of Function Annotation,CAFA)中,排名靠前的算法使用深度学习模型(主要是大语言模型)实现基于文本数据挖掘的蛋白质功能预测。具体而言,这些方法或直接利用从科学文献中提取的文本特征来预测基因本体(Gene Ontology,GO),或通过具有相似文献的模板蛋白质来预测GO。尽管在开发更强大的深度学习模型用于基于文本挖掘的蛋白质功能注释方面已有大量研究,基于文本挖掘的蛋白质功能预测算法在处理科学文献数据时仍存在一些长期被忽视的问题。本文首先回顾了蛋白质功能注释中现有的方法和挑战:第一,大多数基于文本挖掘的蛋白质功能预测器仅使用由UniProt数据库管理员为目标蛋白手工收集的PubMed摘要,忽略了尚未被UniProt收录的文献;第二,几乎所有方法都只处理摘要,而忽略了PubMed Central和Europe PMC等数据库中可获得的更详尽的全文文献;第三,鲜有研究工作能自动区分低通量实验、高通量研究和计算预测等不同类别的科研文献,这大大增加了基于文本进行功能注释的难度。此外,本文还提出了利用人工智能最新发展的有前景的方法,以改进基于文本挖掘的蛋白质功能注释。这有助于开发下一代文本挖掘工具,针对性攻克文本数据处理的现有困难,以实现更准确的功能注释。 展开更多
关键词 蛋白质 生物学功能 基因本体 文本数据挖掘 深度学习
在线阅读 下载PDF
Internet上的文本数据挖掘 被引量:60
2
作者 王伟强 高文 段立娟 《计算机科学》 CSCD 北大核心 2000年第4期32-36,共5页
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的I... 1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。 展开更多
关键词 信息检索 文本数据挖掘 INTERNET网 数据
在线阅读 下载PDF
基于KH Coder文本数据挖掘的中日STEM教育研究模式对比 被引量:21
3
作者 王卓玉 袁磊 张文超 《现代远程教育研究》 CSSCI 北大核心 2020年第2期56-63,共8页
STEM教育由于强调跨学科融合和创新人才培养的理念而受到世界各国的广泛关注。我国学者的国际视野主要集中于欧美国家,而对日本的STEM教育研究甚少。造成这一现象的主要原因在于当前主流文献数据库并不支持对日语文献的检索,因此有必要... STEM教育由于强调跨学科融合和创新人才培养的理念而受到世界各国的广泛关注。我国学者的国际视野主要集中于欧美国家,而对日本的STEM教育研究甚少。造成这一现象的主要原因在于当前主流文献数据库并不支持对日语文献的检索,因此有必要借助KH Coder这一支持日语文献分析的文本数据挖掘软件来探索日本STEM教育研究的特色,以期为我国的STEM教育研究提供借鉴。通过对中日两国STEM教育研究主题高频词表与主题词共现关系网络的分析发现,日本的STEM教育研究更偏向于实践,且注重进行实证研究;实践指向下的开发主要关注教材开发,且非常注重与地方特色产业相结合;同时倡导和重视国际间合作开展STEM实践,不断输出和引进可贵经验。反观我国的STEM教育研究,则偏向于介绍国外特别是美国的STEM教育经验,课程内容偏向于STEM教育的理念及其设计等理论层面问题,非常缺乏融入本地境脉的实践和实证研究。为了更好地推进我国STEM教育的实践发展,我国学者应该借鉴日本STEM教育研究模式的特色,从实践与实证相结合、建立国际合作、融入地方境脉三方面探求STEM教育研究模式的转变。 展开更多
关键词 日本STEM教育 研究模式 比较研究 文本数据挖掘 KH CODER
在线阅读 下载PDF
基于文本数据挖掘的复杂工况螺纹连接力矩衰减预测方法 被引量:1
4
作者 王昌健 蒋国璋 段现银 《河南理工大学学报(自然科学版)》 CAS 北大核心 2021年第2期142-151,共10页
针对冲击、振动或变载荷环境等复杂工况下螺纹连接易失效,传统基于实验和仿真的方法无法高效、经济、准确地找出原因并对衰减进行预测的问题,本文利用人工智能技术在故障预测领域中的优势,提出一种基于数据挖掘的复杂工况螺纹连接力矩... 针对冲击、振动或变载荷环境等复杂工况下螺纹连接易失效,传统基于实验和仿真的方法无法高效、经济、准确地找出原因并对衰减进行预测的问题,本文利用人工智能技术在故障预测领域中的优势,提出一种基于数据挖掘的复杂工况螺纹连接力矩衰减预测方法。该方法从原始数据中挖掘其与螺纹连接故障的精确映射关系,准确找出螺纹连接发生失效的主要原因并对力矩衰减进行预测。首先,考虑导致文本极性变化的特殊语言结构,提出一种规则化故障量化方法;其次,结合螺纹连接力矩衰减专业领域词典,对螺纹连接力矩衰减进行基于文本描述的故障量化评级;再次,提出基于Logistic函数模型的特征构建方法并构建力矩衰减相关特征集;最后,建立基于随机森林和岭回归算法的Stacking集成学习预测模型。本文以重型卡车推力杆螺纹力矩衰减预测作为实际案例,验证了该方法的可行性和有效性,集成后的模型预测准确率较单一随机森林和岭回归算法模型平均提升了53.39%。 展开更多
关键词 文本数据挖掘 螺纹连接 力矩衰减 故障预测 Stacking集成学习
在线阅读 下载PDF
我国智慧图书馆文本数据挖掘侵权风险与对策研究 被引量:11
5
作者 闫宇晨 《国家图书馆学刊》 CSSCI 北大核心 2022年第1期106-112,F0003,共8页
数字时代下,文本数据挖掘技术的广泛应用对我国智慧图书馆的建设意义重大。但文本数据挖掘是否属于著作权例外这一问题引起国内外学界、实务界广泛争议,也给图书馆新技术的应用带来了一定的侵权风险。本文对近年域外相关制度改革进行梳... 数字时代下,文本数据挖掘技术的广泛应用对我国智慧图书馆的建设意义重大。但文本数据挖掘是否属于著作权例外这一问题引起国内外学界、实务界广泛争议,也给图书馆新技术的应用带来了一定的侵权风险。本文对近年域外相关制度改革进行梳理与反思,发现相关做法不具备法律移植的必要性与可行性;对文本数据挖掘的行为本质进一步分析发现,可以在著作权法框架下寻求一种“二分式”的侵权判断法,正确认定我国图书馆文本数据挖掘行为合法性问题,从而推动数字经济发展。表1。图1。参考文献24。 展开更多
关键词 智慧图书馆 文本数据挖掘 著作权例外 合理使用
在线阅读 下载PDF
《文本数据挖掘》 被引量:2
6
作者 宗成庆 夏睿 张家俊 《中文信息学报》 CSCD 北大核心 2020年第12期F0003-F0003,共1页
文本数据挖掘是通过机器学习、自然语言处理和推理分析等方法,根据文本内容完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。随着互联网和移动通信技术的快速发展和普及应用,这项技术已在众多领域得到... 文本数据挖掘是通过机器学习、自然语言处理和推理分析等方法,根据文本内容完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。随着互联网和移动通信技术的快速发展和普及应用,这项技术已在众多领域得到了广泛应用。本书旨在全面介绍与文本数据挖掘相关的基本概念、理论模型和实现算法,内容覆盖数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等,以期帮助广大对文本数据挖掘感兴趣的科研技术人员快速掌握相关技术。 展开更多
关键词 文本数据挖掘 科研技术人员 信息处理技术 信息抽取 自然语言处理 主题模型 机器学习 推理分析
在线阅读 下载PDF
教育数字化转型背景下人工智能教育应用的态势——基于文本数据挖掘的分析 被引量:4
7
作者 张文超 《中国教育科学(中英文)》 CSSCI 2023年第3期52-60,共9页
随着教育数字化转型的推进,人工智能教育应用受到更多关注,迫切需要对人工智能教育应用的态势进行辩证、系统的梳理。基于文本数据的分析发现,人工智能教育应用形成了关注热点,面临着机遇与挑战。人工智能教育应用的健康发展要关注三点... 随着教育数字化转型的推进,人工智能教育应用受到更多关注,迫切需要对人工智能教育应用的态势进行辩证、系统的梳理。基于文本数据的分析发现,人工智能教育应用形成了关注热点,面临着机遇与挑战。人工智能教育应用的健康发展要关注三点:明确应用目的,规避技术风险;提升理性认知,规范实践应用;逐级开展实践,产生真实效果。 展开更多
关键词 人工智能 人工智能教育应用 教育数字化转型 文本数据挖掘
在线阅读 下载PDF
法律与技术的协同演化——以日本文本与数据挖掘权利限制条款为例 被引量:1
8
作者 刘影 《知识产权》 北大核心 2025年第4期111-126,共16页
基于技术与制度协同演化理论来应对机器学习对于著作权权利限制条款的挑战,有助于突破技术作用于制度或者制度作用于技术的单向视角局限,填补制度与技术相互作用的动态视角盲区。日本著作权法的立法创新体现在两方面:一是通过权利限制... 基于技术与制度协同演化理论来应对机器学习对于著作权权利限制条款的挑战,有助于突破技术作用于制度或者制度作用于技术的单向视角局限,填补制度与技术相互作用的动态视角盲区。日本著作权法的立法创新体现在两方面:一是通过权利限制条款的结构重塑,来应对人工智能等新兴技术对现行著作权法的制度挑战;二是通过将文本与数据挖掘特定技术场景纳入权利限制范畴,为人工智能技术进步创设更为充分的制度允纳空间。我国《著作权法》中权利限制条款的结构重塑,应在制度与技术协同演化的总体思路下展开,根据著作权人的不利益程度划分成为三大类,并为之单独设计权利限制条款。机器学习对于作品的使用不会给著作权人带来规范性损害,其权利限制条款的设计思路可分为三步:首先通过抽象性条款来增强法律适用的灵活性,然后通过列举方式将以文本与数据挖掘为代表的特定技术纳入其中,最后通过但书条款的设计来确保著作权人的利益不受显著损害。 展开更多
关键词 协同演化 机器学习 文本数据挖掘 权利限制条款 结构重塑
在线阅读 下载PDF
人工智能机器学习内容的著作权合法性基础——以文本和数据挖掘例外规则为视角 被引量:2
9
作者 辜凌云 《出版广角》 CSSCI 北大核心 2024年第15期54-59,共6页
为激活人工智能机器学习来源的合法基础,文本与数据挖掘行为能否适用于著作权合理使用制度,成为利用这一技术的法律难题。针对学界提出的“单独设置合理使用条款”“概括性解释合理使用一般条款”等观点,相关规范具备合理性的同时也面... 为激活人工智能机器学习来源的合法基础,文本与数据挖掘行为能否适用于著作权合理使用制度,成为利用这一技术的法律难题。针对学界提出的“单独设置合理使用条款”“概括性解释合理使用一般条款”等观点,相关规范具备合理性的同时也面临条款话语体系不周延、概括性适用具有不确定性以及冲击现有规范框架导致释法不稳定等难题。对于文本与数据挖掘技术的利用,应关注未来科技发展与该技术纳入著作权法中角色定位的协调统一趋势,在现行著作权法框架下,法律规范在应对技术创新时,应保持稳定并注重平衡,把握法律条文变动的逻辑趋势以及权利义务的控制思维,为科技发展提供灵活的法律空间,以实现技术发展与法律规制的动态平衡。 展开更多
关键词 人工智能 机器学习 文本数据挖掘 合理使用
在线阅读 下载PDF
大数据环境下文本和数据挖掘的版权例外研究——以欧盟《DSM版权指令》提案为视角 被引量:34
10
作者 唐思慧 《知识产权》 CSSCI 北大核心 2017年第10期109-116,共8页
大数据时代,文本和数据挖掘技术的广泛应用打破版权法构建的利益平衡机制,给我国著作权法带来了挑战,亟需调整。美国的应对是从默示许可转到无条件例外规则,而欧盟《DSM版权指令》提案以义务式的模式规定了"科学研究领域的文本和... 大数据时代,文本和数据挖掘技术的广泛应用打破版权法构建的利益平衡机制,给我国著作权法带来了挑战,亟需调整。美国的应对是从默示许可转到无条件例外规则,而欧盟《DSM版权指令》提案以义务式的模式规定了"科学研究领域的文本和数据挖掘"例外规则,对科研促进及对版权保护力度适中,值得借鉴。我国著作权法修改应制定"文本和数据挖掘合理使用规则",严格限制适用条件,重构利益平衡机制。 展开更多
关键词 数据 文本数据挖掘 版权例外 利益平衡
在线阅读 下载PDF
文本与数据挖掘对著作权例外体系的冲击与应对 被引量:32
11
作者 马治国 赵龙 《西北师大学报(社会科学版)》 CSSCI 北大核心 2021年第4期107-115,共9页
我国现有的著作权例外体系无法为文本与数据挖掘提供豁免,故挖掘行为存在侵犯著作权相关财产性权利的风险。通过对比日本、欧盟以及美国的相关司法与立法经验,认为我国文本与数据挖掘借鉴美国模式概括性适用合理使用条款是目前最具可行... 我国现有的著作权例外体系无法为文本与数据挖掘提供豁免,故挖掘行为存在侵犯著作权相关财产性权利的风险。通过对比日本、欧盟以及美国的相关司法与立法经验,认为我国文本与数据挖掘借鉴美国模式概括性适用合理使用条款是目前最具可行性的应对策略。为了使文本与数据挖掘自洽于著作权例外体系,还应采取将"四要素分析法"作为判断"三步检验法"的要件、提供合法授权的"第三方规避者"以及保持技术措施保护例外的开放性等举措。 展开更多
关键词 文本数据挖掘 著作权 合理使用 技术措施
在线阅读 下载PDF
文本与数据挖掘的法律障碍与化解路径——以知识资源平台的数据再利用为研究视角 被引量:10
12
作者 陶乾 董川 《出版广角》 CSSCI 北大核心 2023年第6期32-40,共9页
人工智能时代,知识资源平台上以数字化形态存在的作品是数据分析与人工智能模型训练的基础性资源。运用文本与数据挖掘技术能够对数据库中的内容进行深度分析,生成具有独立价值的衍生数据,从而能够发现出版规律、了解学术趋势、助力科... 人工智能时代,知识资源平台上以数字化形态存在的作品是数据分析与人工智能模型训练的基础性资源。运用文本与数据挖掘技术能够对数据库中的内容进行深度分析,生成具有独立价值的衍生数据,从而能够发现出版规律、了解学术趋势、助力科学研究,这是知识资源转化利用的一种路径。然而,这些数字化的单一文件以及数据库本身均构成著作权法所保护的作品,文本与数据挖掘过程中的存储行为落入了著作权人复制权的控制范围,这为文本与数据挖掘的实施带来了法律障碍。我国有必要在修订《著作权法实施条例》或者进行数据产权立法时,明晰文本与数据挖掘属于一种合理使用情形,在特定条件满足时无需获得著作权人许可且无需支付使用费。这不仅符合国际社会的立法趋势,而且有利于知识资源的价值转化。 展开更多
关键词 文本数据挖掘 合理使用 知识资源平台 复制权 生成式人工智能
在线阅读 下载PDF
数字环境下合理使用立法的重新建构——基于文本与数据挖掘的发展与分析 被引量:1
13
作者 周玲玲 杜静 费晓燕 《浙江社会科学》 CSSCI 北大核心 2018年第5期50-55,49,共7页
适用于纸本时代的合理使用立法已经无法满足数字时代的多元化创新需求。文本与数据挖掘作为新兴技术及研究方法,在直接立法中已得到明确具体的认可,其转换性法理本质也通过原则性合理使用条款在司法判例中得以论证。结合文本与数据挖掘... 适用于纸本时代的合理使用立法已经无法满足数字时代的多元化创新需求。文本与数据挖掘作为新兴技术及研究方法,在直接立法中已得到明确具体的认可,其转换性法理本质也通过原则性合理使用条款在司法判例中得以论证。结合文本与数据挖掘的立法发展及法理分析可知,数字环境中合理使用立法亟待直接立法和间接立法的双重支撑、具体立法和原则性立法的交融建构以及成文立法与司法解释的有机结合。同时,合理使用立法的多重建构应当以鼓励创新的立法宗旨为最终衡量标准,并且依赖于国际领域以及国内领域原则性合理使用条款的设立及加强。 展开更多
关键词 数字环境 文本数据挖掘 合理使用 重新建构
在线阅读 下载PDF
风险与纾解:人工智能技术使用文本与数据的著作权规制 被引量:3
14
作者 王思文 李彦 《中国出版》 CSSCI 北大核心 2024年第8期57-62,共6页
作为人工智能技术发展与升级的基础,文本与数据给该技术补给了充足的“养料”,但也可能侵犯到著作权主体的利益;技术对《著作权法》中所包含的“例外原则”提出了新的挑战;人工智能技术创作作品的著作权也一直存在争议。著作权法律制度... 作为人工智能技术发展与升级的基础,文本与数据给该技术补给了充足的“养料”,但也可能侵犯到著作权主体的利益;技术对《著作权法》中所包含的“例外原则”提出了新的挑战;人工智能技术创作作品的著作权也一直存在争议。著作权法律制度需要解决的核心问题是技术发展带来的技术研发者与著作权主体之间关系平衡的问题。《著作权法》需要适当扩张规制范围,综合使用法律中的“例外原则”;相关利益主体要在平衡权利与义务关系的前提下,不断开发与更新技术,调整人工智能技术研发与著作权主体利益之间的关系。 展开更多
关键词 人工智能技术 文本数据挖掘 著作权风险 规制路径
在线阅读 下载PDF
生成式人工智能训练数据的著作权法因应:欧盟版权例外规则及其对我国的启示分析 被引量:3
15
作者 包赛君 肖冬梅 《图书馆论坛》 北大核心 2025年第6期123-132,共10页
生成式人工智能(GenAI)使用训练数据打破了著作权法构筑的利益平衡机制,遭遇合法性困境与规则适用难题,亟须立法做出回应。文章考察欧盟文本与数据挖掘(TDM)例外规则发现,其采用“双轨制”,区分科学研究目的和一般目的,规定研究组织和... 生成式人工智能(GenAI)使用训练数据打破了著作权法构筑的利益平衡机制,遭遇合法性困境与规则适用难题,亟须立法做出回应。文章考察欧盟文本与数据挖掘(TDM)例外规则发现,其采用“双轨制”,区分科学研究目的和一般目的,规定研究组织和文化遗产机构基于科学研究目的可实施TDM,而基于一般目的实施TDM则受到权利人保留的限制。这在一定程度上赋予AI开发者合理使用空间,试图维系各方主体的利益平衡,但也存在适用主体过窄、适用目的单一等不足。我国可将TDM行为纳入合理使用情形,并规定前提条件为合法访问的作品、目的为科学研究及其他合理目的,行为仅限于复制,对主体不做限制,为生成式人工智能训练数据提供制度保障。 展开更多
关键词 生成式人工智能 训练数据 著作权 文本数据挖掘 合理使用
在线阅读 下载PDF
欧盟文本与数据挖掘版权例外条款的法律框架评析 被引量:6
16
作者 焦萍 《编辑之友》 CSSCI 北大核心 2017年第10期82-86,112,共6页
作为科研利用率极高的文本与数据挖掘技术,自产生之初便受科研群体的青睐。由于其在运行过程中的复制、抓取行为影响到版权人及数据库制作者的专有权利,存在法律上的不确定性。在新一轮全球版权法修改浪潮推动下,欧盟开始突破现有版权... 作为科研利用率极高的文本与数据挖掘技术,自产生之初便受科研群体的青睐。由于其在运行过程中的复制、抓取行为影响到版权人及数据库制作者的专有权利,存在法律上的不确定性。在新一轮全球版权法修改浪潮推动下,欧盟开始突破现有版权法桎梏,就"科研目的的文本与数据挖掘"使用,提出构建版权例外条款的建议。尽管我国著作权法第三次修改草案已定,但我们仍有必要研究欧盟在此问题上的修法过程,总结经验,结合国情,适时立法。 展开更多
关键词 文本数据挖掘 版权 版权例外 数据库保护
在线阅读 下载PDF
国际期刊出版商的版权立场及立法实践──基于文本与数据挖掘技术应用的视角 被引量:3
17
作者 杨继慧 《出版广角》 CSSCI 北大核心 2019年第1期79-81,95,共4页
文本与数据挖掘技术在促进期刊资源开发利用的同时,引发了新的版权问题,成为阻碍这项技术更广泛和深入实践的法律障碍。对此,国际期刊出版界给予密切关注,积极主动参与版权博弈,不断健全的立法为文本与数据挖掘行为提供了必须遵循的制... 文本与数据挖掘技术在促进期刊资源开发利用的同时,引发了新的版权问题,成为阻碍这项技术更广泛和深入实践的法律障碍。对此,国际期刊出版界给予密切关注,积极主动参与版权博弈,不断健全的立法为文本与数据挖掘行为提供了必须遵循的制度规范。 展开更多
关键词 期刊 文本数据挖掘 版权
在线阅读 下载PDF
著作权法下文本与数据挖掘的合规性路径检视 被引量:4
18
作者 郭永辉 宋伟锋 《当代传播》 CSSCI 北大核心 2022年第3期101-105,共5页
当前,数字经济与实体经济融合,文本数据挖掘和分析的市场需求旺盛。2020年,我国《著作权法》修订对合理使用制度未作修改,在著作权法领域,文本数据挖掘基本上以侵犯著作权认定。但在国际上,欧美国家为文本数据挖掘纳入合理使用提供法律... 当前,数字经济与实体经济融合,文本数据挖掘和分析的市场需求旺盛。2020年,我国《著作权法》修订对合理使用制度未作修改,在著作权法领域,文本数据挖掘基本上以侵犯著作权认定。但在国际上,欧美国家为文本数据挖掘纳入合理使用提供法律保障。本文以著作权法为引领,认为平衡著作权人、传播者、使用者等各方利益得失,更加突出引导功能,对文本与数据挖掘进行合规性论证,建构我国著作权法下文本与数据挖掘的理论、立法及司法三位一体的合规性路径。 展开更多
关键词 文本数据挖掘合理使用 转换性使用 法律解释
在线阅读 下载PDF
关于从MEDLINE数据库中进行知识抽取和挖掘的研究进展 被引量:133
19
作者 崔雷 郑华川 《情报学报》 CSSCI 北大核心 2003年第4期425-433,共9页
本文对近年来国内外利用医学文献检索系统MEDLINE进行知识抽取和文本数据挖掘的研究进行了回顾和综述,包括Swanson等开展的从文献中发现隐藏的联系的研究,Cimino等人开展的从文献中抽取规则的研究,国外的共词及国内的共篇分析研究.并据... 本文对近年来国内外利用医学文献检索系统MEDLINE进行知识抽取和文本数据挖掘的研究进行了回顾和综述,包括Swanson等开展的从文献中发现隐藏的联系的研究,Cimino等人开展的从文献中抽取规则的研究,国外的共词及国内的共篇分析研究.并据此提出,在当前信息技术高速发展的条件下,应当充分开展知识抽取和文本挖掘的研究,为图书情报部门的服务功能从文献管理向信息管理和知识管理转化进行理论上的探索. 展开更多
关键词 医学文献检索系统 MEDLINE 数据 知识抽取 文本数据挖掘 共词分析 信息管理 知识管理
在线阅读 下载PDF
中美“人工智能+教育”研究的话题比较分析——兼论基于结构话题模型的文献主题数据挖掘方法探析 被引量:7
20
作者 李海峰 《情报杂志》 CSSCI 北大核心 2020年第12期179-187,共9页
[目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及... [目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及话题时序变化等进行了模型估计和比较分析。[结果/结论]研究结果发现,中美“人工智能+教育”研究涵盖了15个主要话题。美国研究者倾向于机器学习、教育机器人以及智能知识管理系统等11个智能技术性话题,中国研究者关注教育游戏、教学代理和智能医疗等4个教学性话题。他们在同一话题的预期比例和话题关键词内容等方面存在着显著差异,大部分研究话题的时序发展强度各异。基于结构话题模型的文献分析,不仅揭示了两国在话题数量、内容偏好以及强度时序发展等方面的异同,而且为我国人工智能教育的基础性研究、研究体系创建、建立健全研发机制等建议的提出提供了依据。 展开更多
关键词 人工智能+教育 结构话题模型 人工智能教育应用 教育人工智能比较 文本数据挖掘
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部