期刊文献+
共找到1,047篇文章
< 1 2 53 >
每页显示 20 50 100
Anomaly detection in traffic surveillance with sparse topic model 被引量:5
1
作者 XIA Li-min HU Xiang-jie WANG Jun 《Journal of Central South University》 SCIE EI CAS CSCD 2018年第9期2245-2257,共13页
Most research on anomaly detection has focused on event that is different from its spatial-temporal neighboring events.It is still a significant challenge to detect anomalies that involve multiple normal events intera... Most research on anomaly detection has focused on event that is different from its spatial-temporal neighboring events.It is still a significant challenge to detect anomalies that involve multiple normal events interacting in an unusual pattern.In this work,a novel unsupervised method based on sparse topic model was proposed to capture motion patterns and detect anomalies in traffic surveillance.scale-invariant feature transform(SIFT)flow was used to improve the dense trajectory in order to extract interest points and the corresponding descriptors with less interference.For the purpose of strengthening the relationship of interest points on the same trajectory,the fisher kernel method was applied to obtain the representation of trajectory which was quantized into visual word.Then the sparse topic model was proposed to explore the latent motion patterns and achieve a sparse representation for the video scene.Finally,two anomaly detection algorithms were compared based on video clip detection and visual word analysis respectively.Experiments were conducted on QMUL Junction dataset and AVSS dataset.The results demonstrated the superior efficiency of the proposed method. 展开更多
关键词 motion pattern sparse topic model SIFT flow dense trajectory fisher kernel
在线阅读 下载PDF
基于BERTopic的科技人才政策文本主题识别与量化分析——以东北三省为例 被引量:4
2
作者 苗宏慧 全情爽 舒心 《现代情报》 北大核心 2025年第4期110-121,共12页
[目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供... [目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供决策参考。[方法/过程]本研究以黑龙江省、吉林省、辽宁省三省的科技人才政策文本为研究对象,运用BERTopic模型对其政策文本进行主题识别、关键词提取、相似度计算等,在此基础上开展各省政策主题的纵横向比较,并与粤苏浙鲁等发达省份的政策进行对比分析。[结果/结论]东北三省科技人才政策已形成了以人才引进、培养、使用、评价、激励、服务为主线的政策体系,但与发达省份相比,在政策供给、需求牵引、针对性等方面还存在不足。据此,本研究提出,东北三省应立足区域实际,提升人才政策的系统性、精准性、时效性,聚焦政策供给、需求牵引、区域特色等关键问题,在人才政策的集成优化、创新发展上持续发力,以新时代人才政策变革引领和保障全面振兴、高质量发展。 展开更多
关键词 科技人才政策 主题识别 BERtopic模型 对比分析 东北振兴 政策供给
在线阅读 下载PDF
基于iTopicModel的关联文本分类算法
3
作者 梁鹏鹏 柴玉梅 王黎明 《计算机工程》 CAS CSCD 北大核心 2011年第21期124-125,130,共3页
针对传统文本分类方法对文档间关联关系考虑不充分的问题,提出一种基于iTopicModel的关联文本分类算法。根据类信息已知的文档归属于各个主题的概率判断主题代表的类信息,利用待分类文档归属于各个主题的概率及文本信息对文档进行分类... 针对传统文本分类方法对文档间关联关系考虑不充分的问题,提出一种基于iTopicModel的关联文本分类算法。根据类信息已知的文档归属于各个主题的概率判断主题代表的类信息,利用待分类文档归属于各个主题的概率及文本信息对文档进行分类。实验结果表明,当文档间的关联关系对类信息影响较大时,TC-iTM的分类性能优于传统文本分类方法。 展开更多
关键词 文本分类 文档网络 主题模型 EM算法
在线阅读 下载PDF
基于BERTopic模型的美国国防部关键科技资助项目主题挖掘与演化分析
4
作者 杨阳 郑禧潓 +1 位作者 张雯 李刚 《图书与情报》 北大核心 2025年第5期34-46,共13页
美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资... 美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资助的战略布局及其构成因素进行了实证分析和系统梳理。美国国防部关键科技资助项目涵盖83个主题,大多数主题在时间维度上的频率变化相对平稳,仅少数主题呈现出显著波动或快速增长态势,体现了美国“集中资源突破核心领域,广泛布局孕育未来方向”的关键技术资助战略。总体来看,美国国防部在推进科技创新的过程中实现了基础研究与应用研究的协同并进,构建起以国家安全为导向的前沿技术生态体系。 展开更多
关键词 美国国防部 关键科技资助项目 主题挖掘 动态演化分析 BERtopic主题模型
在线阅读 下载PDF
基于BERTopic的人工智能应用场景主题建模研究
5
作者 刘湘贝 严亚兰 查先进 《图书与情报》 北大核心 2025年第3期46-55,共10页
在国家大力推动人工智能场景应用的背景下,文章利用BERTopic考察人工智能应用场景的主题模型。首先,在澎湃新闻网搜集数据,经清洗后得到3524条新闻数据。在主题建模中,先利用Conan-embedding-v1预训练大模型实现文本嵌入,再利用UMAP、HD... 在国家大力推动人工智能场景应用的背景下,文章利用BERTopic考察人工智能应用场景的主题模型。首先,在澎湃新闻网搜集数据,经清洗后得到3524条新闻数据。在主题建模中,先利用Conan-embedding-v1预训练大模型实现文本嵌入,再利用UMAP、HDBSCAN和c-TF-IDF进行降维、聚类和主题表征,最后利用KeyBERT微调技术对主题词进行优化。在主题模型分析中,结合技术研发、文化数字化、区域经济协同、经济发展、金融创新、资本市场、医疗养老、政策协同、低空经济、城市发展、新闻传播11个主题进行了主题词分析。主题相似性分析表明不同主题之间存在强关联性:城市发展与经济发展、金融创新、政策协同三个主题的相似性较高,经济发展与金融创新、政策协同两个主题相似性较高;层次聚类及文档分布分析表明技术研发、文化数字化和政策协同与其他主题存在不同程度的交叉渗透现象。研究结果在一定程度上展现了催生人工智能颠覆性应用的场景现状、潜在需求和关联要素。 展开更多
关键词 BERtopic 人工智能 应用场景 主题建模 颠覆性应用
在线阅读 下载PDF
基于BERTopic主题建模的“Assessing Writing”研究趋势演化分析
6
作者 李锦焱 张丹 高慧敏 《河南科技大学学报(自然科学版)》 北大核心 2025年第4期97-104,M0008,共9页
通过深入挖掘期刊研究主题与预测学术发展趋势,研究人员能够更精准地把握学科方向,紧跟前沿动态。然而,期刊摘要作为短文本,其结构化特点、高维稀疏的向量表示、语义结构复杂性以及数据噪声等因素,对传统主题建模方法构成了严峻挑战。... 通过深入挖掘期刊研究主题与预测学术发展趋势,研究人员能够更精准地把握学科方向,紧跟前沿动态。然而,期刊摘要作为短文本,其结构化特点、高维稀疏的向量表示、语义结构复杂性以及数据噪声等因素,对传统主题建模方法构成了严峻挑战。针对这一问题,提出了一种基于BERTopic的主题演化分析模型。模型融合了预训练语言模型在语义表征方面的优势与层次化聚类算法的结构建模能力,同时重构词项加权策略,引入词频的次线性变换机制以优化传统词权计算方法,从而有效削弱高频词的干扰,突出对区分主题具有关键意义的词项,显著提升了模型的主题区分度和语义表征能力。以“Assessing Writing”期刊为研究对象,围绕不同时期写作评估领域的研究成果开展实证分析。通过系统梳理各阶段的研究主题与发展方向,挖掘其动态演化规律。实验结果表明,能够准确捕捉写作评估领域的研究热点变化,清晰揭示其发展脉络,在处理期刊摘要等短文本数据时展现出良好的实用性与有效性,为相关领域的学术研究和趋势预测提供了可靠的技术支撑。 展开更多
关键词 主题建模 BERtopic 语义结构 主题表征 次线性变换
在线阅读 下载PDF
基于BERTopic和A-Kano模型的冲锋衣用户需求研究
7
作者 李玉鹏 蒋玉 李祺 《丝绸》 北大核心 2025年第11期62-71,共10页
本文旨在探析冲锋衣用户在网购过程中的真实需求,为相关企业制定相关市场策略提供依据。本研究对京东商城中国内外16个冲锋衣品牌的40016条在线评论进行主题建模,以此识别用户对冲锋衣产品及相关服务的核心需求要素。并借助A-Kano模型... 本文旨在探析冲锋衣用户在网购过程中的真实需求,为相关企业制定相关市场策略提供依据。本研究对京东商城中国内外16个冲锋衣品牌的40016条在线评论进行主题建模,以此识别用户对冲锋衣产品及相关服务的核心需求要素。并借助A-Kano模型揭示各项需求要素对用户满意度的作用差异,进而实现冲锋衣用户需求的层级划分以及供给优先序确认。结果表明,防水性、布面疵点等7项需求是建立用户满意度的首要因素;防寒性、客服态度等12项需求是提升用户满意度的关键因素;防水拉链、无噪音面料等4项需求则是超出用户预期且显著提升用户满意度的重要因素。 展开更多
关键词 冲锋衣 用户需求 主题建模 在线评论 BERtopic A-Kano模型
在线阅读 下载PDF
基于BERTopic的关键技术识别方法及其实证研究
8
作者 郝仁泽 李建国 赵鹏蛟 《火力与指挥控制》 北大核心 2025年第3期123-129,共7页
关键技术识别是科技决策过程的重要环节,如今科学技术的快速发展导致技术发展的不确定性和复杂性增加,为保证视角的多元化和数据的丰富性,需要对不同语种、不同来源的科技文献进行关键技术识别。针对文献多样化带来的挑战,提出一种基于B... 关键技术识别是科技决策过程的重要环节,如今科学技术的快速发展导致技术发展的不确定性和复杂性增加,为保证视角的多元化和数据的丰富性,需要对不同语种、不同来源的科技文献进行关键技术识别。针对文献多样化带来的挑战,提出一种基于BERTopic的关键技术识别方法,将acge_text_embedding与BERTopic结合,弥补了原模型处理中文语料和长文本的缺陷,扩大了适用范围。实验验证了方法的有效性。 展开更多
关键词 BERtopic 主题模型 acge 关键技术识别 科技决策
在线阅读 下载PDF
国家级超算布局、数智创新生态系统韧性和低空经济领域技术创新——基于BERTopic模型和双重机器学习的实证研究
9
作者 吕鲲 潘均柏 谢珠约 《工业技术经济》 北大核心 2025年第6期37-46,共10页
为验证国家级超算布局如何通过驱动数智创新生态系统韧性提升间接影响低空经济领域技术创新成果数量、质量及技术部门多元化发展,本文基于BERTopic主题模型从低空经济领域发明专利文本中提取出系统架构与智能控制等20个细分技术主题,以... 为验证国家级超算布局如何通过驱动数智创新生态系统韧性提升间接影响低空经济领域技术创新成果数量、质量及技术部门多元化发展,本文基于BERTopic主题模型从低空经济领域发明专利文本中提取出系统架构与智能控制等20个细分技术主题,以及飞行器导航与控制系统等5个技术大类主题(技术部门);构建包括遗传繁衍、结构冗余、功能升级、栖息适应、锁定破解5个维度的数智创新生态系统韧性评价体系,采用双重机器学习模型对2011~2023年30个省域的面板数据进行实证分析,结论如下:(1)国家级超算布局能够显著促进区域在低空经济领域的技术创新数量和技术创新质量;(2)国家级超算布局能够通过促进数智创新生态系统韧性,间接促进低空经济领域飞行器导航与控制系统、飞行器激光与光电检测技术、结构动力与任务执行系统、智能巡检与监控系统4个技术大类主题的技术创新,但对消防救援无人机系统这一典型场景驱动的技术创新作用不显著;(3)遗传繁衍等5个维度都能够在国家级超算布局和低空经济领域技术创新之间发挥机制效应,但部分机制路径当前不具备可推广性。 展开更多
关键词 国家级超算布局 数智创新生态系统韧性 低空经济 BERtopic主题模型 双重机器学习模型 因果中介效应 技术创新 技术异质性
在线阅读 下载PDF
基于特定领域的中文微博热点话题挖掘系统BTopicMiner 被引量:26
10
作者 李劲 张华 +1 位作者 吴浩雄 向军 《计算机应用》 CSCD 北大核心 2012年第8期2346-2349,共4页
随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题。为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法。为了解决微博信息固有的数据稀疏性问题,算法首先利用文本... 随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题。为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法。为了解决微博信息固有的数据稀疏性问题,算法首先利用文本聚类方法将内容相关的微博消息合成为微博文档;基于微博之间的跟帖关系蕴含着话题的关联性的假设,算法对传统潜在狄利克雷分配(LDA)话题模型进行扩展以建模微博之间的跟帖关系;最后利用互信息(MI)计算被抽取出的话题的话题词汇用于热点话题推荐。为了验证扩展的话题抽取模型的有效性,实现了一个基于特定领域的中文微博热点话题挖掘的原型系统——BTopicMiner。实验结果表明:基于微博跟帖关系的扩展话题模型可以更准确地自动提取微博中的热点话题,同时利用MI度量自动计算得到的话题词汇和人工挑选的热点词汇之间的语义相似度达到75%以上。 展开更多
关键词 数据挖掘 信息检索 微博 话题模型 文本聚类 互信息
在线阅读 下载PDF
基于Topic Signature的动态文摘更新方法 被引量:2
11
作者 张祯 樊兴悦 +1 位作者 郭禹田 吴国华 《计算机工程》 CAS CSCD 北大核心 2018年第6期169-175,共7页
目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根... 目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根据句间相似度对每条语句的主题代表性和信息多样性进行评分,利用Topic Signature模型评估语句的新颖性,以提取事件中的更新演进信息。在此基础上,依据摘要生成策略,缩小解的可行域,以保证在短时间内生成高质量的文摘。实验结果表明,该方法无需进行模型训练和语言匹配,能够有效降低时间复杂度,提高文摘提取效率。 展开更多
关键词 动态文摘 topic Signature模型 密度峰值 整数规划模型 自然语言处理
在线阅读 下载PDF
基于Topic Map的网络课件模型研究 被引量:7
12
作者 周亭 周竹荣 黄果 《计算机工程与设计》 CSCD 北大核心 2007年第7期1683-1687,共5页
在分析传统网络课件结构的基础上,对基于主题图的网络课件采用集合论的方法进行了建模,并对TMC模型中的规则、性质及其作用进行了研究,利用Java和TM4L基于主题图描述语言(XTM)开发了TMC的原型系统,对该模型进行了验证。
关键词 主题图 网络课件 集合论 超文本 形式化模型
在线阅读 下载PDF
基于BERTopic模型的网络暴力事件衍生舆情探测 被引量:16
13
作者 胡凯茜 李欣 王龙腾 《情报杂志》 CSSCI 北大核心 2024年第7期146-153,共8页
[研究目的]在海量用户生成内容中及时探测和剖析网络暴力事件的衍生舆情能够为舆情事件链的演化分析、同类舆情的研判介入、衍生事件的监测预警提供理论支持。[研究方法]使用BERTopic模型对短文本内容主题建模并采用聚类的方式展示主题... [研究目的]在海量用户生成内容中及时探测和剖析网络暴力事件的衍生舆情能够为舆情事件链的演化分析、同类舆情的研判介入、衍生事件的监测预警提供理论支持。[研究方法]使用BERTopic模型对短文本内容主题建模并采用聚类的方式展示主题的潜在层次结构。根据词向量余弦相似度设计主题衍生度的计量算法,同时融合词共现网络在文档-词语层面信息捕捉的优势以及桑基图直观演示舆情演化过程的特点,衡量主题间的影响力与衍生关系。[研究结论]在开源数据集下多组主题模型的对照实验中,BERTopic模型在短文本建模以及下游任务的平均得分提高2.13%。在网络暴力热点事件的应用实例中,多维细粒度分析与交互式可视化方法可达到直观展示暴力事件的主题聚类、词义关联与演化态势的效果,实现网络暴力事件衍生舆情的探测与分析。 展开更多
关键词 网络舆情 网络暴力 衍生舆情 舆情监测 短文本 主题建模 BERtopic模型
在线阅读 下载PDF
基于BERTopic模型的用户层次化需求及动机分析--以抖音平台为例 被引量:43
14
作者 刘洋 柳卓心 +1 位作者 金昊 陈飞扬 《情报杂志》 CSSCI 北大核心 2023年第12期159-167,共9页
[研究目的]在分析短视频平台的用户生成内容构成,提炼其在时间演化与社会事件影响下表现出的构造与演化规律,挖掘短视频用户的内在行为需要,探讨其用户参与行为的潜在动机因素。[研究方法]以抖音平台237万条短视频发布数据作为研究样本... [研究目的]在分析短视频平台的用户生成内容构成,提炼其在时间演化与社会事件影响下表现出的构造与演化规律,挖掘短视频用户的内在行为需要,探讨其用户参与行为的潜在动机因素。[研究方法]以抖音平台237万条短视频发布数据作为研究样本,使用BERTopic模型实现主题聚类,总结用户一定时间内的话题的关注情况,并在互联网视角下结合马斯洛需求层次理论,揭示用户参与行为背后需求与动机。[研究结论]首先,用户的需求关注度由高至低的排列顺序为尊重需求、安全需求、社交需求、自我实现需求与生理需求,且该关注顺序能在日常的时间推移中保持稳定;其次,用户对于社会事件有着较高的讨论度,相关事件能够显著影响时段内用户的视频内容构成,但对用户的关注程度分布影响微弱;最后,用户在发布视频过程中和点赞互动的关注热点存在差异。用户在发布视频时更关注尊重层次需求,而在浏览互动时,自我实现层次需求受到的关注程度显著提升。 展开更多
关键词 短视频 用户需求 用户行为 主题聚类 主题演化 BERtopic模型 马斯洛需求理论
在线阅读 下载PDF
基于BERTopic主题建模的延时现场救护研究趋势与热点分析
15
作者 辛然 李雪玉 房玉丽 《军事护理》 CSCD 北大核心 2024年第9期50-53,58,共5页
目的分析2009~2024年间国际延时现场救护领域的文献,探究主要研究主题及其发展趋势,以期为未来救护策略提供理论支持。方法系统检索PubMed、Embase、Web of Science和中国知网等数据库,筛选并纳入283篇相关文献。运用BERTopic主题建模... 目的分析2009~2024年间国际延时现场救护领域的文献,探究主要研究主题及其发展趋势,以期为未来救护策略提供理论支持。方法系统检索PubMed、Embase、Web of Science和中国知网等数据库,筛选并纳入283篇相关文献。运用BERTopic主题建模技术对文献进行主题识别和关键词分析,并进行可视化展示。结果当前研究主要聚焦在“急救策略研究”“智能技术与信息管理”“实战应用”与“政策与理论研究”等4个方面,预测这些领域将持续成为研究热点。结论国际延时现场救护研究正处于快速发展阶段,建议未来研究深入重点领域,开发有效的救护策略,以提升救治效率和伤员生存率。 展开更多
关键词 延时现场救护 主题建模 研究热点
在线阅读 下载PDF
数字文旅体验式消费场景系统的构建研究——以荆楚文化为例 被引量:10
16
作者 李江敏 冯涵瑞 张佳泋 《四川师范大学学报(社会科学版)》 北大核心 2025年第1期96-105,203,共11页
作为悠久中华文明的重要组成部分,荆楚文化适时融入数字经济语境,是讲好中国故事、传播中华文化的重要路径。基于游客UGC数据分析,采用LDA主题模型和质性研究方法,识别出诗赋曲艺创意休闲、荆楚历史文博展陈、大江大湖行浸游艺三大荆楚... 作为悠久中华文明的重要组成部分,荆楚文化适时融入数字经济语境,是讲好中国故事、传播中华文化的重要路径。基于游客UGC数据分析,采用LDA主题模型和质性研究方法,识别出诗赋曲艺创意休闲、荆楚历史文博展陈、大江大湖行浸游艺三大荆楚文化消费场景主题,可构建一个由多方参与主体、多元场景结构、多样场景类型、多种场景体验、多重场景价值五要素组成的数字文旅体验式消费场景系统。其中,系统各要素动态表征于物理环境、空间模拟、社会主体、数智交互、行为向度、场景效能六个维度;供求交织、虚实交融、主客交互是系统内在运行逻辑,为驱动系统优化、构建沉浸式体验、促进价值共创提供了原动力、吸引力和核心力。 展开更多
关键词 数字文旅 消费场景 荆楚文化 LDA主题模型
在线阅读 下载PDF
创业领域动态能力研究综述——基于LDA主题模型 被引量:7
17
作者 马鸿佳 肖彬 韩姝婷 《南开管理评论》 北大核心 2025年第1期163-174,共12页
VUCA时代外部环境瞬息万变,动态能力已成为组织长期生存、发展及应对动荡环境的关键能力。先前的动态能力研究大多基于成熟企业,创业企业由于年龄、规模劣势,更易面临生存与发展的巨大挑战,更具灵活性的创业企业动态能力可能具备特殊性... VUCA时代外部环境瞬息万变,动态能力已成为组织长期生存、发展及应对动荡环境的关键能力。先前的动态能力研究大多基于成熟企业,创业企业由于年龄、规模劣势,更易面临生存与发展的巨大挑战,更具灵活性的创业企业动态能力可能具备特殊性。然而,尽管学术界对创业领域动态能力的研究兴趣日益浓厚,但相关研究较为零散,且理论体系尚未形成。因此,本研究以创业领域动态能力的352篇英文文献为研究对象,基于LDA主题模型聚合出15个主题,结合人工编码及LDAvis可视化工具确定了内涵和微观基础、前因、边界条件和结果四个研究内容。在此基础上,对相关主题的关键中英文文献进行系统化梳理,构建了创业领域动态能力的综合研究框架,结合该框架呼吁学者进一步关注超越组织层面的动态能力研究,探索数据驱动的创业企业动态能力研究及拓展创业领域的动态能力研究方法、数据来源。 展开更多
关键词 创业领域 动态能力 主题模型 文献回顾
在线阅读 下载PDF
集成学习框架下水电工程施工事故致因因果发现 被引量:1
18
作者 郑霞忠 欧妍希 +2 位作者 田丹 陈云 钟馨凝 《安全与环境学报》 北大核心 2025年第4期1237-1246,共10页
为了探究水电工程施工安全风险复杂因果关系,理清安全风险事故演化过程,实现精准化的事故管理,以近年代表性事故调查报告为基础,集成二元项主题模型(Biterm Topic Model,BTM)与决策试验与评估实验法(Decision-Making Trial and Evaluati... 为了探究水电工程施工安全风险复杂因果关系,理清安全风险事故演化过程,实现精准化的事故管理,以近年代表性事故调查报告为基础,集成二元项主题模型(Biterm Topic Model,BTM)与决策试验与评估实验法(Decision-Making Trial and Evaluation Laboratory,DEMATEL),改进关联规则(Apriori algorithm)算法,建立水电工程事故致因演化规则智能分析模型。首先,利用BTM方法,挖掘事故文本中的关键信息,获得关键信息的特征词,提炼事故致因因素;其次,融合事故致因因素与DEMATEL方法改进Apriori算法,分析事故致因演化规则,获得事故致因因素间的因果关联关系。最后,将提取的14个事故致因关键词建立模型,应用于水电工程的事故分析中,深入挖掘事故诱因,阐明事故演化过程,为安全事故的高效精准管理提供了理论和技术支撑,有助于提升施工现场安全管理质量与效率,实现事故的实时高效预控。 展开更多
关键词 安全工程 事故致因分析 文本挖掘 关联规则 二元项主题模型
在线阅读 下载PDF
主题模型在科技论文中的应用对比:以信息资源管理领域为例 被引量:3
19
作者 陈明红 梁萱 陈海华 《图书馆论坛》 北大核心 2025年第6期104-113,共10页
主题模型作为高效的文本主题挖掘工具,广泛用于科技论文的前沿主题识别与演化分析、文本分类、论文与作者推荐以及知识发现。为揭示主题模型对于科技论文主题建模的适用性并为主题模型选择与应用提供依据,文章分别采用LSA、LDA、BTM、LD... 主题模型作为高效的文本主题挖掘工具,广泛用于科技论文的前沿主题识别与演化分析、文本分类、论文与作者推荐以及知识发现。为揭示主题模型对于科技论文主题建模的适用性并为主题模型选择与应用提供依据,文章分别采用LSA、LDA、BTM、LDA2vec和BERTopic模型在信息资源管理论文数据集上进行建模,从适用场景、建模效果、计算效率、结果可解释性和总体优劣五个维度分析五个模型对于科技论文主题建模的适用性。实验结果表明,LSA和BTM不适用于科技论文主题建模,而LDA、LDA2vec和BERTopic适用于科技论文主题建模,LDA2vec和BERTopic的建模效果优于LDA。 展开更多
关键词 主题模型 科技论文 可解释性 信息资源管理
在线阅读 下载PDF
ILRD:一种融合IPC_LDA和文本语义特征的专利推荐模型 被引量:2
20
作者 邓娜 林涵辉 +1 位作者 陈旭 刘树栋 《情报杂志》 北大核心 2025年第3期170-179,F0003,共11页
[研究目的]随着全球专利数量的持续增长,现有的专利推荐模型难以精准地理解专利文本中复杂的语义信息,忽视了专利的领域和主题信息,从而影响专利的准确推荐。因此,实现一个能够综合考虑多种因素的高效专利推荐模型具有重要意义。[研究方... [研究目的]随着全球专利数量的持续增长,现有的专利推荐模型难以精准地理解专利文本中复杂的语义信息,忽视了专利的领域和主题信息,从而影响专利的准确推荐。因此,实现一个能够综合考虑多种因素的高效专利推荐模型具有重要意义。[研究方法]提出了一种ILRD专利推荐模型,通过IPC语义结构化映射与LDA主题建模来表征专利的技术领域和核心主题。构建RoBERTa与DPCNN模型深入解析专利文本的复杂语义,以实现多因素融合的专利推荐。[研究结果/结论]实证研究显示,ILRD模型在半导体领域的专利推荐上,其准确率和F1得分显著超越常规模型,推荐准确率提高至86%。验证了本文方法的有效性,也为跨领域专利推荐提供了新思路。 展开更多
关键词 专利推荐 IPC LDA主题建模 预训练模型 RoBERTa DPCNN 半导体
在线阅读 下载PDF
上一页 1 2 53 下一页 到第
使用帮助 返回顶部