期刊文献+
共找到95篇文章
< 1 2 5 >
每页显示 20 50 100
融合异质信息网络结构特征的短视频主题识别方法 被引量:1
1
作者 朱恒民 高凯力 +1 位作者 魏宏程 尹熙成 《情报杂志》 北大核心 2026年第1期145-152,共8页
[目的]短视频主题的有效识别有助于迅速捕捉舆情热点,为监管部门及时应对互联网舆情提供科学依据。[方法]提出融合异质信息网络结构特征和短视频内容特征的主题识别方法。首先,提取短视频社交平台上的异质交互关系,构建“用户-视频”异... [目的]短视频主题的有效识别有助于迅速捕捉舆情热点,为监管部门及时应对互联网舆情提供科学依据。[方法]提出融合异质信息网络结构特征和短视频内容特征的主题识别方法。首先,提取短视频社交平台上的异质交互关系,构建“用户-视频”异质信息网络;其次,基于图神经网络模型表示学习“用户-视频”网络的结构特征,融合短视频各模态的内容特征,生成统一、稠密的短视频节点表征向量;最后,在采用UMAP模型对表征后向量进行降维的基础上,基于K-means算法实现短视频的主题聚类。[结果/结论]对比实验验证了降维和聚类方法的有效性,消融实验验证了融合“用户-视频”异质网络的结构特征可以显著提升短视频主题识别的效果,准确率、归一化互信息指数和调整兰德指数三种评估指标的提升幅度分别达到了20.90%、23.44%和39.29%。 展开更多
关键词 短视频 主题识别 异质信息网络 网络表示学习 多模态 K-MEANS
在线阅读 下载PDF
基于多维知识元的科学—技术关联主题识别及发展态势测度研究——以人工智能领域为例
2
作者 张鹤翔 孙震 唐苗 《现代情报》 北大核心 2026年第2期61-76,共16页
[目的/意义]将科学与技术的知识要素置于统一分析框架下进行系统整合与动态测度,对把握创新发展态势、优化资源配置及提升国家创新体系效能具有重要价值。[方法/过程]本文立足科技协同创新整体视角,以论文与专利作为科学与技术知识要素... [目的/意义]将科学与技术的知识要素置于统一分析框架下进行系统整合与动态测度,对把握创新发展态势、优化资源配置及提升国家创新体系效能具有重要价值。[方法/过程]本文立足科技协同创新整体视角,以论文与专利作为科学与技术知识要素的载体,将科学—技术关联主题作为科学与技术知识要素重构和融合的分析单元。首先运用主题挖掘方法识别科学、技术主题,并引入知识元理论对主题内部的知识要素进行抽取与语义—结构—时序三维表征;随后基于知识元的语义关联与网络结构特征识别科学—技术关联主题,结合其生命周期演化特征,从创新活跃度、创新成熟度、创新衰弱度3个维度构建指标体系,借助战略定位坐标图对关联主题的发展态势进行测度与分类。[结果/结论]通过对人工智能领域的实证研究,识别出206对科学—技术关联主题并将其划分为前沿创新型、新兴潜力型等8种类型。实证结果表明,本文构建的基于多维知识元的科学—技术关联主题识别及发展态势测度方法具有较强的实用性与领域拓展性,可为学术界与产业界在前沿布局规划、创新资源配置等方面提供系统化的情报支撑。 展开更多
关键词 科学—技术关联 知识元 多维表征 时间序列演化 态势测度 主题识别 人工智能
在线阅读 下载PDF
基于LDA与Word2vec主题模型的草畜平衡研究主题演化与热点主题识别
3
作者 王延敏 张爱儒 《草业科学》 北大核心 2026年第2期334-349,共16页
为深入了解草畜平衡相关研究的现状及发展趋势,客观反映草畜平衡研究主题演化过程,本研究运用隐含狄利克雷分布(LDA)与Word2vec主题模型对2005-2024年CNKI数据库中草畜平衡相关文本数据进行建模、主题演化分析和热点主题识别。研究发现:... 为深入了解草畜平衡相关研究的现状及发展趋势,客观反映草畜平衡研究主题演化过程,本研究运用隐含狄利克雷分布(LDA)与Word2vec主题模型对2005-2024年CNKI数据库中草畜平衡相关文本数据进行建模、主题演化分析和热点主题识别。研究发现:1)LDA+Word2vec模型能够更精准地识别草畜平衡领域4个时间阶段(2005-2010年、2011-2015年、2016-2020年和2021-2024年)的主题演化路径和9个热点主题。2)在对草畜平衡研究主题演化历程的分析中,4个时间阶段的第4阶段展现出最强的演化能力。基于对4个阶段主题的归纳分类得到三大主要类别,并在此基础上梳理出三大类别主题间的核心演化路径。3)通过综合考量主题强度、主题影响力及主题关注度等指标,本研究揭示了草畜平衡领域在不同阶段的热点主题,并发现这些热点主题之间具有较强的关联性。 展开更多
关键词 草畜平衡 LDA+Word2vec主题模型 主题识别 主题演化 主题强度 热点主题 文献计量
在线阅读 下载PDF
基于BERTopic的科技人才政策文本主题识别与量化分析——以东北三省为例 被引量:10
4
作者 苗宏慧 全情爽 舒心 《现代情报》 北大核心 2025年第4期110-121,共12页
[目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供... [目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供决策参考。[方法/过程]本研究以黑龙江省、吉林省、辽宁省三省的科技人才政策文本为研究对象,运用BERTopic模型对其政策文本进行主题识别、关键词提取、相似度计算等,在此基础上开展各省政策主题的纵横向比较,并与粤苏浙鲁等发达省份的政策进行对比分析。[结果/结论]东北三省科技人才政策已形成了以人才引进、培养、使用、评价、激励、服务为主线的政策体系,但与发达省份相比,在政策供给、需求牵引、针对性等方面还存在不足。据此,本研究提出,东北三省应立足区域实际,提升人才政策的系统性、精准性、时效性,聚焦政策供给、需求牵引、区域特色等关键问题,在人才政策的集成优化、创新发展上持续发力,以新时代人才政策变革引领和保障全面振兴、高质量发展。 展开更多
关键词 科技人才政策 主题识别 BERTopic模型 对比分析 东北振兴 政策供给
在线阅读 下载PDF
林业复杂场景下“双碳”颠覆性技术主题识别
5
作者 安欣 杨禄鑫 +1 位作者 徐硕 刘迪航 《北京林业大学学报》 北大核心 2025年第12期12-25,共14页
【目的】颠覆性技术是“双碳”战略下林业自主控碳范式构建、绿色技术主导权竞争的关键变量,其识别与培育对推动传统林业向自主控碳转型具有重要现实价值与深远战略意义。本文以精准识别“双碳”领域颠覆性技术为目标,构建系统化识别体... 【目的】颠覆性技术是“双碳”战略下林业自主控碳范式构建、绿色技术主导权竞争的关键变量,其识别与培育对推动传统林业向自主控碳转型具有重要现实价值与深远战略意义。本文以精准识别“双碳”领域颠覆性技术为目标,构建系统化识别体系,比较分析单源数据与多源异构数据在技术主题抽取中的适用性,旨在为林业自主控碳等复杂场景下的关键技术挖掘提供可复制、可推广的方法框架,为自主控碳技术清单构建提供支撑。【方法】围绕颠覆性技术特征改进现有测度指标体系,采用兼顾单源数据与多源异构数据的TNG模型抽取技术主题,计算主题颠覆性指数。结合支撑“双碳”目标的林业(以下简称“林业双碳”)领域知识背景,按“源头减排”“末端治理”两大技术路径,对识别出的颠覆性技术进行分类解读与深入分析。【结果】经第三方资料对比验证,本文构建的方法识别效果良好,且多源异构数据融合的识别效果显著优于单源数据。在林业双碳领域,成功识别出核心技术主题——源头减排类(综合能源系统、智能配电网、生物质能减排)、末端治理类(森林土壤固碳技术、热反应二氧化碳捕获、离子液体−碳吸附、复合材料电催化剂制备),覆盖碳减排−碳捕集−碳利用−碳固存全链条,支撑自主控碳林业技术体系构建。【结论】本文提出的识别体系在颠覆性技术挖掘中表现出良好的适用性和稳定性,不仅为林业双碳领域“自主控碳转型”提供了精准的技术识别路径与核心技术清单,也为该方法在其他复杂领域的迁移应用提供了理论基础与实践依据。 展开更多
关键词 主题识别 颠覆性技术 多源异构数据 TNG模型 颠覆性指数 “双碳” 自主控碳
在线阅读 下载PDF
基于LDA模型的福建省家庭农场研究热点主题识别与趋势分析
6
作者 段园园 陈卫娜 林树文 《福建农业科技》 2025年第3期76-82,共7页
通过全面系统地展示福建省家庭农场研究领域的整体脉络、热点演进及前沿趋势,旨在为关注该领域的学者开展后续研究、政府部门制定相关政策提供参考和启发。研究基于文献计量学视角,借助LDA主题模型对1982-2024年中国知网525篇福建省家... 通过全面系统地展示福建省家庭农场研究领域的整体脉络、热点演进及前沿趋势,旨在为关注该领域的学者开展后续研究、政府部门制定相关政策提供参考和启发。研究基于文献计量学视角,借助LDA主题模型对1982-2024年中国知网525篇福建省家庭农场研究领域的中文文献进行主题挖掘及趋势预测分析。结果表明:福建省家庭农场研究历经3个阶段:起步期(1982-2010年)聚焦农业社会保障与基础服务;增长期(2011-2014年)关注土地流转与政策支持;成熟期(2015-2024年)深化现代农业技术与合作社作用研究。福建农林类高校为该方向的科研主力,但跨学科合作不足。研究主题主要围绕四大核心领域:农业社会化服务与土地流转、新型农业经营主体与农业现代化、集约化经营与合作社作用、发展问题与对策建议。研究指出,土地流转、社会化服务体系、现代农业技术、经营模式、政策和制度支持仍将是家庭农场研究的热点。 展开更多
关键词 家庭农场 新型农业经营主体 LDA模型 主题识别
在线阅读 下载PDF
基于CLIP-LDAGV多模态信息融合的颠覆性技术主题识别研究——以新能源领域为例 被引量:4
7
作者 吕鲲 张未旭 靖继鹏 《情报学报》 北大核心 2025年第3期353-368,共16页
当前,全球科技创新呈现高速发展和高度融合的态势。准确识别出颠覆性技术主题以推动全面创新已成为科学技术发展和经济增长的关键动力。然而,传统的颠覆性技术主题识别方法主要依赖于单一模态数据,存在一定的局限性。本文基于CLIP(contr... 当前,全球科技创新呈现高速发展和高度融合的态势。准确识别出颠覆性技术主题以推动全面创新已成为科学技术发展和经济增长的关键动力。然而,传统的颠覆性技术主题识别方法主要依赖于单一模态数据,存在一定的局限性。本文基于CLIP(contrastive language-image pre-training)和LDAGV(linear discriminant analysis&global vectors for word representation)模型构建新闻文本与图像特征融合向量,通过k-means聚类迭代并结合3个颠覆性技术主题指标进行筛选,实现了多模态信息的融合以及主题的精准识别。以新能源领域为例,验证了该模型在颠覆性技术主题识别方面的可行性和有效性。与其他单一模态模型相比,多模态信息融合模型在颠覆性技术主题识别方面更具优势。 展开更多
关键词 颠覆性技术 主题识别 多模态融合 CLIP-LDAGV模型
在线阅读 下载PDF
基于投融资事件的技术主题识别研究——以生物技术领域为例 被引量:3
8
作者 王益成 蒋星宇 +2 位作者 秦晴 刘雨农 郑彦宁 《情报学报》 北大核心 2025年第2期234-245,共12页
通过投融资事件识别领域技术主题并分析其演化趋势,对于科技界、金融界和企业界进行投融资规划与技术创新具有重要意义。首先,使用BERTopic静态主题模型抽取特征词,通过HDBSCAN算法生成主题簇;其次,使用c-TF-IDF算法从主题簇中提取主题... 通过投融资事件识别领域技术主题并分析其演化趋势,对于科技界、金融界和企业界进行投融资规划与技术创新具有重要意义。首先,使用BERTopic静态主题模型抽取特征词,通过HDBSCAN算法生成主题簇;其次,使用c-TF-IDF算法从主题簇中提取主题特征词,结合生物技术专业知识及融资企业官网技术细节描述命名技术主题;再其次,利用可视化技术构建技术主题演化路径可视化图谱,通过可视化图谱分析技术主题演化趋势;最后,通过生物技术领域投融资事件语料分析,比较不同技术主题在资本市场中的热度,拓展技术主题识别方法研究及实践应用。 展开更多
关键词 投融资 技术主题 主题识别 主题演化 语义挖掘
在线阅读 下载PDF
一种基于LDA模型的新兴主题识别与探测方法 被引量:10
9
作者 吴东雪 沈桂兰 《河南师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期72-80,共9页
新兴主题识别是科技研究领域识别新兴技术的重要方式,高效精准地识别新兴主题是早期辨识新兴技术研究方向的前提.提出一种基于LDA模型的新兴主题识别与趋势预测方法,通过LDA模型提取科技文献中的研究主题,构建主题强度、主题新颖度和复... 新兴主题识别是科技研究领域识别新兴技术的重要方式,高效精准地识别新兴主题是早期辨识新兴技术研究方向的前提.提出一种基于LDA模型的新兴主题识别与趋势预测方法,通过LDA模型提取科技文献中的研究主题,构建主题强度、主题新颖度和复合主题关注度的指标体系识别新兴主题,采用Prophet模型预测新兴主题的主题强度,探测未来发展趋势.以智慧农业领域最近14年的科研文献为数据集,对提出的识别和探测方法进行验证,识别出了5个新兴主题,并预测了未来3年的发展趋势,同时验证所提方法的有效性. 展开更多
关键词 主题识别 最优主题 新兴主题识别指标 Prophet模型
在线阅读 下载PDF
核心专利集筛选及专利技术主题识别影响 被引量:23
10
作者 李姝影 张鑫 +3 位作者 许轶 许海云 张娴 朱月仙 《情报学报》 CSSCI CSCD 北大核心 2019年第1期13-20,共8页
领域重要的技术特征词在技术主题网络中具有关键核心作用,研究对比从核心专利数据集中抽取的技术特征词相对于全数据集的效率,进而探讨基于引文网络的核心专利集筛选策略对技术主题识别所产生的影响。本文借鉴了专利引用强度指标和引用... 领域重要的技术特征词在技术主题网络中具有关键核心作用,研究对比从核心专利数据集中抽取的技术特征词相对于全数据集的效率,进而探讨基于引文网络的核心专利集筛选策略对技术主题识别所产生的影响。本文借鉴了专利引用强度指标和引用滞后性特征对核心专利集进行两步筛选,研究对比核心专利集与全数据集抽取的主题特征词在词云规模、词频覆盖率、阈值选择以及技术主题划分的差异。实证分析发现,利用核心专利集抽取技术特征词有助于提升技术主题识别的效率和准确性,且基于核心专利集聚类生成的技术主题网络与领域全集的主题覆盖率较大,能够有效简化技术网络中的技术主题,更加便于专家对技术主题进行归纳与总结。 展开更多
关键词 专利技术主题识别 核心专利集 专利筛选
在线阅读 下载PDF
基于C-value与TF-IDF的文献簇主题识别研究 被引量:11
11
作者 陈仕吉 王小梅 《情报学报》 CSSCI 北大核心 2009年第6期821-826,共6页
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此... 引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征。本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法。实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别。 展开更多
关键词 C-VALUE TF-IDF CV-IDF 引文分析 主题识别
在线阅读 下载PDF
改进卷积神经网络的文本主题识别算法研究 被引量:8
12
作者 邱宁佳 杨长庚 +1 位作者 王鹏 任涛 《计算机工程与应用》 CSCD 北大核心 2022年第2期161-168,共8页
针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法。将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理... 针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法。将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理;构建SECNN主题识别模型,使用SENet对卷积层输出的特征图进行权值的重标定,依靠其提升重要特征并抑制无用特征的性能,高效地进行主题识别;使用FDA评估样本的类别表征能力,提出FDA-SGD算法对模型参数进行调优,完成文本主题识别任务。使用新闻文本数据集验证改进算法的有效性,通过与传统模型对比表明,改进算法可以有效提高模型的收敛速度,具有较好的主题识别能力。 展开更多
关键词 主题识别 SENet 卷积神经网络 Word2vec 隐含狄利克雷分布(LDA)
在线阅读 下载PDF
基于异构信息网络融合的专利技术主题识别研究 被引量:14
13
作者 田鹏伟 张娴 《情报杂志》 CSSCI 北大核心 2021年第8期45-52,共8页
[目的/意义]利用异构信息网络融合建模开展专利技术主题识别方法研究,能有效提高专利技术主题识别的准确性。[方法/过程]利用文本挖掘技术提取专利技术主题构建共现网络,采用OVL算法及加权运算对异构信息网络进行融合,基于融合后的网络... [目的/意义]利用异构信息网络融合建模开展专利技术主题识别方法研究,能有效提高专利技术主题识别的准确性。[方法/过程]利用文本挖掘技术提取专利技术主题构建共现网络,采用OVL算法及加权运算对异构信息网络进行融合,基于融合后的网络开展主题识别。[结果/结论]以工业机器人领域为例的实证研究表明:与未经融合的关键词直接共现网络相比,基于融合网络的技术主题识别结果的主题内集中性更好、主题间区分度更显著、交叉性与重叠性更低。 展开更多
关键词 专利文献 专利技术 异构信息网络 网络融合 多元关系融合 主题识别
在线阅读 下载PDF
基于群体智慧的Web访问日志会话主题识别研究 被引量:5
14
作者 方奇 刘奕群 +2 位作者 张敏 茹立云 马少平 《中文信息学报》 CSCD 北大核心 2011年第1期35-40,共6页
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前... Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。 展开更多
关键词 会话主题识别 WEB访问日志
在线阅读 下载PDF
基于多重文本关系图中clique子团聚类的主题识别方法研究 被引量:4
15
作者 郭红梅 孔贝贝 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第5期433-442,共10页
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈... 在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。 展开更多
关键词 clique子团 多重文本关系 文本主题识别
在线阅读 下载PDF
嵌入社会感知的技术热点主题识别与发展态势分析——基于微信公众平台视域 被引量:10
16
作者 吴菲菲 童奕铭 黄鲁成 《现代情报》 CSSCI 2020年第3期47-57,共11页
[目的/意义]通过文献和专利进行文本挖掘获取技术热点主题的方法已逐步成熟,但相关研究未充分考虑社会公众对技术未来发展方向的影响。以社交媒体微信公众平台作为数据源,嵌入社会公众感知,可从更全面的视角识别技术热点主题并分析其发... [目的/意义]通过文献和专利进行文本挖掘获取技术热点主题的方法已逐步成熟,但相关研究未充分考虑社会公众对技术未来发展方向的影响。以社交媒体微信公众平台作为数据源,嵌入社会公众感知,可从更全面的视角识别技术热点主题并分析其发展态势。提出基于微信公众平台的技术热点主题识别与发展态势分析框架,弥补了现有方法未考虑社会公众对技术主题变化影响的不足。[方法/过程]首先,通过微信传播指数(WCI)筛选可用于技术热点主题识别的微信公众平台。其次,采用文本挖掘的方法,应用LDA主题模型提取技术主题。然后,结合社会感知识别技术热点,并利用IPA分析法分析技术主题的发展态势。最后,以石墨烯技术为例进行实证分析以检验方法的可实施性和效果。[结果/结论]识别出2015-2018年石墨烯技术热点,并结合社会感知视角定位出当前处于优势区、维持区、机会区、改进区的技术主题,实现对石墨烯技术热点的发展态势的分析与评价。 展开更多
关键词 微信公众平台 WCI 文本挖掘 社会感知 IPA分析 技术热点 主题识别 发展态势 石墨烯技术
在线阅读 下载PDF
基于动态主题网络的新兴技术主题识别——以氢燃料电池领域为例 被引量:7
17
作者 慎金花 王薇 +1 位作者 张更平 陈红艺 《情报杂志》 CSSCI 北大核心 2024年第9期92-100,共9页
[研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题... [研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题相似度矩阵绘制动态主题网络,识别具有创新性和连续性的主题为候选主题,评估候选主题的新颖性和影响力,确定新兴技术主题;以氢燃料电池领域为例进行实证检验。[研究结论]研究表明,SBERT-LDA-IPC模型提高了主题聚类的连贯性和准确性,结合国家在氢燃料电池产业发布的系列政策作为验证依据,识别出的三个新兴技术主题,与国家政策制定和产业发展方向一致。 展开更多
关键词 动态主题网络 主题演化 主题识别 专利信息 新兴技术 SBERT-LDA-IPC模型 氢燃料电池
在线阅读 下载PDF
多源信息视角下的多指标新兴技术主题识别研究——以智能网联汽车领域为例 被引量:31
18
作者 唐恒 邱悦文 《情报杂志》 CSSCI 北大核心 2021年第3期81-88,共8页
[目的/意义]为提高新兴技术主题识别的全面性、准确性,在专利、论文信息的基础上,融入舆情信息,提出一种复合型的新兴技术主题识别方法,以期能为微观层面新兴技术主题识别方法的研究提供参考。[方法/过程]面向专利、期刊论文、学位论文... [目的/意义]为提高新兴技术主题识别的全面性、准确性,在专利、论文信息的基础上,融入舆情信息,提出一种复合型的新兴技术主题识别方法,以期能为微观层面新兴技术主题识别方法的研究提供参考。[方法/过程]面向专利、期刊论文、学位论文、会议论文、舆情共5种不同的科技文献类型,运用LDA模型从多源异构文本中获取主题词,并进行融合分析,提取候选新兴技术主题;设计识别指标体系,弥补现有指标体系缺乏未来前景相应指标的不足;运用CRITIC法进行综合评价,确定最终的新兴技术主题。[结果/结论]以智能网联汽车为实验对象,成功识别出多传感器融合信息技术这项新兴技术,实验结果与业界分析保持一致,说明多源信息视角下的多指标新兴技术主题识别方法能有效地对多源异构文本开展新兴技术的主题识别。 展开更多
关键词 主题识别 新兴技术 LDA模型 智能网联汽车 EM CRITIC
在线阅读 下载PDF
面向网络评论的观点主题识别研究 被引量:2
19
作者 周杰 林琛 李弼程 《情报学报》 CSSCI 北大核心 2010年第5期858-863,共6页
网络评论的观点分析为及时掌握广大民众的真实观点提供了渠道。观点主题识别作为观点分析的重要组成部分,用以确定观点所指的对象。本文设计了一种领域无关的观点主题识别算法,该算法以网络评论中观点主题产生的方式为依据,采用由内到... 网络评论的观点分析为及时掌握广大民众的真实观点提供了渠道。观点主题识别作为观点分析的重要组成部分,用以确定观点所指的对象。本文设计了一种领域无关的观点主题识别算法,该算法以网络评论中观点主题产生的方式为依据,采用由内到外的识别过程,分四个部分完成观点主题识别:内部主题词识别、内部主题构建、外部主题识别和主题的组织。算法能够克服分词和短语类主题带来的影响,识别出语义完整的观点主题。对实际网络评论语料进行测试的结果表明,本文的算法能够有效地识别网络评论中的观点主题。 展开更多
关键词 中文信息处理 观点分析 网络评论 观点主题识别
在线阅读 下载PDF
开放式团队创新研讨主题识别方法及其可视化 被引量:2
20
作者 李欣苗 李靖 张朋柱 《系统管理学报》 CSSCI 北大核心 2015年第1期1-7,21,共8页
当前全球创新方向正在向开放式团队创新转变。开放式团队创新环境中,基于网络的电子研讨成为最基本、最重要的创新活动,及时准确地识别海量电子研讨信息的研讨主题,并通过可视化形象地展示给创新团队成员,对提高开放式团队创新的效率和... 当前全球创新方向正在向开放式团队创新转变。开放式团队创新环境中,基于网络的电子研讨成为最基本、最重要的创新活动,及时准确地识别海量电子研讨信息的研讨主题,并通过可视化形象地展示给创新团队成员,对提高开放式团队创新的效率和质量至关重要。针对传统主题挖掘研究中存在的主要问题,提出了开放式团队创新研讨主题识别方法。该方法在文档建模阶段提出并建立了基于团队创新研讨信息本体和研讨树结构的研讨文本语义计算方法;在研讨主题聚类阶段,针对开放式团队创新研讨的短文本特征,运用AntSA算法对研讨文本进行聚类分析;并通过计算聚类结果中每个节点名词的研讨主题标签贡献率,识别每个类别的研讨主题。最后,根据所提出的开放式团队创新研讨主题识别方法,设计和开发了开放式团队创新研讨主题可视化系统,识别并直观显示各研讨主题间的语义关系和结构关系,并对其进行了实验研究。 展开更多
关键词 开放式团队创新 团队创新研讨 主题识别 短文本聚类 可视化
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部