期刊文献+
共找到314篇文章
< 1 2 16 >
每页显示 20 50 100
融合网络结构特征的学科新兴主题识别方法研究
1
作者 杨金庆 罗曼 +2 位作者 程秀峰 夏立新 马廷灿 《情报学报》 北大核心 2025年第6期645-659,共15页
学科新兴主题识别是及时发现科技创新发展动态、追踪学科发展趋势的有效方法。学科新兴主题的涌现是一个复杂的过程,不仅受科学交流过程的影响还受网络自组织过程的影响。学科新兴主题的网络结构在一定程度上嵌入了其特有性质。本文在... 学科新兴主题识别是及时发现科技创新发展动态、追踪学科发展趋势的有效方法。学科新兴主题的涌现是一个复杂的过程,不仅受科学交流过程的影响还受网络自组织过程的影响。学科新兴主题的网络结构在一定程度上嵌入了其特有性质。本文在常见科学交流属性特征的基础上,融合学科主题在网络中的全局和局部网络结构特征,通过随机匹配生成标准实验数据集,先后运用多指标加权融合方法与机器学习分类方法识别学科新兴主题。研究结果表明,多指标加权融合方法对识别影响力排序靠前的学科主题表现较好。但是,P@270高影响力主题仅占60%,低于随机森林分类识别模型的最优性能64.14%,这表明机器学习分类识别方法在拟合复杂过程方面具有优势,而多指标加权融合方法更适用于关注顶尖影响力主题的任务。机器学习可解释分析结果表明,吸纳引用频次较多、网络影响力较高、论文发表较多、关注作者影响力与期刊影响力较强对高影响力主题识别起正向作用;与之相反,结构突变程度高对学科新兴主题识别有负向作用。 展开更多
关键词 学科新兴主题 主题网络 科技创新 科技情报
在线阅读 下载PDF
基于LDA算法的关键共性技术识别研究——以智能纺织领域为例
2
作者 许菱 郑婧然 +2 位作者 王耀刚 张克 朱文兴 《现代纺织技术》 北大核心 2025年第8期10-18,共9页
关键共性技术研究是推进国家制造业创新发展的重要支撑,准确识别关键共性技术成为推动产业转型升级的一大助力。以专利数据为基础,运用LDA主题模型挖掘出隐藏的高强度技术主题,通过共现率指标评估技术主题的共现程度,以此归纳出共性技... 关键共性技术研究是推进国家制造业创新发展的重要支撑,准确识别关键共性技术成为推动产业转型升级的一大助力。以专利数据为基础,运用LDA主题模型挖掘出隐藏的高强度技术主题,通过共现率指标评估技术主题的共现程度,以此归纳出共性技术。在此基础上,运用网络分析方法,结合度中心性、接近中心性以及结构洞3个拓扑指标将各技术主题的关键程度进行量化分析,进一步识别出关键共性技术。研究发现:智能纺织领域的关键共性技术主要包含在工艺材料、工艺流程和工艺设备中;石墨烯纤维、柔性纳米纤维、聚氨酯整理剂等是工艺材料中的关键共性技术;智能缝纫技术、超疏水涂层技术、水凝胶导电技术等是工艺流程中的关键共性技术;传感器是工艺设备中的关键共性技术。研究结果可对纺织服装产业的技术创新有一定的促进作用。 展开更多
关键词 关键共性技术 LDA主题模型 社会网络分析 智能纺织
在线阅读 下载PDF
融合LDA-BN的船舶碰撞事故致因分析
3
作者 邵波 刘巧 +2 位作者 柯善钢 郑霞忠 贺语琴 《安全与环境学报》 北大核心 2025年第1期157-164,共8页
为探究船舶碰撞事故致因及其关系,提升航运安全管理水平,研究提出融合狄利克雷分布(Latent Dirichlet allocation,LDA)与贝叶斯网络(Bayesian Network,BN)的船舶碰撞事故致因分析方法。首先,运用LDA主题模型挖掘361份船舶碰撞事故调查报... 为探究船舶碰撞事故致因及其关系,提升航运安全管理水平,研究提出融合狄利克雷分布(Latent Dirichlet allocation,LDA)与贝叶斯网络(Bayesian Network,BN)的船舶碰撞事故致因分析方法。首先,运用LDA主题模型挖掘361份船舶碰撞事故调查报告,提取27个事故致因主题;其次,利用事故树方法厘清调查报告中致因间的影响关系,构建事故致因贝叶斯网络结构,使用期望最大化算法进行贝叶斯网络参数学习,确定各节点的条件概率,构建事故致因贝叶斯网络模型;最后,通过逆向推理分析、最大致因链分析及敏感性分析,找出导致船舶碰撞事故发生的主要致因因素。结果显示:安全管理不到位、疏忽瞭望、事发水域通航环境复杂是引发船舶碰撞事故可能性大的致因,航线保持不当、应急处置不当、违规穿越锚地是导致船舶碰撞事故发生的最敏感致因因素。 展开更多
关键词 安全社会工程 船舶碰撞 狄利克雷分布主题模型 贝叶斯网络 事故致因
在线阅读 下载PDF
主题模型网络分析:计算传播视野下的舆情文本挖掘新进路
4
作者 张媛 刘兴澳 《情报杂志》 北大核心 2025年第5期122-129,共8页
[研究目的]旨在提出一种新的复杂文本挖掘方法——“主题模型网络分析”(ANTMN),以解决传统舆情文本挖掘方法在动机过强、人工介入过多、主题粗糙等方面的局限,为舆情治理、风险识别和舆论引导提供有效的方法支持。[研究方法]通过文献... [研究目的]旨在提出一种新的复杂文本挖掘方法——“主题模型网络分析”(ANTMN),以解决传统舆情文本挖掘方法在动机过强、人工介入过多、主题粗糙等方面的局限,为舆情治理、风险识别和舆论引导提供有效的方法支持。[研究方法]通过文献梳理分析传统方法的局限性及计算转向的学术进展,通过比较分析论证ANTMN较之现有方法的创新优势。[研究结果/结论]研究发现,ANTMN遵循“主题建模”“网络分析”与“社区检测”的三步法,以“纯归纳取向”获得客观性,以“混合计算取向”超越传统方法的静态局限。ANTMN还在舆情传播研究中表现出较强的实践应用价值,即在经验现象中提出舆情传播问题、在数据驱动中解析舆情传播机制、在趋势预测中建构舆情传播体系。 展开更多
关键词 舆情传播 主题模型网络分析 舆情文本挖掘 计算传播
在线阅读 下载PDF
基于改进标签传播算法的舆情社交网络社区发现
5
作者 钱晓东 王卓 《计算机应用研究》 北大核心 2025年第1期48-55,共8页
通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点... 通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点影响力的大小更新标签。实验结果表明,该方法在最好情况下(k=0.9)相较于原算法,在稳定性和模块度指标两方面分别提高了31%和78%,并且优于其他几种改进算法。由此可见,该算法相较于原算法及其他改进算法在舆情社交网络的主题社区发现中表现更好。 展开更多
关键词 标签传播算法 舆情社交网络 HK模型 主题社区发现
在线阅读 下载PDF
民航管制运行风险主题发现及演化趋势
6
作者 张洪海 戴一鸣 +2 位作者 刘文泉 石宗北 李一可 《科学技术与工程》 北大核心 2025年第17期7417-7429,共13页
空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet ... 空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet allocation,LDA)风险主题发现模型挖掘的风险主题和关键词进行分析,明确管制运行风险主题及不同风险主题间相互演化规律;针对风险主题关键词,构建了民航管制运行领域的基于BERT(bidirectional encoder representation from Transformers)模型的语义网络,分析风险主题相互关联的风险特征,得出风险主题间潜在关系,可为关键词间关联度的量化提供一定理论依据;促进民航管制运行安全风险的数字化呈现的发展,挖掘管制不安全信息,为准确感知管制运行风险奠定基础。 展开更多
关键词 空中交通管理 管制运行安全 风险管理 LDA主题模型 语义网络
在线阅读 下载PDF
新能源汽车轮毂造型感性意象预测研究
7
作者 孙利 张宇彤 +2 位作者 吴俭涛 覃忠志 晁佳媛 《机械设计》 北大核心 2025年第9期203-211,共9页
为改善当前新能源汽车(new energy vehicle, NEV)轮毂造型设计中情感意象预测精度,提出一种基于感性工学(kansei engineering, KE)的预测模型构建方法。收集NEV轮毂样本,采用造型分析法解构轮毂造型特征;采用词对主题模型(biterm topic ... 为改善当前新能源汽车(new energy vehicle, NEV)轮毂造型设计中情感意象预测精度,提出一种基于感性工学(kansei engineering, KE)的预测模型构建方法。收集NEV轮毂样本,采用造型分析法解构轮毂造型特征;采用词对主题模型(biterm topic model, BTM)从在线评论文本数据中深入挖掘用户感性意象,通过层次分析法(analytic hierarchy process, AHP)提取代表性感性语汇;基于反向传播神经网络(back propagation neural network, BPNN)构建关联模型,捕捉轮毂造型特征与感性意象间的非线性关系,并引入粒子群优化算法(particle swarm optimization, PSO)和遗传算法(genetic algorithm, GA)分别优化BPNN预测性能;通过误差比较法对不同模型预测效果进行评估。结果表明:PSO-BPNN在预测精度、鲁棒性等方面均优于BPNN和GA-BPNN,可有效提升造型意象预测精度,为NEV轮毂的情感化设计提供理论依据和创新路径。 展开更多
关键词 汽车轮毂 造型设计 感性意象预测 词对主题模型 反向传播神经网络 粒子群优化算法
在线阅读 下载PDF
基于混沌理论和专利挖掘的技术不连续演化特征研究
8
作者 任海英 梁宇航 《情报杂志》 北大核心 2025年第4期181-189,共9页
[研究目的]针对技术不连续演化定量研究的不足,结合混沌理论与专利挖掘方法,揭示技术不连续演化的混沌特征,在技术不连续演化阶段为技术预测提供混沌分析视角。[研究方法]以语音识别技术为例,首先检索专利数据并构建申请数据时间序列,... [研究目的]针对技术不连续演化定量研究的不足,结合混沌理论与专利挖掘方法,揭示技术不连续演化的混沌特征,在技术不连续演化阶段为技术预测提供混沌分析视角。[研究方法]以语音识别技术为例,首先检索专利数据并构建申请数据时间序列,通过关联维数和李亚普洛夫指数识别技术演化系统的混沌特征及其局部混沌期。之后,对不同时间窗口的数据构建LDA主题模型和共词网络,分析技术主题及相关节点在局部混沌期前、中、后的演化特征,并预测潜在新兴技术。[研究结果/结论]实验结果表明,语音识别技术演化过程中,技术不连续演化阶段与局部混沌期高度重合,为“混沌是技术不连续演化的内在特征”提供实证依据。此外,新兴技术在局部混沌期内产生,并表现为技术主题的稳定发展和相关节点中心性的提升。不仅反映新兴技术对语音识别技术系统的深远影响,而且揭示其未来演化方向。 展开更多
关键词 混沌理论 专利文本 专利挖掘 技术演化 主题模型 共词网络 语音识别技术 关联维数 李亚普洛夫指数
在线阅读 下载PDF
基于语义加权网络的重点领域科学基金资助态势识别研究 被引量:1
9
作者 王伟 梁继文 杨建林 《现代情报》 北大核心 2025年第1期46-59,111,共15页
[目的/意义]科学基金制度是各国(地区)提升科学研究水平的重要方式,准确识别科学基金的资助方向和资助成效是感知科技发展态势的关键。[方法/过程]为识别科学基金资助态势,在提出关键短语抽取规则后,利用语义相似度消除同、近义词的歧... [目的/意义]科学基金制度是各国(地区)提升科学研究水平的重要方式,准确识别科学基金的资助方向和资助成效是感知科技发展态势的关键。[方法/过程]为识别科学基金资助态势,在提出关键短语抽取规则后,利用语义相似度消除同、近义词的歧义影响,利用动态滑动窗口和语义相似度构建语义加权的词共现网络,并基于社团划分方法识别基金主题。在集成电路领域比较1812项中国国家自然科学基金和2807项美国国家科学基金的资助主题分布、资助力度变化和资助效果,该方法能够准确识别基金主题分布和资助成效。[结果/结论]中国国家自然科学基金和美国国家科学基金均涵盖了集成电路领域的主要研究主题,在重点资助方向和资助力度上有较大差异;中国国家自然科学基金资助的论文平均被引频次相对较低,受资助机构相对单一。 展开更多
关键词 科学基金 资助态势 社团划分 词共现网络 主题分析 集成电路
在线阅读 下载PDF
基于复杂网络的工程项目组织脆弱性传递机制研究
10
作者 张雨果 王文顺 +4 位作者 芈凌云 乔丽洁 陶旻 王莉 蔡晓宏 《铁道科学与工程学报》 北大核心 2025年第4期1788-1801,共14页
为系统识别危害工程项目安全的组织脆弱性因素,揭示组织脆弱性在工程项目组织内部的复杂传递规律,进而阻断其传递链路以提升项目安全绩效。以公开披露的中国工程建设领域2013—2023年事故调查报告为数据基础,首先采用基于BERTopic的主... 为系统识别危害工程项目安全的组织脆弱性因素,揭示组织脆弱性在工程项目组织内部的复杂传递规律,进而阻断其传递链路以提升项目安全绩效。以公开披露的中国工程建设领域2013—2023年事故调查报告为数据基础,首先采用基于BERTopic的主题建模技术与专家访谈法,系统识别出工程项目组织的整体脆弱性特征;其次,通过构建融合工程项目组织与脆弱性因素的超邻接矩阵,搭建出工程项目组织脆弱性的双层网络模型;最后,基于该模型,从网络节点与路径出发,分析网络模型的网络密度、节点度数、PageRank与边权强度等指标,进而解析出工程项目组织脆弱性的关键传递方向、路径及强度。研究结果表明:在因素识别方面,工程项目组织脆弱性主要由要害治理不足、风险洞察力缺失、组织规划能力弱等25个因素组成;在脆弱性隶属关系方面,总包单位的脆弱性因素最多,其次是分包单位、监理单位、建设单位、设计单位与勘察单位;在脆弱性传递方面,总包单位、建设单位与监理单位在脆弱性传递中具有关键主导作用。其中,监理单位与建设单位的脆弱性所引发的多轮传递过程最为显著;在脆弱性治理方面,风险洞察力缺失、组织安全职责缺失、风险化解力不足等因素是导致脆弱性传递的重要根源并亟需重点防控。研究结果不仅在理论上揭示了工程项目组织脆弱性传递机制,还在实践中为精准化解工程项目组织脆弱性提供了重要的干预靶点。 展开更多
关键词 组织脆弱性 传递机制 工程项目 复杂网络 主题建模
在线阅读 下载PDF
数字治理学术话语与政策话语的变迁和比较 被引量:1
11
作者 贾淑莹 陈启明 +1 位作者 周雨婧 杨超 《图书馆论坛》 北大核心 2025年第2期101-115,共15页
文章基于话语分析方法,依托数字治理生态理论,从学术话语与政策话语两个维度,探究数字治理话语建构过程。首先,确定数字治理领域核心关键词,采集数字治理政策与学术文献并提取文本中话语元素。其次,基于话语网络分析学术与政策话语在萌... 文章基于话语分析方法,依托数字治理生态理论,从学术话语与政策话语两个维度,探究数字治理话语建构过程。首先,确定数字治理领域核心关键词,采集数字治理政策与学术文献并提取文本中话语元素。其次,基于话语网络分析学术与政策话语在萌芽期、发展期、深耕期、成熟期的核心议题与变迁趋势。最终,构建综合趋势图,结合数字治理生态论进一步辨析比较二者关系,识别交互作用机制及中国数字治理生态演变路径。研究发现:在发展趋势、议题内容、关注领域具有一致性的同时,变迁过程中学术话语具有理论先行性,但实践过程中形成以政策话语为中心、学术话语为充实、二者互相参照的互动机制。研究识别了学术话语和政策话语互动的4个阶段并与数字治理生态理论相互印证。 展开更多
关键词 数字治理 学术话语 政策话语 文献计量 主题网络
在线阅读 下载PDF
基于双向图注意力网络的潜在热点话题谣言检测 被引量:1
12
作者 李劭 蒋方婷 +1 位作者 杨鑫岩 梁刚 《计算机科学》 北大核心 2025年第3期277-286,共10页
现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言... 现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言的传播特征时,现有方法大多侧重于谣言传播过程中的静态特征,难以充分利用节点间的动态关系对复杂的传播过程进行表征,导致性能提升存在瓶颈。针对以上问题,文中提出了一种基于潜在热点话题和图注意力神经网络的谣言检测方法,该方法采用神经主题模型和潜在热点话题发现模型进行话题级别的谣言检测以克服冷启动问题,并设计了一个基于双向图注意力神经网络的检测模型TPC-BiGAT,分析谣言话题传播过程中的动态特征以进行谣言真实性检测。在3个公开数据集上进行了多次实验证明,该方法在准确率上较现有方法取得了3%~5%的显著提升,验证了所提方法的有效性。 展开更多
关键词 谣言检测 社交网络 潜在热点话题 图神经网络 主题聚类
在线阅读 下载PDF
中国统计学者在国际统计学领域的学术论文发表情况分析
13
作者 何辰轩 王菲菲 +1 位作者 朱利平 袁卫 《统计研究》 北大核心 2025年第4期150-156,共7页
统计学现已独立于数学和经济学,正式成为一级学科。近20年来我国统计学领域的研究工作飞速发展,我国的统计学者在国际统计学领域参与发表的高水平论文大量涌现。本文从国际统计学领域4个高水平学术期刊的论文发表情况视角,分析过去20年... 统计学现已独立于数学和经济学,正式成为一级学科。近20年来我国统计学领域的研究工作飞速发展,我国的统计学者在国际统计学领域参与发表的高水平论文大量涌现。本文从国际统计学领域4个高水平学术期刊的论文发表情况视角,分析过去20年我国统计学者的学术文章发表数量、研究主题演变以及合作关系,进而探讨我国统计学者的科学研究情况。与此同时,通过分析世界知名高校统计院系中担任教职的华人学者的教育背景,进一步研究我国统计学领域的人才培养情况。 展开更多
关键词 统计学史 学术论文发表 主题模型 合作网络
在线阅读 下载PDF
基于动态价值与多层网络的关键核心技术识别
14
作者 唐健廷 吴洁 谢小东 《情报杂志》 北大核心 2025年第8期136-145,共10页
[研究目的]在关键核心技术识别过程中考虑动态价值特征和价值的跨层传递,以提高识别过程的有效性及合理性。[研究方法]构建“发明人-技术主题-IPC”三层异构网络,结合时间价值函数、时间稳定性因子与Attention_LSTM模型得到节点的历史... [研究目的]在关键核心技术识别过程中考虑动态价值特征和价值的跨层传递,以提高识别过程的有效性及合理性。[研究方法]构建“发明人-技术主题-IPC”三层异构网络,结合时间价值函数、时间稳定性因子与Attention_LSTM模型得到节点的历史价值序列与未来价值序列,利用ML-Rank算法实现发明人与IPC节点对技术主题的跨层价值传递,根据技术主题的最终价值度排序识别关键核心技术。最后通过技术主题情况、价值度贡献情况与核密度统计,对识别结果展开分析和验证。[研究结果/结论]结果表明,所识别的技术具有复杂性、垄断性和累计投入性等关键核心技术特征,识别方法具有较好的有效性及合理性。 展开更多
关键词 关键核心技术 技术主题 价值度 动态价值 多层网络 跨层传递 技术识别
在线阅读 下载PDF
一种并发漏洞主题建模与分析方法
15
作者 薄莉莉 胡宇飞 +1 位作者 刘静 孟醒 《小型微型计算机系统》 北大核心 2025年第10期2502-2507,共6页
传统的主题模型在训练过程中仅利用了单个文档内词语的相互关系,未能充分利用与该文档主题相关的其他文档和词语信息.工作提出了一种基于图注意力网络的并发漏洞文档间主题建模方法(GATTM),旨在捕捉并发漏洞文档间的相关性,克服了传统... 传统的主题模型在训练过程中仅利用了单个文档内词语的相互关系,未能充分利用与该文档主题相关的其他文档和词语信息.工作提出了一种基于图注意力网络的并发漏洞文档间主题建模方法(GATTM),旨在捕捉并发漏洞文档间的相关性,克服了传统方法的局限性.该方法将并发漏洞语料库中文档和词语表示为文档关系图,并引入了注意力机制,强化了节点特征表示,并通过聚合文档邻接节点信息来识别主题分布.通过所构建的数据集进行对比实验,GATTM在主题建模中的性能表现优于其他常见方法,能够深入探讨并发漏洞数据集中受用户欢迎和困惑程度较高的主题.通过分析主题难度和流行度,提升了Stack Overflow用户的指导效率和问题解决准确性. 展开更多
关键词 主题模型 并发漏洞 神经网络
在线阅读 下载PDF
智慧高速公路系统本质安全化评价指标体系
16
作者 ZOU Patrick X W 梁琨昊 《中国安全科学学报》 北大核心 2025年第9期28-35,共8页
为提升智慧高速公路本质安全水平,提出一种基于潜在狄利克雷分布(LDA)主题模型的智慧高速公路本质安全评价指标识别方法。界定智慧高速公路本质安全内涵,基于我国15个省市智慧高速公路建设指南文本,应用词频-逆文档频率(TF-IDF)算法和LD... 为提升智慧高速公路本质安全水平,提出一种基于潜在狄利克雷分布(LDA)主题模型的智慧高速公路本质安全评价指标识别方法。界定智慧高速公路本质安全内涵,基于我国15个省市智慧高速公路建设指南文本,应用词频-逆文档频率(TF-IDF)算法和LDA主题模型提取语料主题及关键词,结合相关文献规范及专家访谈和评价,构建智慧高速公路本质安全评价指标体系,该体系涵盖安全感知与监测能力、交通运行安全保障能力、安全决策支持能力、系统与设备可靠性4个一级指标及15个二级指标,并阐释各二级指标内涵;应用网络层次分析法(ANP)揭示智慧高速公路本质安全评价指标间的交互关系,运用Super Decision软件确定各级评价指标的权重。研究结果表明:数据传输可靠性、机电设备运行可靠性、安全风险预测与评估能力等指标对智慧高速公路本质安全水平的影响最为显著。所构建的方法能够高效地从文本中挖掘出有效数据信息,提升本质安全评价的客观性与准确性,从而为智慧高速公路本质安全设计与管理提供指导。 展开更多
关键词 智慧高速公路 本质安全 评价指标体系 潜在狄利克雷分布(LDA)主题模型 网络层次分析法(ANP)
在线阅读 下载PDF
基于TC-LDA模型的电信网络诈骗案件主题挖掘与演化
17
作者 许根玮 冯文刚 《情报杂志》 北大核心 2025年第10期86-96,共11页
[研究目的]在电信网络诈骗案件频发且手段不断升级的背景下,探索电信网络诈骗案件的主题聚类及演化趋势,旨在为政府高效、精准决策提供科学支持。[研究方法]基于某发达省份近两年全量电信网络诈骗案件数据,构建TC-LDA模型,挖掘电信网络... [研究目的]在电信网络诈骗案件频发且手段不断升级的背景下,探索电信网络诈骗案件的主题聚类及演化趋势,旨在为政府高效、精准决策提供科学支持。[研究方法]基于某发达省份近两年全量电信网络诈骗案件数据,构建TC-LDA模型,挖掘电信网络诈骗案件的主题特征并揭示其演化趋势,为政府部门电信网络诈骗提出针对性治理策略。[研究结果/结论]现有电信网络诈骗案件具有14类主题特征,可以进一步归纳为4个主题类别;已有案件表现出发展化、科技化、集中化的演化趋势。并针对结果提出了加强治理、提升科技化、推广集中化打击模式和建立反诈更新机制的对策,为提升我国电信网络诈骗防范治理能力提供了思路。 展开更多
关键词 电信网络诈骗 TC-LDA模型 打击治理 主题挖掘 演化分析
在线阅读 下载PDF
面向多标签隐性知识的文本数据挖掘算法
18
作者 邓乔夫 李骁娅 郭校君 《沈阳工业大学学报》 北大核心 2025年第5期594-601,共8页
【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知... 【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知识的数据挖掘算法,以提升文本分类的准确性和数据挖掘的效率。【方法】针对多标签文本数据中隐性知识的显性化问题,基于SECI理论对文本信息中的隐性知识进行显性化转换,并利用循环神经网络的短时记忆能力提高隐性知识的转换效率。在此基础上,考虑到文本信息的复杂性,分别从局部特征和全局特征两个维度进行分析,并采用特征融合策略提高数据挖掘的准确性。由于文本信息前后文关联性较强,利用基于长短期记忆网络(LSTM)模型的门控机制,提取文本的上下文信息,以捕捉文本中的序列依赖关系;采用潜在狄利克雷分配(LDA)模型,对文本的主题结构进行建模,从而避免因人工标注标准差异导致的模型训练偏差;通过特征拼接的方式,并结合LDA主题模型和LSTM模型提取的局部及全局特征,以降低特征提取过程中信息丢失的风险;引入主题控制器,通过缩小推理范围,提高文本特征提取的有效性;构建基于高斯解码器的上下文主题层,计算词汇在特定主题下的条件概率矩阵,并利用高斯混合解码器优化文本主题建模,提高文本内容的扩充能力;使用Softmax函数计算各标签的概率,实现多标签文本分类。【结果】对比实验中,使用困惑度作为模型训练的评估指标。结果表明,本文模型的困惑度优于对照组(LDA主题模型与LSTM模型),验证了LDA与LSTM结合的特征拼接策略可有效发挥两种模型的优势。此外,与NVDM、LSTM、LDA和VAETM模型进行对比,以准确率和查全率为评估指标,本文模型在准确率和查全率方面分别提升了5.05%和2.75%,表明其在多标签文本分类任务中的有效性与优越性。【结论】对比实验结果表明,本文模型能够显著提升文本分类的性能,相比LDA主题模型和LSTM模型,在处理多标签文本时表现更优;能够高效挖掘多标签文本数据中的隐性知识,为文本分类、语义分析和信息检索等任务提供了一种高效、精准的解决方案。 展开更多
关键词 多标签文本 深度主题特征提取模型 隐性知识 循环神经网络 LSTM神经网络 LDA主题模型 特征拼接 高斯解码器
在线阅读 下载PDF
基于iTopicModel的关联文本分类算法
19
作者 梁鹏鹏 柴玉梅 王黎明 《计算机工程》 CAS CSCD 北大核心 2011年第21期124-125,130,共3页
针对传统文本分类方法对文档间关联关系考虑不充分的问题,提出一种基于iTopicModel的关联文本分类算法。根据类信息已知的文档归属于各个主题的概率判断主题代表的类信息,利用待分类文档归属于各个主题的概率及文本信息对文档进行分类... 针对传统文本分类方法对文档间关联关系考虑不充分的问题,提出一种基于iTopicModel的关联文本分类算法。根据类信息已知的文档归属于各个主题的概率判断主题代表的类信息,利用待分类文档归属于各个主题的概率及文本信息对文档进行分类。实验结果表明,当文档间的关联关系对类信息影响较大时,TC-iTM的分类性能优于传统文本分类方法。 展开更多
关键词 文本分类 文档网络 主题模型 EM算法
在线阅读 下载PDF
基于动态主题网络的新兴技术主题识别——以氢燃料电池领域为例 被引量:7
20
作者 慎金花 王薇 +1 位作者 张更平 陈红艺 《情报杂志》 CSSCI 北大核心 2024年第9期92-100,共9页
[研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题... [研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题相似度矩阵绘制动态主题网络,识别具有创新性和连续性的主题为候选主题,评估候选主题的新颖性和影响力,确定新兴技术主题;以氢燃料电池领域为例进行实证检验。[研究结论]研究表明,SBERT-LDA-IPC模型提高了主题聚类的连贯性和准确性,结合国家在氢燃料电池产业发布的系列政策作为验证依据,识别出的三个新兴技术主题,与国家政策制定和产业发展方向一致。 展开更多
关键词 动态主题网络 主题演化 主题识别 专利信息 新兴技术 SBERT-LDA-IPC模型 氢燃料电池
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部