期刊文献+
共找到1,770篇文章
< 1 2 89 >
每页显示 20 50 100
基于Web Mining的智能化、个性化的远程教育模型研究 被引量:30
1
作者 汪启军 申瑞民 《计算机工程》 CAS CSCD 北大核心 2000年第12期157-159,共3页
该文提出了一个新的基于Web Mining的远程教育模型,它能够充分利用站点上积累下来的信息,更好地用于远程教学。
关键词 远程教育 智能化 个性化 web INTERNET网
在线阅读 下载PDF
基于Web Mining的推荐系统 被引量:2
2
作者 唐哲 丁二玉 +1 位作者 骆斌 陈世福 《计算机科学》 CSCD 北大核心 2005年第12期193-196,共4页
推荐系统(Recommender System)被电子商务站点用来向顾客提供信息以帮助顾客选择产品,其基本思想是以统计结果或者顾客以前的行为记录为依据,推测顾客未来可能的行为并给出相应的推荐。本文对基于传统技术和Web mining技术的推荐系统进... 推荐系统(Recommender System)被电子商务站点用来向顾客提供信息以帮助顾客选择产品,其基本思想是以统计结果或者顾客以前的行为记录为依据,推测顾客未来可能的行为并给出相应的推荐。本文对基于传统技术和Web mining技术的推荐系统进行了简要综述,同时描述了基于Web mining技术的推荐系统的工作流程,重点分析了应用于推荐系统的各种具体Web mining技术及其算法比较。 展开更多
关键词 推荐系统 web mining
在线阅读 下载PDF
基于Web-Log Mining的Web文档聚类 被引量:29
3
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期99-104,共6页
速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(re... 速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(recursive density based clustering algorithm,简称RDBC),此算法可以智能地、动态地修改其密度参数.RDBC是基于DBSCAN的一种改进算法,其运算复杂度和DBSCAN相同.通过在Web文档上的聚类实验,结果表明,RDBC不但保留了DBSCAN高速度的优点,而且聚类效果大大优于DBSCAN. 展开更多
关键词 数据库 聚类 数据挖掘 web 文档 web-Logmining
在线阅读 下载PDF
基于Web-Log Mining的N元预测模型 被引量:14
4
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期136-141,共6页
随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请... 随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请求进行预测.这种模型会选择性地对用户可预测的请求进行预测,从而大大提高了预测精度.实验证明,在自然语言中普遍适用的N元预测模型同样适用于网页预测.同时,采用了一种有效的简化手段,大大压缩了模型的大小,使得5元模型和传统的2元模型大小基本相同,而预测精度提高了1倍.该结果可以广泛地运用到Web上,包括网页的预发送、预取、推荐以及Web上的caching机制.试验是建立在真实的Web日志上的,该算法无论在预测精度上还是在可适用度上都优于以往的算法. 展开更多
关键词 数据挖掘 INTERNET web-Logmining N元预测模型 网页
在线阅读 下载PDF
基于Web-LogMining寻找目标网页最优期望定位 被引量:1
5
作者 丛蓉 王秀坤 +1 位作者 吴军 周岩 《计算机工程与应用》 CSCD 北大核心 2004年第34期151-153,178,共4页
为了优化网站的访问效能,实现网站实际结构与用户的使用行为相吻合,该文主要应用Web挖掘技术,以网站的服务器Web日志作为数据源,使用算法FEL和算法CRLL从用户访问事务序列中寻找目标网页的期望定位,并以最少“后退”次数为原则生成推荐... 为了优化网站的访问效能,实现网站实际结构与用户的使用行为相吻合,该文主要应用Web挖掘技术,以网站的服务器Web日志作为数据源,使用算法FEL和算法CRLL从用户访问事务序列中寻找目标网页的期望定位,并以最少“后退”次数为原则生成推荐链接列表。网站设计者可根据该列表,修改网页之间的链接关系,达到减少对目标网页搜索时间的目的。 展开更多
关键词 web挖掘 web文件 目标网页 期望定位
在线阅读 下载PDF
多维深度导向的Java Web模糊测试方法 被引量:3
6
作者 王鹃 龚家新 +1 位作者 蔺子卿 张晓娟 《信息网络安全》 CSCD 北大核心 2024年第2期282-292,共11页
随着Java Web的广泛应用,其安全问题日益突出。模糊测试作为一种有效的漏洞挖掘方法,目前已经被用于Java漏洞的检测。然而,由于Java Web应用代码规模庞大、业务逻辑复杂,现有的漏洞挖掘工具在模糊测试中存在随机性高、代码检测深度低的... 随着Java Web的广泛应用,其安全问题日益突出。模糊测试作为一种有效的漏洞挖掘方法,目前已经被用于Java漏洞的检测。然而,由于Java Web应用代码规模庞大、业务逻辑复杂,现有的漏洞挖掘工具在模糊测试中存在随机性高、代码检测深度低的问题,导致漏洞挖掘的准确率较低。因此,文章提出基于多维深度导向的Java Web模糊测试方法。该方法使用Jimple作为待测Java Web应用字节码的三地址码中间表示,并生成代码对应的函数间调用图和函数内控制流图,在此基础上分析每个基本块的多维深度。同时,根据多维深度和模糊测试执行时间优化模糊测试指导策略,设计相应的输入结构解析策略、能量分配策略和变异算法调度策略,提升模糊测试的准确性。实验结果表明,相较于现有的模糊测试工具Peach和Kelinci,该方法能够在性能消耗较低的情况下取得更好的漏洞检测效果。 展开更多
关键词 模糊测试 Java web 漏洞挖掘
在线阅读 下载PDF
中文Web文本挖掘系统WebTextMiner开发 被引量:1
7
作者 魏松 钟义信 王翔英 《计算机应用研究》 CSCD 北大核心 2006年第6期211-213,共3页
W eb文本挖掘系统的开发对W eb文本挖掘的研究有着很大的推进作用。因此在对基于SVM的中文网页分类器性能研究的基础上,根据研究和实用的需要,实现了一个性能较好的中文W eb文本挖掘系统。
关键词 web文本挖掘 支持向量机 K-最近邻
在线阅读 下载PDF
一种灵活高效的增量式Web平行语料抽取方法
8
作者 刘小峰 郑禹铖 李东阳 《计算机科学》 CSCD 北大核心 2024年第11期248-254,共7页
从Web中抽取平行语料对于机器翻译和其他多语语言处理任务来说非常重要,由此提出了一种从Web中灵活高效地增量抽取平行语料的方法,通过持续地对Common Crawl的Web抓取存档进行下载、扫描和分析统计,增量更新域名下的语言文本长度统计数... 从Web中抽取平行语料对于机器翻译和其他多语语言处理任务来说非常重要,由此提出了一种从Web中灵活高效地增量抽取平行语料的方法,通过持续地对Common Crawl的Web抓取存档进行下载、扫描和分析统计,增量更新域名下的语言文本长度统计数据。对于任意给定的感兴趣目标语言对,抽取方法基于域名下的语言文本长度统计数据确定抓取网站入口,并根据目标语言进行定向抓取,忽略多语域名和目标语言外的链接。此外还提出了一种在多语域名内基于语义相似性进行全局对齐的新的句子对齐方法。实验表明,增量抽取能够持续不断地获得新的平行语料,根据指定的语言对进行抽取,可以灵活地获得感兴趣的目标语言对平行语料;新的对齐方法在对齐效率上明显优于全局方法,且能完成局部方法无法完成的对齐;在6个语言方向中,抽取到的平行语料在4个中低资源语言方向的质量优于现有Web开源平行语料,在2个高资源语言方向的质量接近现有最好的Web开源平行语料。 展开更多
关键词 平行语料抽取 句子对齐 语料库构建 机器翻译 web挖掘
在线阅读 下载PDF
基于文本挖掘的我国航空安全政策研究 被引量:1
9
作者 李柯 张世豪 罗帆 《中国安全生产科学技术》 北大核心 2025年第3期195-200,共6页
为探究我国航空安全政策制定现状及完善方向,采用文本挖掘方法对航空安全政策开展共词分析、聚类分析和多元尺度分析,总结当前政策关注的主要内容及侧重点。研究结果表明:应急救援、航空运输、安全运营、民用航空器的适航管理、机场及... 为探究我国航空安全政策制定现状及完善方向,采用文本挖掘方法对航空安全政策开展共词分析、聚类分析和多元尺度分析,总结当前政策关注的主要内容及侧重点。研究结果表明:应急救援、航空运输、安全运营、民用航空器的适航管理、机场及相关机构的安全管理为当前政策关注焦点;针对通用机场已初步建立分类分级的运行管理体系,新修订的有关航空运输的法律规章基本满足当前业务发展新需求;立足现实需求,民用航空器领域的法制建设尚不成熟,航空应急救援体系和安全运营体系尚需完善。研究结果可为航空安全政策完善提供理论参考。 展开更多
关键词 航空安全政策 文本挖掘 量化分析
在线阅读 下载PDF
基于特征表示深度学习的政策精准推送模型研究 被引量:1
10
作者 胡吉明 钱玮 苗煜松 《情报杂志》 北大核心 2025年第2期167-173,共7页
[研究目的]从政策内涵和用户特征表示的深度学习出发,构建政策文本精准推送模型,实现高效准确的政府服务双向精准推送。[研究方法]首先基于Doc2Vec模型进行政策文档向量表示,并融入政策实体和政策主题信息,丰富政策文本的语义内涵;构建... [研究目的]从政策内涵和用户特征表示的深度学习出发,构建政策文本精准推送模型,实现高效准确的政府服务双向精准推送。[研究方法]首先基于Doc2Vec模型进行政策文档向量表示,并融入政策实体和政策主题信息,丰富政策文本的语义内涵;构建集成自然属性、社会属性和政策属性的政策用户画像模型,基于Word2Vec实现基于三元组的画像特征表示;最后,构建政策-用户双向精准推送模型,进行基于推送关系标注的模型训练,基于注意力机制实现政策和用户间的双向智能匹配。[研究结果/结论]针对助残服务的实验表明,所提策略有效实现了助残服务与残疾人间的精准匹配,呈现出政策-用户及用户-政策双向的推送结果。 展开更多
关键词 政策文本 政策实体识别 政策精准推送 主题挖掘 特征表示 政策用户画像
在线阅读 下载PDF
集成学习框架下水电工程施工事故致因因果发现
11
作者 郑霞忠 欧妍希 +2 位作者 田丹 陈云 钟馨凝 《安全与环境学报》 北大核心 2025年第4期1237-1246,共10页
为了探究水电工程施工安全风险复杂因果关系,理清安全风险事故演化过程,实现精准化的事故管理,以近年代表性事故调查报告为基础,集成二元项主题模型(Biterm Topic Model,BTM)与决策试验与评估实验法(Decision-Making Trial and Evaluati... 为了探究水电工程施工安全风险复杂因果关系,理清安全风险事故演化过程,实现精准化的事故管理,以近年代表性事故调查报告为基础,集成二元项主题模型(Biterm Topic Model,BTM)与决策试验与评估实验法(Decision-Making Trial and Evaluation Laboratory,DEMATEL),改进关联规则(Apriori algorithm)算法,建立水电工程事故致因演化规则智能分析模型。首先,利用BTM方法,挖掘事故文本中的关键信息,获得关键信息的特征词,提炼事故致因因素;其次,融合事故致因因素与DEMATEL方法改进Apriori算法,分析事故致因演化规则,获得事故致因因素间的因果关联关系。最后,将提取的14个事故致因关键词建立模型,应用于水电工程的事故分析中,深入挖掘事故诱因,阐明事故演化过程,为安全事故的高效精准管理提供了理论和技术支撑,有助于提升施工现场安全管理质量与效率,实现事故的实时高效预控。 展开更多
关键词 安全工程 事故致因分析 文本挖掘 关联规则 二元项主题模型
在线阅读 下载PDF
油气钻井现场工人不安全行为模式研究——基于文本挖掘视角
12
作者 朱林 罗筵疆 +3 位作者 黄思琪 钟赟 唐桃 岑康 《中国安全生产科学技术》 北大核心 2025年第1期146-152,共7页
为加强油气钻井现场安全管理,理解钻井现场工人不安全行为规律,提出基于文本挖掘视角的钻井现场工人不安全行为模式分析框架,以钻井现场工人违章数据为实例进行验证。首先采用频率分析和网络分析方法发现钻井工人高频不安全行为热点,其... 为加强油气钻井现场安全管理,理解钻井现场工人不安全行为规律,提出基于文本挖掘视角的钻井现场工人不安全行为模式分析框架,以钻井现场工人违章数据为实例进行验证。首先采用频率分析和网络分析方法发现钻井工人高频不安全行为热点,其次采用文本社群聚类分析钻井工人不安全行为聚类,最后采用文本关联规则发现和检验典型不安全行为发生模式。研究结果表明:钻井现场工人不安全行为模式包括7个不安全行为社群和66条不安全行为发生模式,其中油气钻井现场系统与外部系统耦合处、班前会议、钻井下钻和钻进作业、登高作业是现场不安全行为监管的脆弱点。研究结果可为钻井现场安全管理优化提供支持,有利于为钻井现场智慧安全治理提供参考。 展开更多
关键词 安全社会工程 不安全行为 智能文本挖掘 油气现场工人 文本聚类 关联规则 行为模式
在线阅读 下载PDF
融合上市公司文本信息的财务困境预测——来自年报管理层讨论与分析的经验证据
13
作者 阮素梅 孙旭升 李伟 《财贸研究》 北大核心 2025年第6期99-110,共12页
内容丰富、形式多样的年报文本信息通常具有财务数据难以体现的丰富内涵,对年报文本信息进行量化分析逐渐成为财务困境预测研究的重要方向。基于文本分析技术提出管理层语调增长率与风险信息含量两个文本披露指标,进一步挖掘了“管理层... 内容丰富、形式多样的年报文本信息通常具有财务数据难以体现的丰富内涵,对年报文本信息进行量化分析逐渐成为财务困境预测研究的重要方向。基于文本分析技术提出管理层语调增长率与风险信息含量两个文本披露指标,进一步挖掘了“管理层讨论与分析”的有效信息,在此基础上结合财务数据预测上市公司财务困境。研究发现,融入所提出的文本披露指标后,经典预测模型对上市公司财务困境预测的AUC和F2-score分别平均提高了2.10%和2.30%。进一步的实证检验表明:关于管理层语调增长率,仅正面语调增长率与未来财务困境显著负相关;相较于财务状况正常的企业,未来发生财务困境的企业倾向于披露更多的风险信息。 展开更多
关键词 财务困境 文本分析 管理层讨论与分析
在线阅读 下载PDF
基于文本挖掘方法的体育产业融合水平测度与评价
14
作者 魏和清 焦荣荣 +1 位作者 李燕辉 李颖 《上海体育大学学报》 北大核心 2025年第5期89-102,114,共15页
在界定体育产业融合内涵以及融合模式基础上,采用文本挖掘方法,通过对我国2016—2022年体育类相关企业工商注册数据的挖掘,对体育产业融合度进行测算和评价。发现:我国体育产业融合态势较好,但仍未达到高度融合阶段,融合呈现出多元、复... 在界定体育产业融合内涵以及融合模式基础上,采用文本挖掘方法,通过对我国2016—2022年体育类相关企业工商注册数据的挖掘,对体育产业融合度进行测算和评价。发现:我国体育产业融合态势较好,但仍未达到高度融合阶段,融合呈现出多元、复合的趋势;地区间体育产业融合度差异主要来源于复合融合模式贡献,不同融合模式贡献的空间分布不匀显示出我国独有的融合差异化格局;各地体育产业融合速度存在显著差异,西部省份融合速度相对较快,因复合融合和渗透融合2种模式贡献变动导致的地区间体育产业融合水平差异正逐步拉大;目前只有上海、北京实现了体育产业融合发展与产业总规模扩大的良性循环,其他地区的融合效应并未充分释放。基于此,从加快融合载体建设、加强数字技术应用、坚持差异化发展以及加强区域协作等方面提出促进体育产业融合高质量发展的政策建议。 展开更多
关键词 体育产业 产业融合 融合模式 融合度 文本挖掘
在线阅读 下载PDF
基于文本挖掘的连环追尾事故影响因素及严重程度
15
作者 王玲 李义丹 +3 位作者 王子坚 张龙 邢莹莹 马万经 《同济大学学报(自然科学版)》 北大核心 2025年第7期1074-1083,共10页
基于爬取的近8年微博数据,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型和社会网络分析,识别了连环追尾事故的8个主题,揭示了事故的主要特征和发生机理。研究发现高速公路是最主要的事故场景;雨雪天气引发事故频率... 基于爬取的近8年微博数据,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型和社会网络分析,识别了连环追尾事故的8个主题,揭示了事故的主要特征和发生机理。研究发现高速公路是最主要的事故场景;雨雪天气引发事故频率高于雾天;未保持安全车距和超速行为显著增加事故风险。利用LDA对每篇文档进行主题分配,结合正则表达式提取的严重程度信息,构建了有序Logit回归模型,分析了不同主题对事故严重程度的影响。结果表明,连环追尾事故的平均受伤人数和死亡人数分别是机动车交通事故平均值的2.12倍和1.85倍。在高速公路上的连环追尾事故严重程度高于交叉口,其优势比(odd ratio,OR)值是交叉口的3.3倍;雾天事故的OR值是雨雪天气的9.4倍;货车行驶事故的OR值是轿车的4.6倍,是客车的2.2倍。 展开更多
关键词 交通安全 连环追尾 严重程度 文本挖掘 隐含狄利克雷分布 有序LOGIT模型
在线阅读 下载PDF
民用无人机事故致因文本挖掘和社会网络分析
16
作者 李柯 王东煌 罗帆 《安全与环境学报》 北大核心 2025年第7期2709-2716,共8页
为明确民用无人机事故致因及其关联性,借助文本挖掘技术完成122份民用无人机事故报告的结构化处理,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)算法提取出23项事故致因关键词;运用社会网络分析(Social Net... 为明确民用无人机事故致因及其关联性,借助文本挖掘技术完成122份民用无人机事故报告的结构化处理,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)算法提取出23项事故致因关键词;运用社会网络分析(Social Network Analysis, SNA)方法和Gephi、Ucinet等软件构建民用无人机事故致因共现网络,完成网络中心性分析和核心边缘结构分析,以了解各事故致因节点的重要性和网络结构特征。结果表明:机械结构故障、动力系统故障等源自无人机自身的致因是造成事故的主要原因;飞行失控、检查不足、天气意外因素等8项致因位于致因网络的核心区域,归属于核心致因,其余15项为边缘致因;基于核心致因构建并分析核心-边缘致因集合,有助于为民用无人机事故防控提供对策建议,从而促进低空经济产业健康有序发展。 展开更多
关键词 安全工程 文本挖掘 社会网络分析 词频-逆文档频率 无人机事故
在线阅读 下载PDF
基于大语言模型的参考文献自动识别与著录信息抽取
17
作者 陈和 《情报杂志》 北大核心 2025年第7期192-198,共7页
[研究目的]利用大语言模型从参考文献文本数据中自动逐条识别出参考文献,并对识别出的参考文献的著录信息进行自动抽取,为文本识别相关工作提供新的思路和方法。[研究方法]通过Python编程和案例研究法,设计并优化Prompt模板,调用百度千... [研究目的]利用大语言模型从参考文献文本数据中自动逐条识别出参考文献,并对识别出的参考文献的著录信息进行自动抽取,为文本识别相关工作提供新的思路和方法。[研究方法]通过Python编程和案例研究法,设计并优化Prompt模板,调用百度千帆ERNIE-Speed大语言模型的服务API接口进行问答交互,实现从参考文献文本数据中自动逐条识别出参考文献,并进一步自动抽取每条参考文献中的作者、题名、出版物名称、出版年份等著录信息。[研究结果/结论]相较于传统文本识别方法,利用大语言模型自动识别参考文献并抽取著录信息,具有使用门槛低、对目标文本数据要求宽松、文本识别准确率高、抽取效率高等优点。同时,大语言模型也存在输入与输出内容长度受限制、“幻觉”和“礼貌性”行为增加数据处理复杂度的局限性。 展开更多
关键词 大语言模型 文本挖掘 文本识别 信息抽取 参考文献 著录规则
在线阅读 下载PDF
民国时期侨务政策的主题与变迁研究——基于Python的政策文本量化分析
18
作者 焦建华 耿嘉岐 《厦门大学学报(哲学社会科学版)》 北大核心 2025年第1期192-204,共13页
侨务政策体现了一国对海外侨民的重视程度,直接关系到侨胞对祖国的归属感与认同感。秉承孙中山“护侨重侨”的精神,以及争取华侨支持,民国历届政府都制定了大量侨务政策。通过建立1912—1949年民国中央及地方的侨务政策文本数据库,运用P... 侨务政策体现了一国对海外侨民的重视程度,直接关系到侨胞对祖国的归属感与认同感。秉承孙中山“护侨重侨”的精神,以及争取华侨支持,民国历届政府都制定了大量侨务政策。通过建立1912—1949年民国中央及地方的侨务政策文本数据库,运用Python等文本挖掘工具,深入探究民国侨务政策主题及其变迁后发现:中央侨务政策更倾向于宏观政策指导,以及关注国家层面的影响,地方侨务政策更加具体详实,符合本地实际;民国侨务政策与当时政治形势、国内外环境具有紧密联系;政策制定的相关机构间合作逐渐增强,政策内容呈现出多元化趋势;政策制定以激发侨民的民族主义意识为主导思想;政策关注重点存在权力结构性与历史阶段性差异。 展开更多
关键词 侨务政策 主题挖掘 变迁 PYTHON 文本量化分析
在线阅读 下载PDF
基于文本挖掘和云模型的虚拟电厂交易风险评估研究
19
作者 刘吉成 宋亚楠 《电网技术》 北大核心 2025年第3期1089-1097,I0069,I0070,共11页
虚拟电厂聚合分布式能源作为第三方主体参与市场,其交易过程存有多种不确定性风险因素,准确识别并有效评估其交易风险尤为重要。该文首先基于文本挖掘技术辨识风险因素,并使用失效模式与影响分析法确定关键风险因素,进而设计风险评估指... 虚拟电厂聚合分布式能源作为第三方主体参与市场,其交易过程存有多种不确定性风险因素,准确识别并有效评估其交易风险尤为重要。该文首先基于文本挖掘技术辨识风险因素,并使用失效模式与影响分析法确定关键风险因素,进而设计风险评估指标体系。其次,结合博弈论思想,对关键风险因素主客观组合赋权。再次,构建风险评估的二维云模型以描述风险发生概率的随机性和风险产生后果的模糊性问题。最后,采用所提评估方法计算多场景虚拟电厂参与市场交易情况的总体风险水平并排序,且与优劣解距离法(technique for order preference by similarity to ideal solution,TOPSIS)、秩和比综合评价法(rank sum ratio,RSR)及折衷排序方法(multi-criteria optimization and compromise solution,VIKOR)对比分析,验证了模型及方法的可行性和有效性。所做研究为VPP交易管理和风险防范提供了有益的参考,具有工程应用价值。 展开更多
关键词 虚拟电厂交易 风险评估 文本挖掘 二维云模型 风险防范
在线阅读 下载PDF
主题模型网络分析:计算传播视野下的舆情文本挖掘新进路
20
作者 张媛 刘兴澳 《情报杂志》 北大核心 2025年第5期122-129,共8页
[研究目的]旨在提出一种新的复杂文本挖掘方法——“主题模型网络分析”(ANTMN),以解决传统舆情文本挖掘方法在动机过强、人工介入过多、主题粗糙等方面的局限,为舆情治理、风险识别和舆论引导提供有效的方法支持。[研究方法]通过文献... [研究目的]旨在提出一种新的复杂文本挖掘方法——“主题模型网络分析”(ANTMN),以解决传统舆情文本挖掘方法在动机过强、人工介入过多、主题粗糙等方面的局限,为舆情治理、风险识别和舆论引导提供有效的方法支持。[研究方法]通过文献梳理分析传统方法的局限性及计算转向的学术进展,通过比较分析论证ANTMN较之现有方法的创新优势。[研究结果/结论]研究发现,ANTMN遵循“主题建模”“网络分析”与“社区检测”的三步法,以“纯归纳取向”获得客观性,以“混合计算取向”超越传统方法的静态局限。ANTMN还在舆情传播研究中表现出较强的实践应用价值,即在经验现象中提出舆情传播问题、在数据驱动中解析舆情传播机制、在趋势预测中建构舆情传播体系。 展开更多
关键词 舆情传播 主题模型网络分析 舆情文本挖掘 计算传播
在线阅读 下载PDF
上一页 1 2 89 下一页 到第
使用帮助 返回顶部