-
题名基于文本分析的软件项目风险研究演化脉络解析
被引量:2
- 1
-
-
作者
瞿英
范默苒
刘滨
曹树贵
-
机构
河北科技大学经济管理学院
河北科技大学数据科学与商务智能研究中心
-
出处
《河北科技大学学报》
CAS
2020年第1期88-98,共11页
-
基金
河北省社会科学基金(HB18GL045)
河北省科技支撑计划项目(17210104D,18210109D)
+1 种基金
河北省高等学校科学技术研究项目(ZD2017029,ZD2015099)
河北省高层次人才资助项目(A2016002015)
-
文摘
软件项目是以科学满足软件需求为目标,涵盖人员、技术、管理等多种要素的工程实施与组织管理过程。长期以来,由于软件项目客观存在的一些不确定性因素,使得实施过程中常常会遇到设计、费用、进度与功能变化等诸多问题。虽然高效的开发技术不断涌现,但管理问题一直存在,风险问题也经常显现,成为软件行业的焦点问题。正确认识和管理软件项目风险能够提高软件项目开发的成功率,降低风险发生概率。软件项目风险管理是软件项目管理中的重点问题之一。随着软件行业的发展,软件项目风险呈现出新的特点,风险管理内容也产生了新的变化。为了追踪软件项目风险管理研究的脉络和发展趋势,运用网络爬虫技术,获取了国内外软件项目风险相关文献3129篇,利用分词和统计分析技术,对文献作者、关键字、主题等进行提取和词频分析,挖掘出研究主体的空间分布情况;从发文数量及发文时间角度对中外学者研究进行对比分析,梳理出软件项目风险概念界定、研究阶段、研究方法等方面的演化进程。通过对文献主题的分析,梳理出软件项目风险研究的方向和趋势。通过上述文本分析思路,可以得出该领域中的主流研究方法及发展趋势。在文献数量的变化上可以推断,软件项目风险同质化研究较多,研究的创新性突破口难以发掘,致使中文文献数量有所降低。通过观察研究团队词云可视化情况,发现了计算机类及管理类两大主流研究方向。如何从管理角度进行风险研究一直是该领域关注的重点。基于时间顺序的文献主题汇总,能够清晰看出软件项目风险研究是以项目管理为主导、风险管理为导向,将项目管理及风险管理相融合,进行以软件项目为主体的概念性界定。软件项目风险管理理论研究相对成熟后,风险评估、风险识别、风险控制相关技术性的研究也开始兴起,再从应用角度进行风险管理的验证研究。至今风险管理仍以评估为主要研究手段,通过对高频词的共性进行分析,找到词汇关联中较为新颖的研究方向。例如,风险识别过程正在从人工主观辨别向机器自动识别转化;风险管理对象属性特点的转变是由静到动的变化;由大数据技术引发的风险知识库建立、智能风险管理系统的搭建等前沿研究。对研究趋势的探索将为软件项目风险防控、提升软件项目成功率提供新的解决思路,为软件项目风险的相关研究提供可参考的方法。
-
关键词
管理计量学
软件项目风险
文本分析
演化脉络
文献计量
-
Keywords
management metrology
software project risk
text analysis
evolution vein
bibliometrics
-
分类号
G353.1
[文化科学—情报学]
-
-
题名基于LDA主题模型的文献特征项多重共现可视化方法
被引量:7
- 2
-
-
作者
翟君伟
瞿英
郭菲
刘滨
-
机构
河北科技大学经济管理学院
河北科技大学数据科学与智能计算研究中心
-
出处
《河北科技大学学报》
CAS
北大核心
2022年第2期182-193,共12页
-
基金
河北省自然科学基金(G2021208004)
国家文化和旅游科技创新工程项目(2020年度)
+1 种基金
河北省省级科技计划资助项目(20310802D,21310101D)
河北省社会科学发展研究课题(20210201360)。
-
文摘
文献计量学是运用数学和统计学方法对文献知识单元进行定量分析、揭示文献内部知识内容的一门科学。共现网络分析是文献计量研究中分析文献特征项数据关系的一种可视化方法,根据被分析特征项的数量分为单重共现网络分析和多重共现网络分析。与单重共现网络分析相比,多重共现网络分析增加了特征项的维度,对文献知识的呈现更加深入。但是,由于被分析特征项维度的增加,导致共现网络中的节点数量增多,节点间连线重合度和交叉频率过大,降低了文献计量可视化的效果。因此,目前文献计量共现网络分析主要以单重共现为主,多重共现网络分析可视化效果尚有待提升。为解决多重共现网络中节点过多、连线密度过大、不利于发现数据价值以及可视化效果较低等问题,引入LDA主题模型,采用空间划分的方法,将特征项全域可视化的问题转化为子空间可视化问题。首先,使用SATI文献题录信息分析软件抽取文献关键词,进行TF-IDF计算,以计算结果作为实验数据;其次,使用Python构建主题模型,对目标文献集合进行主题聚类分析;最后,使用Ucinet软件对不同主题子空间文献进行多重共现分析,并将子空间分析结果叠加和重构,完成多重共现可视化系统的结构化表达。结果表明:与原多重共现可视化方法相比,在内容呈现等价的前提下,基于LDA主题模型的多重共现可视化改进方法由于缩小了多重共现网络分析系统的规模,即子空间文献数量与特征词数目,因而降低了共现网络中的节点数量和节点间连线密度,使得多重共现可视化系统的结构更为清晰,增加了数据的可读性,突出了数据价值,有效提升了多重共现可视化效果。因此,多重共现可视化改进方法在一定程度上可以推进文献构成元素在多重组合知识挖掘方面的深入研究,提高不同领域文献计量的实证研究质量。
-
关键词
管理计量学
LDA主题模型
多重共现分析
UCINET
可视化
-
Keywords
management metrology
LDA topic model
multiple co-occurrence analysis
Ucinet
visualization
-
分类号
G353.1
[文化科学—情报学]
-