-
题名基于文本挖掘的冲/偏出跑道事故致因网络分析
被引量:1
- 1
-
-
作者
刘俊杰
于佳楠
王懿
-
机构
中国民航大学安全科学与工程学院
北京飞机维修工程有限公司
-
出处
《安全与环境工程》
CAS
CSCD
北大核心
2024年第6期16-25,共10页
-
基金
中国民用航空局安全能力建设项目(ASSA2022/18,KJZ49420220016)。
-
文摘
冲/偏出跑道事故是民航航空器运行中典型高风险事故类型之一。为有效识别冲/偏出跑道事故致因,分析各个致因的重要性和相互关系,选取ASN官网2001—2021年间827起冲/偏出跑道事故的文本信息作为样本,利用文本挖掘和社会网络分析方法,提出了一种新的致因挖掘方法,即运用Word2Vec+TextRank结合算法提取致因节点并绘制出致因网络图;采用中心性分析及凝聚子群分析方法确定关键致因和各个致因间的聚类关系;采用Apriori算法挖掘各致因间强关联规则,并以机组资源管理不足为例确定各致因间相关性。结果表明:导致飞机冲/偏出跑道事故的致因共计40项,其中风、决策不当、机组资源管理不足和训练不足是关键致因,事故致因之间存在聚类关系和强关联规则。研究结果可为有效预防和控制冲/偏出跑道事故的发生提供参考。
-
关键词
航空安全
冲/偏出跑道事故
文本信息分析
社会网络分析
关联分析
致因分析
-
Keywords
aviation safety
runway overrun/excursion accident
text message analysis
social network analysis
correlation analysis
causal analysis
-
分类号
X928
[环境科学与工程—安全科学]
X949
[环境科学与工程—安全科学]
-
-
题名PDF文件信息的抽取与分析
被引量:21
- 2
-
-
作者
李珍
田学东
-
机构
河北大学数学与计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2003年第12期145-147,共3页
-
基金
河北省自然科学基金项目 (6 0 2 1 2 7)
-
文摘
PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论。这将有助于根据需要进一步抽取PDF文件信息。
-
关键词
信息抽取
PDF文件
文本信息分析
-
Keywords
information extraction
PDF file
analysis of text information
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-