期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于文本挖掘的冲/偏出跑道事故致因网络分析 被引量:1
1
作者 刘俊杰 于佳楠 王懿 《安全与环境工程》 CAS CSCD 北大核心 2024年第6期16-25,共10页
冲/偏出跑道事故是民航航空器运行中典型高风险事故类型之一。为有效识别冲/偏出跑道事故致因,分析各个致因的重要性和相互关系,选取ASN官网2001—2021年间827起冲/偏出跑道事故的文本信息作为样本,利用文本挖掘和社会网络分析方法,提... 冲/偏出跑道事故是民航航空器运行中典型高风险事故类型之一。为有效识别冲/偏出跑道事故致因,分析各个致因的重要性和相互关系,选取ASN官网2001—2021年间827起冲/偏出跑道事故的文本信息作为样本,利用文本挖掘和社会网络分析方法,提出了一种新的致因挖掘方法,即运用Word2Vec+TextRank结合算法提取致因节点并绘制出致因网络图;采用中心性分析及凝聚子群分析方法确定关键致因和各个致因间的聚类关系;采用Apriori算法挖掘各致因间强关联规则,并以机组资源管理不足为例确定各致因间相关性。结果表明:导致飞机冲/偏出跑道事故的致因共计40项,其中风、决策不当、机组资源管理不足和训练不足是关键致因,事故致因之间存在聚类关系和强关联规则。研究结果可为有效预防和控制冲/偏出跑道事故的发生提供参考。 展开更多
关键词 航空安全 冲/偏出跑道事故 文本信息分析 社会网络分析 关联分析 致因分析
在线阅读 下载PDF
PDF文件信息的抽取与分析 被引量:21
2
作者 李珍 田学东 《计算机应用》 CSCD 北大核心 2003年第12期145-147,共3页
PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细... PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论。这将有助于根据需要进一步抽取PDF文件信息。 展开更多
关键词 信息抽取 PDF文件 文本信息分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部