Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl...Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments.展开更多
构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,...构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,获得了初始滑移面的位置。基于大数据统计,分析了初始滑移位置分布以及断裂位置分布两者之间的相关性。研究结果表明:当内部中空半径较小时,断裂位置分布形成于塑性形变阶段,初始滑移分布与断裂位置分布之间无显著的相关性;但是对于脆性特征明显的大中空半径的NW,高能内表面诱导产生的滑移面迅速积累,产生颈缩并导致最终的断裂。因此当内部中空结构达到一定尺寸时初始滑移位置的分布与最终断裂位置的分布之间有明确的因果关系。展开更多
准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使...准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使结构面识别准确性差、效率低。针对该问题,以江西省南昌市某露天矿高边坡为研究背景,提出了融合无人机摄影、后处理算法及统计分析的一体化结构面识别与产状统计信息采集方法。首先,通过Phantom 4 Pro V2.0无人机获取边坡表面影像;其次,利用Context Capture软件进行处理,得到高密度三维点云数据;然后,采用K近邻(KNN)算法中的确定近邻点数量法构建相似点集,采用基于密度的聚类(DBSCAN)算法进行聚类分析,从而实现边坡结构面识别,获得结构面产状信息并进行统计特征分析;最后,通过现场勘测数据进行对比验证。结果表明:该方法能够快速获取完整的高密度点云数据,准确高效地识别岩质高边坡大部分结构面,识别结果与边坡工程现场实际情况基本吻合;该方法可获取高边坡结构面数量、产状信息及其统计特征,大部分结构面倾角和倾向概率分布与实测数据拟合较好,为高边坡裂隙网络模型构建及稳定性分析提供了重要数据来源。展开更多
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点...为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms.展开更多
基金Project(61362021)supported by the National Natural Science Foundation of ChinaProject(2016GXNSFAA380149)supported by Natural Science Foundation of Guangxi Province,China+1 种基金Projects(2016YJCXB02,2017YJCX34)supported by Innovation Project of GUET Graduate Education,ChinaProject(2011KF11)supported by the Key Laboratory of Cognitive Radio and Information Processing,Ministry of Education,China
文摘Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments.
文摘构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,获得了初始滑移面的位置。基于大数据统计,分析了初始滑移位置分布以及断裂位置分布两者之间的相关性。研究结果表明:当内部中空半径较小时,断裂位置分布形成于塑性形变阶段,初始滑移分布与断裂位置分布之间无显著的相关性;但是对于脆性特征明显的大中空半径的NW,高能内表面诱导产生的滑移面迅速积累,产生颈缩并导致最终的断裂。因此当内部中空结构达到一定尺寸时初始滑移位置的分布与最终断裂位置的分布之间有明确的因果关系。
文摘准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使结构面识别准确性差、效率低。针对该问题,以江西省南昌市某露天矿高边坡为研究背景,提出了融合无人机摄影、后处理算法及统计分析的一体化结构面识别与产状统计信息采集方法。首先,通过Phantom 4 Pro V2.0无人机获取边坡表面影像;其次,利用Context Capture软件进行处理,得到高密度三维点云数据;然后,采用K近邻(KNN)算法中的确定近邻点数量法构建相似点集,采用基于密度的聚类(DBSCAN)算法进行聚类分析,从而实现边坡结构面识别,获得结构面产状信息并进行统计特征分析;最后,通过现场勘测数据进行对比验证。结果表明:该方法能够快速获取完整的高密度点云数据,准确高效地识别岩质高边坡大部分结构面,识别结果与边坡工程现场实际情况基本吻合;该方法可获取高边坡结构面数量、产状信息及其统计特征,大部分结构面倾角和倾向概率分布与实测数据拟合较好,为高边坡裂隙网络模型构建及稳定性分析提供了重要数据来源。
文摘为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms.