近年来,深度神经网络(deep neural network,DNN)在众多领域取得了广泛应用,甚至在安全关键系统中已经可以代替人类作出决策,如自动驾驶和智慧医疗等,这对DNN的可靠性提出了更高的要求.由于DNN具有复杂的多层非线性网络结构,难以理解其...近年来,深度神经网络(deep neural network,DNN)在众多领域取得了广泛应用,甚至在安全关键系统中已经可以代替人类作出决策,如自动驾驶和智慧医疗等,这对DNN的可靠性提出了更高的要求.由于DNN具有复杂的多层非线性网络结构,难以理解其内部预测机制,也很难对其进行调试.现有的DNN调试工作主要通过修改DNN的参数和扩增数据集提升DNN性能,以达到优化的目的.然而直接调整参数难以控制修改的幅度,甚至使模型失去对训练数据的拟合能力;而无指导地扩增训练数据则会大幅增加训练成本.针对此问题,提出了一种基于可解释性分析的DNN优化方法(optimizing DNN based on interpretability analysis,OptDIA).对DNN的训练过程及决策行为进行解释分析,根据解释分析结果,将原始数据中对DNN决策行为产生不同程度影响的部分以不同概率进行数据变换以生成新训练数据,并重训练DNN,以提升模型性能达到优化DNN的目的.在使用3个数据集训练的9个DNN模型上的实验结果表明,OptDIA可以将DNN的准确率提升0.39~2.15个百分点,F1-score提升0.11~2.03个百分点.展开更多
在冻结法施工中,保证冻结壁稳定性至关重要,传统的现场检测方法因其间断性而无法提供实时监测,限制了对冻结壁潜在灾变的及时响应,采用冻土的深层原位精准探测是揭示冻结壁重大工程灾变机理及灾害预警的有效手段。基于卷积神经网络提出...在冻结法施工中,保证冻结壁稳定性至关重要,传统的现场检测方法因其间断性而无法提供实时监测,限制了对冻结壁潜在灾变的及时响应,采用冻土的深层原位精准探测是揭示冻结壁重大工程灾变机理及灾害预警的有效手段。基于卷积神经网络提出一种基于图像数据驱动的冻土强度智能识别方法,通过对93组试样的多角度图像捕获及随后的单轴抗压强度试验,标注试样图像与实际强度数据并结合图像数据增强技术,构建了深度学习模型训练所需的图像数据集;利用迁移学习深度残差网络34层(ResNet-34)模型,并对比其他不同模型的训练过程和测试结果,发现ResNet-34模型效果最佳,准确率为92.8%,且没有出现过拟合现象;应用深度学习模型对冻土强度的影响因素土质、温度和含水率进行识别,发现模型能有效识别出3个变量,证明了模型识别冻土强度的科学性和可靠性;此外研究了模型在不同干扰条件下的表现,模拟典型干扰场景并分析其对模型预测性能的影响,为后续改进数据增强策略和模型优化方向提供依据;引入Grad-CAM(Gradient-weighted Class Activation Mapping)可解释性分析方法揭示卷积神经网络在冻土强度识别任务中的内部特征提取过程,发现利用模型能够提取和分析冻土的关键图像特征,实现冻土强度的快速判识。研究成果为冻结壁状态的实时监控及早期灾害预警提供了新方法,可为冻结工程安全施工提供技术支撑。展开更多
The first generation coherence algorithm(namely C1 algorithm) is based on the statistical cross-correlation theory, which calculates the coherency of seismic data along both in-line and cross-line. The work, based on ...The first generation coherence algorithm(namely C1 algorithm) is based on the statistical cross-correlation theory, which calculates the coherency of seismic data along both in-line and cross-line. The work, based on texture technique, makes full use of seismic information in different directions and the difference of multi-traces, and proposes a novel methodology named the texture coherence algorithm for seismic reservoir characterization, for short TEC algorithm. Besides, in-line and cross-line directions, it also calculates seismic coherency in 45° and 135° directions deviating from in-line. First, we clearly propose an optimization method and a criterion which structure graylevel co-occurrence matrix parameters in TEC algorithm. Furthermore, the matrix to measure the difference between multi-traces is constructed by texture technique, resulting in horizontal constraints of texture coherence attribute. Compared with the C1 algorithm, the TEC algorithm based on graylevel matrix is of the feature that is multi-direction information fusion and keeps the simplicity and high speed, even it is of multi-trace horizontal constraint, leading to significantly improved resolution. The practical application of the TEC algorithm shows that the TEC attribute is superior to both the C1 attribute and amplitude attribute in identifying faults and channels, and it is as successful as the third generation coherence.展开更多
为克服现有方法在交织流量表征和影响因素量化方面的不足,本文融合微观仿真与机器学习方法,构建从仿真标定和影响因素作用机制分析到通行能力估计的研究框架。提出结合DBSCAN(DensityBased Spatial Clustering of Applications with Noi...为克服现有方法在交织流量表征和影响因素量化方面的不足,本文融合微观仿真与机器学习方法,构建从仿真标定和影响因素作用机制分析到通行能力估计的研究框架。提出结合DBSCAN(DensityBased Spatial Clustering of Applications with Noise)聚类、信息熵与遗传算法的DIEGA(DBSCAN Information Entropy Genetic Algorithm)仿真标定改进方法;通过仿真实验分析交织区长度(L_(W))、驶入流量(Q_(RF))、驶出流量(Q_(FR))与通行能力的关联关系;同时,构建基于堆叠策略的通行能力估计模型,并结合SHAP(SHapley Additive Explanation)方法剖析各影响因素的作用机制。结果表明:DIEGA标定方法可将交织区各流向延误误差控制在3%以内,较传统遗传算法的收敛速度提升22.2%;在总交织流量相同的情况下,Q_(RF)与Q_(FR)的不同占比会导致通行能力在约15%范围内波动,且Q_(RF)、Q_(FR)与L_(W)之间存在非线性耦合关系;基于堆叠策略的随机森林机器学习(ML_(RF))模型(R^(2)=0.969)表现最佳,优于其他基线模型;SHAP分析显示,当Q_(RF)/Q_(FR)占比接近1,且L_(W)的范围为250~350 m时,可实现4635~4860 pcu·h^(-1)的峰值通行能力。展开更多
文摘近年来,深度神经网络(deep neural network,DNN)在众多领域取得了广泛应用,甚至在安全关键系统中已经可以代替人类作出决策,如自动驾驶和智慧医疗等,这对DNN的可靠性提出了更高的要求.由于DNN具有复杂的多层非线性网络结构,难以理解其内部预测机制,也很难对其进行调试.现有的DNN调试工作主要通过修改DNN的参数和扩增数据集提升DNN性能,以达到优化的目的.然而直接调整参数难以控制修改的幅度,甚至使模型失去对训练数据的拟合能力;而无指导地扩增训练数据则会大幅增加训练成本.针对此问题,提出了一种基于可解释性分析的DNN优化方法(optimizing DNN based on interpretability analysis,OptDIA).对DNN的训练过程及决策行为进行解释分析,根据解释分析结果,将原始数据中对DNN决策行为产生不同程度影响的部分以不同概率进行数据变换以生成新训练数据,并重训练DNN,以提升模型性能达到优化DNN的目的.在使用3个数据集训练的9个DNN模型上的实验结果表明,OptDIA可以将DNN的准确率提升0.39~2.15个百分点,F1-score提升0.11~2.03个百分点.
文摘在冻结法施工中,保证冻结壁稳定性至关重要,传统的现场检测方法因其间断性而无法提供实时监测,限制了对冻结壁潜在灾变的及时响应,采用冻土的深层原位精准探测是揭示冻结壁重大工程灾变机理及灾害预警的有效手段。基于卷积神经网络提出一种基于图像数据驱动的冻土强度智能识别方法,通过对93组试样的多角度图像捕获及随后的单轴抗压强度试验,标注试样图像与实际强度数据并结合图像数据增强技术,构建了深度学习模型训练所需的图像数据集;利用迁移学习深度残差网络34层(ResNet-34)模型,并对比其他不同模型的训练过程和测试结果,发现ResNet-34模型效果最佳,准确率为92.8%,且没有出现过拟合现象;应用深度学习模型对冻土强度的影响因素土质、温度和含水率进行识别,发现模型能有效识别出3个变量,证明了模型识别冻土强度的科学性和可靠性;此外研究了模型在不同干扰条件下的表现,模拟典型干扰场景并分析其对模型预测性能的影响,为后续改进数据增强策略和模型优化方向提供依据;引入Grad-CAM(Gradient-weighted Class Activation Mapping)可解释性分析方法揭示卷积神经网络在冻土强度识别任务中的内部特征提取过程,发现利用模型能够提取和分析冻土的关键图像特征,实现冻土强度的快速判识。研究成果为冻结壁状态的实时监控及早期灾害预警提供了新方法,可为冻结工程安全施工提供技术支撑。
基金Project(2013CB228600)supported by the National Basic Research Program of ChinaProject(2011A-3606)supported by the CNPC "12.5" Program of China
文摘The first generation coherence algorithm(namely C1 algorithm) is based on the statistical cross-correlation theory, which calculates the coherency of seismic data along both in-line and cross-line. The work, based on texture technique, makes full use of seismic information in different directions and the difference of multi-traces, and proposes a novel methodology named the texture coherence algorithm for seismic reservoir characterization, for short TEC algorithm. Besides, in-line and cross-line directions, it also calculates seismic coherency in 45° and 135° directions deviating from in-line. First, we clearly propose an optimization method and a criterion which structure graylevel co-occurrence matrix parameters in TEC algorithm. Furthermore, the matrix to measure the difference between multi-traces is constructed by texture technique, resulting in horizontal constraints of texture coherence attribute. Compared with the C1 algorithm, the TEC algorithm based on graylevel matrix is of the feature that is multi-direction information fusion and keeps the simplicity and high speed, even it is of multi-trace horizontal constraint, leading to significantly improved resolution. The practical application of the TEC algorithm shows that the TEC attribute is superior to both the C1 attribute and amplitude attribute in identifying faults and channels, and it is as successful as the third generation coherence.
文摘为克服现有方法在交织流量表征和影响因素量化方面的不足,本文融合微观仿真与机器学习方法,构建从仿真标定和影响因素作用机制分析到通行能力估计的研究框架。提出结合DBSCAN(DensityBased Spatial Clustering of Applications with Noise)聚类、信息熵与遗传算法的DIEGA(DBSCAN Information Entropy Genetic Algorithm)仿真标定改进方法;通过仿真实验分析交织区长度(L_(W))、驶入流量(Q_(RF))、驶出流量(Q_(FR))与通行能力的关联关系;同时,构建基于堆叠策略的通行能力估计模型,并结合SHAP(SHapley Additive Explanation)方法剖析各影响因素的作用机制。结果表明:DIEGA标定方法可将交织区各流向延误误差控制在3%以内,较传统遗传算法的收敛速度提升22.2%;在总交织流量相同的情况下,Q_(RF)与Q_(FR)的不同占比会导致通行能力在约15%范围内波动,且Q_(RF)、Q_(FR)与L_(W)之间存在非线性耦合关系;基于堆叠策略的随机森林机器学习(ML_(RF))模型(R^(2)=0.969)表现最佳,优于其他基线模型;SHAP分析显示,当Q_(RF)/Q_(FR)占比接近1,且L_(W)的范围为250~350 m时,可实现4635~4860 pcu·h^(-1)的峰值通行能力。