文摘多环芳烃(polycyclic aromatic hydrocarbons,PAHs)是地下水中的主要有机污染物之一,地下水中多环芳烃运移数值模拟在开展地下水污染高效修复中起重要作用。在实际地下水污染条件下,由于难以准确刻画含水介质中的胶体类型及其分布,通常忽略污染物-胶体共运移机制,建立的模型存在结构误差,导致模型预测具有显著偏差。本研究以荧蒽和菲为研究对象,针对忽略的PAHs-胶体的共运移机制,使用高斯过程回归(Gaussian process regression,GPR)修正模型结构误差,建立耦合数据驱动和物理机制的多环芳烃运移模型。通过饱和砂柱PAHs运移室内试验,对比分析了未耦合和耦合数据驱动方法的模型预测结果。结果表明,忽略PAHs-胶体的共运移机制的地下水多环芳烃运移模型具有显著的模型结构误差,直接进行参数识别不能弥补忽略的共运移机制,预测结果存在显著偏差。使用GPR模型可以有效补偿PAHs-胶体的共运移机制,修正地下水模型的结构误差。验证期荧蒽、菲预测结果的95%置信区间对观测数据的覆盖率分别提升了56.84%和19.04%,纳什系数分别提升了40.09%和21.73%,均方根误差分别降低了33.10%和55.38%,平均绝对误差分别降低了32.00%和46.34%,地下水多环芳烃运移模型的预测性能显著提高。本研究提出的耦合数据驱动和物理机制方法为场地地下水多环芳烃运移精准模拟提供了可行思路,有助于实现地下水污染的精准高效修复。
文摘机器学习的数据驱动方法为隧道掘进机(tunnel boring machine,TBM)施工智能化赋能,对于优化掘进工艺、提高掘进安全性和降低人工成本至关重要。针对TBM运行数据噪声多、参数冗余及有效特征提取困难的难题,运用数据驱动的机器学习方法,挖掘数据蕴含的机-土复杂相互作用,实现TBM围岩岩体分类预测。首先,对于TBM掘进过程中产生的大量运行数据,采用核密度估计(kernel density estimation,KDE)对典型掘进参数曲线提取特征,获取稳定掘进阶段TBM关键运行参数的最大概率。然后,面向实际场景TBM运行数据,提出围岩分类堆叠集成学习算法,通过k-fold交叉验证进一步优化算法,利用基分类器和元分类器两层学习框架挖掘数据中的复杂关系。最后,采用5868个TBM掘进段的数据集对该算法的有效性进行验证。结果表明,四分类问题预测的平均F1达到0.705,二分类问题预测的平均F1达到0.797,其预测效果均优于所选的四种基分类器。