浙大土壤WRR,基于参数降维的地下水数据同化方法

非均质性是土壤与地下含水层等天然多孔介质的固有特性。由于人力物力的限制,监测数据的数量通常相对较少。对模型参数实施降维可以减少未知量个数,提高数据同化的精度和效率。当前最常用的降维技术是主成分分析法,即基于统计信息将空间变异的参数用较少数量的随机变量近似,随后通过对这些随机变量进行反演求得参数。

写在前面

非均质性是土壤与地下含水层等天然多孔介质的固有特性。为了量化非均质条件下的流动与迁移过程,建模时往往需要构造精细的网格,同时在各网格上设定不同的参数。因此,实际场地模拟问题中往往有数量巨大的未知参数需要识别。数据同化可以从监测数据中融合信息,已经广泛用于反演模型参数,提高预测精度。由于人力物力的限制,监测数据的数量通常相对较少。利用有限的数据反演海量的参数具有挑战性。

对模型参数实施降维可以减少未知量个数,提高数据同化的精度和效率。当前最常用的降维技术是主成分分析法,即基于统计信息将空间变异的参数用较少数量的随机变量近似,随后通过对这些随机变量进行反演求得参数。然而,这类降维方法仅仅基于参数的统计信息,并没有考虑具体的系统行为,也没有考虑监测方案的因素,精度和效率有待提升。

基于此,浙江大学曾令藻等在国家重点研发计划项目、国家自然科学基金面上项目等资助下,与河海大学张江江教授、加拿大University of Waterloo的Walter Illman教授、美国Purdue University的林光教授等人合作,发展了基于无梯度活跃子空间的降维方法,更加有效地实施地下水模型参数降维,提高数据同化的反演精度与效率,在国际水文水资源领域期刊Water Resources Research上发表了题为Accelerating Groundwater Data Assimilation with a Gradient-Free Active Subspace Method.(doi.org/10.1029/2021WR029610)的研究论文。论文第一作者是在读博士生闫恒年,通讯作者是曾令藻教授。

主要结果

当参数与观测数据的敏感性存在显著差异时,我们可以通过有监督的降维方法进一步提高效率,即采用活跃子空间法(Active Subspace Method)。与常用的主成分分析法不同,该方法基于敏感信息,将高维参数投影到降维后的子空间中。为了避免现有活跃子空间法中繁琐的梯度计算,本研究开发了一种基于蒙特卡罗模拟的无梯度方法,使用聚类协方差来近似所需的敏感信息,可以节省大量的编码和计算量。通过与高斯过程回归相结合,该方法可以自适应地构建地下水模型的数据驱动模型,降低计算代价,加速数据同化。方法示意如图1所示。

图1. 算法示意图

此外,当参数降维方法用于数据同化时,另一个难题是反演结果中的不确定性往往会被低估。针对这个问题,本研究提出了一种补偿机制,其核心思想是基于敏感分析结果,只更新与观测数据较为敏感的活跃子空间中的参数,而不更新其他参数。本研究开发的方法通过数值实验和三维地下水抽水试验案例进行了测试。如图2所示,相较于现有方法,利用新方法降维后的模拟结果能够更准确地近似地下水流动系统。如图3所示,现有的基于主成分降维的同化方法反演得到的渗透系数场过于平滑,严重低估了场地的空间变异性(图3.a)。相对而言,新方法能够更好地识别渗透系数的变异性(图3.b)。

图2. 水头模拟的结果验证:(a) 基于主成分分析的方法,(b) 基于无梯度活跃子空间的新方法。R2越大精度越高。

图3. 三维案例中渗透系数场的反演结果:(a) 基于主成分分析的方法,(b) 基于无梯度活跃子空间的新方法。

写在后面

高维参数的低维近似具有重要的理论意义和应用价值。本研究开发了一种易于实施的参数降维算法以促进地下水数据同化的精度和效率,并通过补偿机制,避免低估反演结果的不确定性。本研究提出的降维方法基于蒙特卡罗模拟,便于应用在敏感性存在显著差异的场景中。研究中使用的数据同化方法是迭代集成平滑器,但该降维方法也可以直接结合其他同化方法,例如集合卡尔曼滤波和马尔科夫链蒙特卡罗。

论文链接

https://doi.org/10.1029/2021WR029610

通讯作者简介

曾令藻, 教授,主要从事土壤水-地下水运动与溶质迁移数值模拟、数据同化研究,在Water Resources Research、Advances in Water Resources、Journal of Hydrology等学科领域国际主流期刊上发表SCI论文60余篇。现任中国土壤学会土壤物理专业委员会委员,曾任美国土壤学会会刊Soil Science Society of America Journal 副主编。

随便看看别的百科