土地学院高秉博副教授、杨建宇教授团队在空间因果推断领域取得新进展

发布日期:2023-11-08 浏览次数: 信息来源:综合办公室

掌握事物发展的因果关系是人类改造世界以实现可持续发展的前提,也是人类世代好奇探索的主题。在大尺度地球科学系统研究中,由于控制实验难以开展,基于观测的时空数据表象推断内在的因果关系(即因果推断)成为主要方式。目前主流的因果推断方法包括结构因果模型、潜在结果框架和格兰杰因果检验,这些方法主要针对随机系统,假设变量随机分布且变量间信息可分离。然而在地球系统中,许多变量具有确定性趋势且相互交织耦合,给因果推断带来了困难。为解决地球科学动态系统的归因问题,国际学者基于复杂动态科学的泰肯斯(Takens)理论,研发了基于时间序列的因果推断方法“交叉收敛映射”(Convergent Cross-mapping,CCM)(《复杂生态系统中的因果探测》(Detecting Causality in Complex Ecosystems),于2012年发表于科学Science杂志),并得到了广泛的应用。CCM方法运行需要至少15期以上的时间序列数据,而在许多地球科学研究中,要么时间序列数据缺乏,要么在观测期内地学现象并未呈现显著的变化,使得CCM方法的应用受到很大局限。相比时间序列数据,地球系统的各类空间截面数据更加丰富,如何从丰富的空间截面数据中推断因果关系更为重要。

面对该需求,土地学院高秉博副教授组织联合团队开展空间归因方法研究。2022年,团队研究提出了时空因果推断框架(图1),通过实际案例证明在大尺度的地球系统科学研究中,变量的空间分布信息通常更为丰富,当变量的时间序列不能呈现明显变化时,深入挖掘变量的空间分布信息也是因果推断的重要途径。并在科学通报(Science Bulletin)期刊发表题为《因果推断,应该基于时间变化还是空间差异》(Temporally or spatially? Causation inference in Earth System Sciences)的论文。土地学院高秉博副教授为第一作者,北京师范大学陈子悦副教授为通讯作者,南京大学李满春教授和中国科学院地理科学与资源研究所王劲峰研究员为共同作者。

1.png

图1  时空因果推断框架

在此基础上团队基于复杂动态系统的广义嵌入定理,研发了能够基于空间截面数据识别因果关系并估计因果效应的地理交叉收敛映射方法(Geographical Convergent Cross Mapping,GCCM)。并于2023年9月21日在Nature Communications期刊发表题为《基于地理交叉收敛映射方法从地球系统空间截面数据中推断因果关系》(Causal inference from cross-sectional earth system data with geographical convergent cross mapping)的论文。土地学院高秉博副教授为第一作者,杨建宇教授为共同第一作者,北京师范大学陈子悦副教授和中国科学院地理科学与资源研究所王劲峰研究员为共同通讯作者,南京大学李满春教授、香港中文大学关美宝教授、美国加利福尼亚大学George Sugihara教授和荷兰国际航天测量与地球学学院(ITC)Alfred Stein教授为共同作者。

该研究创新性地提出基于空间滞后重建状态空间(图2),证明了重建方法的正确性,建立了基于状态空间交叉映射预测的空间因果推断方法及结果的显著性检验方法(图3)。GCCM方法主要用于复杂非线性系统的因果推断,能够在弱耦合关系中识别因果方向并估计因果效应,在强耦合关系中识别主导因果方向并估计因果效应,有效破解了空间统计方法难以识别因果方向的镜面效应难题。研究分别采用土壤重金属含量与工业和居民生活污染源(栅格数据)(图4)、中国县级人口密度与自然地理条件(多边形矢量数据)两个案例(图5),证明了方法在弱耦合关系和强耦合关系及不同空间数据类型中的因果推断能力;并采用中国耕地植被净初级生产力与气温和降水数据(图6),证明在时间序列因果推断方法失效时,基于空间差异的GCCM方法能够正确推断出因果关系。而基于统计学的相关性分析和先进的结构因果模型——线性非高斯无环模型(Linear Non-Gaussian Acyclic Model,LiNGAM)均不能有效识别案例中的因果关系及因果方向。

GCCM的理论设定适合众多具有确定性趋势和多个相互交织耦合变量的地球系统,且GCCM没有先验分布假设和预设模型结构,简单易用,为地学归因分析提供了一个值得尝试的新选择。

2.png

图2  空间滞后

3.png

图3  状态空间交叉映射预测

4.png

5.png

图4  土壤重金属污染因果推断案例(弱耦合、栅格数据)

6.png

图5  县级人口密度案例(强耦合、多边形数据)

7.png

图6  农田NPP因果关系案例

鉴于团队在空间预测与归因方法方面的研究成效,空间领域旗舰期刊Spatial Statistics 创刊10周年之际,应创刊主编邀请为期刊10周年庆专刊撰写论文《空间统计中的因果推断》(Causal inference in spatial statistics),分析了空间统计领域的因果推断方法及存在的问题,构建了统计学、计算机科学和经济学领域发展的因果推断方法的分类体系,揭示其在处理空间截面数据时的优势及其局限性,提出了空间统计领域因果推断方法的发展路径。

原文链接:

1.https://www.sciencedirect.com/science/article/abs/pii/S2095927321006423

2.https://www.nature.com/articles/s41467-023-41619-6

3.https://www.sciencedirect.com/science/article/abs/pii/S2211675322000173

供稿:土地科学与技术学院

供图:土地科学与技术学院

编辑:孟祥慈

责编:马文哲

来源:中国农业大学新闻网