贵阳分部广州分部
网站地图联系我们所长信箱内部网English中国科学院
 
 
首页概况简介机构设置研究队伍科研成果实验观测合作交流研究生教育学会学报图书馆党群工作创新文化科学传播信息公开
  新闻动态
  您现在的位置:首页 > 新闻动态 > 学术前沿
SA:机器学习助力探索南极陨石采集地
2022-03-22 | 作者: | 【 】【打印】【关闭

  地球表面采集到的陨石,为深入了解星云和行星演化过程提供了重要信息。南极陨石在这方面尤为重要,因为它们的天然赋存状态更适于科学研究。南极洲亦是回收陨石最多的地区,这些地外岩石集中在陨石搁浅区。迄今为止,保有陨石的南极蓝冰区大多是通过意外发现或花费昂贵的现场考察划定的。 

  比利时布鲁塞尔自由大学冰川学实验室Tollenaar研究团队近日在Science Advances上发表最新研究成果(Tollenaar et al., 2022),借助机器学习方法,研究预测了南极大陆范围内富含陨石的地点。根据这些预测,其定义了一个“去哪里”指数,服务于昂贵的陨石采集任务,便于优先侦察具有高潜力的陨石搁浅带。 

  陨石搁浅带及陨石分布密度受诸多因素影响,例如地质地貌、风速、温度等气候条件(图1)。传统的物理反演方法难以对这些复杂因素及其相互作用关系进行合理约束,为大陆尺度区域采集陨石带来巨大不确定性。为克服上述难题,Tollenaar团队开展了数据驱动研究,利用可量化不确定性的多维数据,研究了聚焦于已发现陨石的正标记与无标记区域的一种机器学习方法,降低常规机器学习方法同时依赖于正、负标记数据对该类问题带来的不可靠性(Li et al., 2010; Elkan and Noto, 2008)。作者采用核密度估计法估计了正标记样本与无标记数据的多维密度分布,然后基于贝叶斯定律实现预测判别。 

1 两种陨石富集机制的示意图:淹没屏障(开放式陨石搁浅带)和浮现屏障(封闭式陨石搁浅带)。棕色示意基岩,蓝色示意冰盖(颜色越深年龄越大),白色示意雪;红色箭头代表消融(升华),灰色箭头示意富含陨石的冰雪流动,黑点示意陨石(Tollenaar2022

  该项研究利用了大量遥感数据与南极冰盖衍生分析数据。机器学习数据由蓝冰区分辨率为450米的诸多观测网格组成,包含2554个正样本(网格中发现至少1块陨石),以及210万个未标记样本(未探索区域)。作者首先分析了影响预测模型的六大因素:地表温度、移动速度、坡度、雷达后向散射、冰层厚度,以及露头距离。作者指出,地表温度与移动速度是最重要的两项数据特征,而冰层厚度与露头距离无关紧要。预测模型判定网格区域存在陨石的总体准确度约为78%。模型可准确识别出将近83%的已知陨石搁浅带和非陨石搁浅带,对日后陨石侦察工作具有重要的参考价值(图2)。该研究预测,南极冰盖表面存在34万至90万块陨石有待发掘,当前已采集的数量仅占总量的5%13% 

2 南极陨石分布预测热点地图。为便于视觉分辨,中心总览图的预测结果放大显示,图AG按比例显示。开展预测工作的蓝冰区以黑线勾勒。“找到陨石的概率”为该研究方法中的后验概率(Tollenaar2022

  相比于传统基于专家经验与人力工作的探索,数据驱动方法往往显著提升了分析与解释效率。然而,通常受限于当前的数据分辨率、噪音等干扰,纯数据驱动方法也存在明显的不足。例如,该研究采用的遥感数据分辨率较低(不小于450米)、不确定性较大,导致某些被预测为存在陨石的450米网格区域内,实际有53%的较大可能是一无所获。因此,融合数据与专家领域知识提升智能解释精准度,是今后一大研究趋势。

  主要参考文献 

  Tollenaar V, Zekollari H, Lhermitte S, et al. Unexplored Antarctic meteorite collection sites revealed through machine learning[J]. Science Advances, 2022, 8(4): eabj8138.原文链接 

  Li W, Guo Q, Elkan C. A positive and unlabeled learning algorithm for one-class classification of remote-sensing data[J]. IEEE transactions on geoscience and remote sensing, 2010, 49(2): 717-725. 

  Elkan C, Noto K. Learning classifiers from only positive and unlabeled data[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. 2008: 213-220. 

  (撰稿:耿智/油气室)

 
地址:北京市朝阳区北土城西路19号 邮 编:100029 电话:010-82998001 传真:010-62010846
版权所有© 2009- 中国科学院地质与地球物理研究所 京ICP备05029136号 京公网安备110402500032号