2023 和鲸社区年度科研闭门会以“对话 AI for Science 先行者,如何抓住科研范式新机遇”为主题,邀请了多个领域的专家学者共同探讨人工智能在各自领域的发展现状与未来趋势。
在遥感领域,人工智能的应用起始于 2015 年,而后伴随着遥感智能解译的进展,AI 作为分析工具度过了技术的磨合期,开始在各个细分领域迭代发展。
以《“AI+遥感”技术地学应用实践与展望》为题,中国自然资源航空物探遥感中心的教授级高工于峻川从遥感智能解译的现状与挑战、人工智能在传统遥感业务中的技术定位、“AI+遥感”技术在地学领域应用的基本范式,以及“AI+遥感”技术所面临的新机遇与挑战等方面进行了分享。
分享嘉宾|于峻川 中国自然资源航空物探遥感中心正高级工程师
理学博士,教授级高工,长期从事人工智能技术与遥感综合应用研究,高光谱及遥感应用系统研发等工作 。作为负责人承担包括重点研发计划课题、国防科工重大专项项目等十余项科研项项目。发表论文 40 余篇,获发明专利 10 余项。
本文内容已做精简,如需获取专家完整版视频实录,请点此链接联系工作人员领取。
2023 年,人工智能的发展呈现出前所未有的蓬勃态势,一系列新兴技术如 ChatGPT 、SAM 和 NeRF 等在各个领域取得了突破性进展,也为人工智能技术在遥感领域的应用提供了新的视野和启示。
回顾 “AI+遥感”的技术演进历程,我们不难察觉到人工智能在遥感领域中的一些关键技术的发展一直紧随着计算机视觉与医学领域的步伐。此过程中经历了追逐热点、备受争议到逐渐被广泛接受的阶段,目前人工智能技术已进入到遥感的各个细分领域进行逐步迭代。然而,“AI+遥感”技术在地球科学领域应用中依然面临着诸多问题和挑战,涵盖样本、模型以及平台等多个方面。值得注意的是,这些问题实际上也是人工智能在特定领域应用时普遍面临的共性难题。
问题的核心很大程度源自于遥感数据的特殊性——它是一种拥有多模态且包含时间空间属性的数据,与自然图像既有相似之处又呈现独有特质;另一方面,在地学领域应用场景下专家知识如何与人工智能模型相结合也是一个难点。然而,除以上这些挑战之外,我们认为如何正确理解人工智能在传统应用场景中的技术定位,明确它的目标、方法和边界,是更为重要的。
这里我结合滑坡隐患关联要素智能识别的案例来谈谈我们在实践中是如何做技术定位的。
在 2019 年,得到部地勘司的支持,航遥中心主导进行了全国地质灾害隐患综合遥感识别工作。通过三年的不懈努力,成功完成了 710 个县高中易发区的隐患普查识别,共识别了 2.7 万多处疑似隐患。在取得应用成效的同时,我们初步构建了隐患综合遥感识别的技术体系。为了持续在全国范围内进行地灾隐患识别与动态监测,引入新的技术手段以提高效率成为势在必行的道路。在这样的背景下,依托国家重点研发计划项目(2021YFC3000400)我们启动人工智能相关研究工作。
狭义上讲,滑坡隐患是具有明显形变迹象并在近期内可能成灾的斜坡。概念里提到的“斜坡、形变迹象、成灾”正是通过遥感技术可观测到的隐患的表现特征,与葛大庆教授提出的“三形”理论相契合。因此,我们从遥感观测要素-隐患表现特征的关联关系出发,客观限定识别目标为“地质灾害隐患关联要素”,指的是遥感可观测的对于崩滑隐患的判识有直接或间接指示作用的特征要素或目标对象。这一概念的提出使我们在遵循已有地灾理论框架下,更好地聚焦研究目标。
举两个具体的案例。
第一个案例涉及?InSAR 形变聚集区的智能识别,主要目的就是把 InSAR 形变相位中的异常圈出来。数据中不仅存在噪声,异常形态特征复杂,因而采用传统的阈值分割、聚类分析等方法都难以有效地解决问题。然而,通过将原本的数据梯度异常提取问题视为异常形态特征的模式识别问题,利用深度学习技术就可以迎刃而解。方法上我们更聚焦于小尺度弱异常目标的捕捉以及克服数据中的噪声问题,同时专注于如何利用数据和模型交互式迭代的方式构建数据集以满足广域应用的需求。
第二个案例涉及滑坡图谱特征识别。从表现特征和技术可行性出发,我们将滑坡类别进行重新定义,分为高辨识度和低辨识度两类滑坡。
高辨识类型的目标图谱特征与背景差异大更易于区分,如震后型滑坡,这类滑坡识别难度相对低。我们在全球范围内充分搜集样本数据的基础上,利用大模型技术构建相对通用的识别模型,在不同区域通过微调的方式实现方法的泛化。针对这类目标的识别有两个关键点:一是好的模型的初始化;二是提升样本的多样性。
低辨识度的滑坡通常是经过后期改造的老滑坡,其特征与周围背景相似,因而识别难度大。这类目标往往需要结合专家知识,根据前后缘、侧壁等特征进行判识。鉴于以上认识我们提出利用对比学习方法强化模型对于滑坡边缘与背景差异性特征的学习,从而提高识别的精度。同时,我们也对于 DEM 是否一定对滑坡识别有效?如何多源数据做滑坡识别采用数据融合还是特征融合?等问题进行了探讨。
简单地总结,我们认为利用“AI+遥感”技术用于解决隐患遥感识别的问题,关键在于准确的技术定位。从图4可见,我们将隐患识别技术的发展概括为四个阶段,从人工解译,综合遥感识别,再逐步引入智能识别,我们当前的技术正处在第二阶段和第三阶段间过渡的阶段,短时间内无法实现隐患的智能识别,但可以通过对关联要素的智能识别来提升综合遥感识别的效率。因而,清晰地明确研究的目标和边界是开展创新的关键,一旦目标过高会导致研究不切实际。另外,直接将其他领域的方法或认识套用到现有问题上通常是不成功的。在将“AI+遥感”技术应用于某一具体场景时,深刻理解目标和需求场景是至关重要的,因此,成功落地应用的核心是跨领域人才,而非单纯的算法。
基于已有的研究经验,我们也探讨了“AI+遥感”技术在地学应用中可能的基本范式。虽然是尚未成熟的构想,但我们仍希望为该领域贡献一些初步的思考,抛砖引玉。根据数据和应用尺度的不同,提出了四种范式:第一个是数据驱动;第二是“数据-知识”联合驱动;第三个是智能云计算;第四是智能交互。特别“数据-知识”联合驱动在许多地学场景中都可能发挥关键作用,我们也在这方面进行了深入的思考和整理。
下面结合实际案例对几种范式做一个简单的介绍。
云检测是数据质检的基础步骤也是遥感数据应用的前提条件,属于典型的数据驱动场景。我们总结了在何种情况下可以采用大数据驱动的方法,并能够取得良好的效果,梳理出了三个条件:首先,目标识别的规则得是明确的,比如水体、道路,而对于前面提到的成矿预测和滑坡场景,需要更多专家知识的接入,因为规则相对没那么明确;第二,样本的获取是低成本、高效的;第三,目标特征在空间时间上的变化差异性不大。只要满足这三种条件,多数情况就可以采用数据驱动的方式来解决问题。
但实际应用中,我们常常因为样本的不足而需要应用“数据-知识”联合驱动的方法。以高光谱分类应用为例,数据本身的稀缺性限定了我们无法使用大模型大数据的方式解决问题。这一案例中我们利用高光谱开展矿物提取或岩性分类应用,采用了自监督的技术挖掘数据本身的价值,将数据映射到高维的空间,并基于物理模型对高维空间的特征进行约束,从而实现在小样本下的半监督分类应用,同时模型具备较好的鲁棒性。
另一方面,我们探讨了提高广域尺度应用效率的方法。在进行开展青藏高原湖泊遥感识别的应用时,我们一开始陷入了一个误区。由于广域尺度的遥感监测应用场景下,本地进行数据处理成本是高昂的,且难以实现实时监测,最初的方案是不可持续的。因此,我们进行了改进,利用云计算平台在数据和算力上的优势,将数据处理、样本生成和推理过程都迁移到云上进行,实现了青藏高原湖泊在线近实时的遥感监测。
遥感智能解译领域当前备受瞩目。尽管有观点认为很多深度学习模型在推理后仍需大量人为修正,这使得技术难以真正落地。然而,我们认为智能交互式解译可能是 AI 在遥感领域实际应用的最终形态。近期备受关注的 SAM 为我们提供了一种创新思路,我们在其发布的首周就对遥感数据进行了测试,并提出了在遥感场景下推进智能交互解译的途径。通过将视觉大模型迁移到具体的任务场景中,结合人机交互的方式实现 one-shot 提取,应用中只需在目标上标记一个点,模型就能自动地识别出相似目标。在专家知识的引导下,可以持续优化模型,这实际上已经在很大程度上改变了我们对传统遥感信息提取的思维模式。
最后谈一下机遇和挑战。
过去几年遥感数据分析处理的方式发生了很大变化,随着编程语言的普及,遥感数据的分析和应用越来越走向数字化、集群化、自动化;同时,产品、算法都在逐渐地走向云端。多模态遥感、AI 大模型、云计算等新技术为遥感应用带来了很多新机遇。同时也需要注意到,一些相对成熟应用场景中方法本身已不再关键,而算力和数据逐渐成为了限制发展的一个主要因素。
遥感解译本身作为遥感技术的一个重要方面,经历了从人工目视解译到面向对象,再逐渐向智能化的方向发展的过程。我们认为实现真正的智能解译还需要经历三个阶段:智能信息提取、智能交互解译、智能分析决策。事实上,现有的技术已为这一目标的实现提供了条件,需要我们投入更多的人才和资源来实现。
另一方面,依托像和鲸这样优秀 AI 计算平台,通过“1+N”一个平台多个服务端的方式可以更好地平衡科研和生产的需求。
关于挑战,除了技术上挑战,我认为认知层面的挑战同样至关重要。当新技术进入到一个领域时,常常会经历一番试错的过程,而关于人工智能的很多误解都是在这个过程里产生的——有人认为人工智能无所不能,有人认为它只是“人工智障”。因此,我们鼓励大家理性客观地认识 AI ,用实践探索技术边界,才能更好的迎接人工智能将带来的挑战。同时,我们也希望大家更多的关注AI+遥感技术在地学领域的应用!
欢迎关注我们团队的科普公众号:45度科研人
以上为于老师的分享内容,如需获取专家完整版视频实录,?请点此链接联系工作人员领取
您也可以点此免费试用体验与多个航遥中心合作的数据科学协同平台 ModelWhale 。