详情

基于Sentinel2影像和数字高程模型的沟壑识别

申报人:李锦洲 申报日期:2024-04-06

基本情况

2024
基于Sentinel2影像和数字高程模型的沟壑识别 盲选
创新训练项目
理学
地理科学类
B、学生来源于教师科研项目选题
创新类
2024-04
2025-04
以往对黄土高原沟壑提取的研究主要采用实地调查法、目视解译法、机器学习或深度学习算法提取,但受高精度遥感数据与研究方法的限制,对宏观尺度下不同形态特征、不同光谱特征沟壑的准确提取具有相当的难度。本项目基于Sentinel 2影像和数字高程模型,构建了一种适用于大区域沟壑提取的方法,包括进行面向对象的图像分割、基于机器学习的分类映射与基于地形骨架线的精度优化与准确性评估,有效提升了沟壑的识别精度与效率

本人专业方向为地理信息科学,学习成绩优异,专业知识扎实,平均学分绩点为4.24,位于本专业的前1%。在大一学年获得一等奖学金、 三好学生标兵等荣誉。英语六级530+,计算机二级考核等第为“优秀”,文献阅读与编程能力突出,对科学研究有着浓厚的兴趣。

本人在20233月参与了大学生创新创业项目《基于DSCOVR EPIC数据的2022年汤加火山喷发物扩散监测研究》,借助DSCOVR卫星上的EPIC仪器来观测二氧化硫(SO2)和灰烬等反映火山喷发物扩散情况的数据信息,获得完整的瞬时数据图像,提供同一时刻更加精确的完整影像数据,从而分析与实际情况更加一致的地物及大气特征。我在团队中主要负责文献研究与报告撰写工作。

本人于20235月参与校级数学建模比赛,并获得三等奖;于同年7-8月参与学校的数模暑假培训,并在9月成功参加全国大学生数学建模大赛。这一系列数模竞赛的经历不仅增强了我的文献查阅和快速获取信息的能力,还让我掌握了各种算法(如贪心算法、遗传算法)以及不同类型的模型构建与检验方法,如优化模型、分类模型、评价模型和预测模型。

本人于202312月至20242月参与生命科学竞赛,研究主题为“基于多源遥感数据的盐城大纵湖人类活动与湖泊生态环境动态变化研究”,在团队中,我的主要职责是编写代码。通过借助PIE-Engine遥感与地理信息云服务平台,我们研究了大纵湖水域面积及水生藻类的变化情况。

本人于202311-20242月期间以负责人的身份参与能源经济学术创意大赛,研究主题为“双碳目标下南亚的中资企业可再生能源的投资决策经济性研究”,这次比赛锻炼了我的文献检索和数据分析能力。

综上所述,我专业知识扎实,在竞赛和科研领域积累了丰富的经验,具备较强的论文检索和撰写技能。我擅长文献查阅以及迅速获取关键信息,同时具备扎实的编程能力。熟练掌握多种编程语言和软件,如R语言、PythonMATLAB以及GEE等,我还具备建立各类模型的能力。这些经验和技能使我能够胜任高质量的科研工作。

1.国家自然科学基金项目(42301478):基于增值型DEM的黄土小流域输沙过程高分辨率量化模型研究,2024-2026,主持

2.江苏高校哲学社会科学研究一般项目(2023SJYB0179),《联合国海洋法公约》中海域地理本体构建与表达,2023.9-2025.9,主持

3.南京信息工程大学教改项目(2023JYBJG02),产业需求融入《空间数据采集与管理》课程教学的研究与实践,2023-2025,主持

4.江苏高校基础科学研究面上项目(22KJB170016),江苏中部海岸潮沟系统沟道剖面群组研究,2022.7-2024.6,主持

5.南京市留学人员科技创新项目,实景地理环境按需服务智慧云平台,2022,主持

6.企事业单位委托课题,江苏省地质资料馆数字资源管理平台项目监理,2024–2025,主持

7.企事业单位委托课题,国土空间规划土地规划专题研究与规划编制,2022–2025,主持

8.实景地理环境安徽省重点实验室开放课题(2022PGE013),基于众源数据的数字道路高精度建模,2022.9-2024.8,主持

9.南京信息工程大学引进人才科研启动项目(2022r019),2022-2024,主持

10. 河南省水土环境污染协同防治重点实验室开放基金(KLSPWSEP-A04),基于无人机遥感的流域水--污染物耦合迁移过程研究,2020-2022,主持

11.国家自然科学基金重点基金(41930102),面向地貌学本源的数字地形分析理论与方法研究,2020-2024,参与

12.国家自然科学基金重点基金(42275028),植被-气候相互作用的因果推理,2023-2026,国家自然科学基金委,参与 

13.国家自然科学基金面上基金(42171402),黄土高原小流域人工造貌信息图谱研究,2022-2025,参与

14.国家自然科学基金面上基金(41771415),基于DEM的黄土勺状沟壑发育特征及区域差异性研究,2018-2021,参与

指导老师对本项目高度重视,积极推动项目团队开展严谨的文献研究,学习相关领域的专业知识与应用技术,并传授如何有效运用实验设备和软件工具,以确保顺利完成项目目标。同时,指导老师在无人机摄影测量、高精度地形建模、基于 DEM 的地形特征提取、数字地形分析等相关领域开展了一系列研究,并取得了一定的研究成果,具有深厚的研究基础和独立开展科研工作的能力。此外,指导老师团队目前已经有多篇文章发表在专业权威期刊上,已验证了本项目提出的部分实验和思路的可行性,为接下来的深入研究提供了有力的保障。部分前期研究成果如下:

1.Wen Dai, Na JHuang Net al. Integrated edge detection and terrain analysis for agricultural terrace delineation from remote sensing images[J]. International Journal of Geographical Information Science202034(3): 484-503.SCI Q1

2.Wen Dai, Xin YangJiaming Naet al. Effects of DEM resolution on the accuracy of gully maps in loess hilly areas[J]. CATENA,2019,177:114-125.SCI Q1

3.Wen Dai, Liyang XiongGilles Antoniazzaet al. Quantifying the spatial distribution of sediment transport in an experimental gully system using the morphological method [J]. Earth surface processes and landforms2021; 46:1188–1208.SCI Q1

4.Dai WenHu GYang Xet al. Identifying ephemeral gullies from high-resolution images and DEMs using flow-directional detection[J]. Journal of Mountain Science 202017(12)3024–3038. SCI Q2

5.代文,陈凯,王春,李敏,陶宇.顾及DEM误差空间自相关的地形变化检测方法[J].地球信息科学学报,2022,24(12):2297-2308. EICSCD

6.代文杨昕刘海龙程益涵周齐飞汤国安基于多源数据的梯田田坎自动化提取方法[P]. 江苏:CN108846402A,2018-11-20.(发明专利)

7.代文杨昕程益涵刘海龙汤国安基于高分辨率遥感影像和DEM的黄土浅沟自动化提取方法[P]. 江苏:CN108830871A,2018- 11-16.(发明专利)

国家级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
李锦洲 地理科学学院 地理信息科学 2022 核心数据分析与处理、代码实现、报告和论文撰写
左琳 电子与信息工程学院 电子信息工程 2023 辅助文献查阅、实验方案优化
阮漫漫 雷丁学院 地理信息科学(中外合作办学) 2022 数据收集、代码实现支持
单雨轩 遥感与测绘工程学院 测绘工程 2022 结果可视化、辅助代码实现
金衍凌 地理科学学院 地理信息科学 2022 样本数据集准备、数据分析、实验设计

指导教师

序号 教师姓名 教师账号 所属学院 是否企业导师 教师类型
代文 003517 地理科学学院

立项依据

  本项目旨在提出一种新的集成策略,充分利用大尺度的遥感图像和DEM地形数据。先是采用了主成分分析SNIC算法对传统的图像分割方法进行优化,然后基于机器学习的方法,建立最优特征组合的沟壑自动映射模型,最后选择由DEM衍生的排水网络作为地形骨架进一步提高自动识别精度。本项目不仅减少了人工视觉解译的需求,而且可以实现对沟壑侵蚀影响区的实时监测,能够更有效地开展水土流失评估,进而为土地管理、环境保护和水土保持规划提供科学依据,从而实现可持续的资源管理和保护。

1)面向对象的图像分割方法

为了避免哨兵数据的波段间存在较强相关性降低分割性能,本项目首先采用主成分分析法,提取出哨兵光学影像的主成分结果。然后,选取前五个主成分作为SNIC分割算法的输入影像,并使用用SNIC算法进行影像分割,以获取地物对象。同时,分别测试了不同参数设置下的使用SNIC算法的分割结果,设置最佳参数。

2)建立基于XGBoost算法的沟壑映射模型

在影像分割后,需要计算各分割对象的特征信息,以实现影像分类。本项目在前人研究的基础上,分别从光谱、纹理、几何和地形信息等四个方面选取了50个特征在获得分割对象的特征影像后,本文建立基于XGBoost算法的沟壑映射模型,以识别提取沟壑由于不同特征选择对分类精度的影响不同,本项目使用变量重要性(VI)作为衡量标准,使用特征选择来确定能够实现最高分类精度的最佳特征组合

3)基于地形骨架线的精度优化

    经过上述方法提取的初步的沟壑识别壑结果,包含了河道区域,本项目需要将河道区域进行剔除,以对精度进行进一步的优化。对此,本项目在ArcGIS Pro3.0.0软件上构建了基于河网-坡度的距离累积方法来优化沟壑结果,使用 AW3D30 DEM 数据进行水文分析提取的地形骨架线,根据河网及坡度,运用距离累积方法提取出非沟壑区域,并将坡度小于5°的区域划定为非沟壑区域,通过从沟壑影响区域中删除非沟壑区域来优化自动映射结果。

沟壑的空间范围作为监测水土流失的本底数据,能为评估土壤侵蚀程度、水土保持、生态治理提供有力的数据支撑。目前,沟壑提取是沟壑相关研究的关注热点之一。野外实地勘测能获取到高精度的沟壑空间范围,该方法通过使用传统量测技术或GPS技术,实现小区域的高精度沟壑提取。在实地调查时,使用手持GPS获取沟壑关键部位的坐标及海拔高度信息,如沟头顶部、沟头底部、沟口底部以及部分沟沿线位置点,然后利用罗盘测量沟坡的坡度、坡向以及沟道朝向,便可获取到沟壑的空间范围。但这种方式需要消耗大量的人力、物力,并不适用于大区域沟壑的测量。

随着遥感技术的发展,中、高分辨率的遥感数据不断涌现,如高分辨率谷歌地球影像、高精度无人机数据,中分辨率的哨兵影像、数字高程模型(Digital Elevation Model,DEM)数据等,这为大区域沟壑提取给予数据支持。对此,学者们先后提出了多种用于沟壑提取的遥测方法,主要分为三大类:基于高分辨率遥感影像目视解译法、基于地貌特征的数字地形分析方法以及基于多源遥感数据的机器学习与深度学习法。

(1)基于高分辨率遥感影像目视解译法

目视解译法是最早的遥感影像解译方法,该方法需要解译员具备良好的地学知识与识别能力,能够根据影像上地物的色调、纹理、阴影等特征,准确勾绘出地物的空间范围,所提取的结果具有高精度的优势。沟壑作为典型的地貌类型之一,具有明显的纹理特征,在影像上能与其他地貌类型区分开来。如Hughes等[1]基于高分辨率遥感影像数据,目视勾绘出澳大利亚东部及西部的沟壑范围;杨力华等[2]基于多期高分遥感影像,勾绘出黄土高原王茂沟流域的沟沿线;苏建华等[3]使用亚米级谷歌地球影像目视解译出黄土高原256个抽样单元的切沟情况。虽然目视解译方法能提取出高精度的沟壑空间范围,但是这种方法需要耗费大量的人力物力,所提取的沟壑有时难以具备时效性,并不适合用于提取大区域沟壑[4]。

(2)基于地貌特征的数字地形分析方法

沟沿线是黄土高原特有的地形结构特征线,也是划分沟壑的重要标志线[5]。基于地貌特征的数字地形分析方法就是通过利用沟沿线具有明显的坡度突变的特点来提取沟壑。该方法一般通过计算地形因子,如坡度、坡向、地形正负开度、汇流面积等,对因子进行阈值处理或数理运算,同时结合水文分析,从DEM数据中提取出沟壑。王轲等[6]基于高分辨率DEM计算地形正负开度及其差值图像,对开度差值图像进行阈值分割处理,得到洛川县堡子头的沟沿线信息。周毅[7]使用均值滤波DEM与原DEM作差,提取了黄土高原48个典型地貌类型区的沟沿线。周毅等[8]和闾国年等[9]基于沟沿线存在坡度突变的特征,利用窗口分析方法得到沟沿线候选点,并连接各点得到沟沿线。Na等[10]借助地形阴影提出适用于黄土台/塬地貌沟壑的双向地形阴影提取法。陈靖涛等[11]综合缓冲区填充法、膨胀腐蚀法以及面积阈值法进一步完善了双向地形阴影法,使该方法适用于不同的黄土地貌区。杨锋等[12]利用汇流方向参数、坡度参数与剖面曲率,探测出黄土坡面流线的坡度拐点,准确识别出继承性与水蚀性沟谷。Passalacqua等[13]根据基本地貌特征,如汇流累积、等高线曲率,提出了一种精度较高的沟谷提取算法。贺晓晖等[14]运用TauDEM统计分析了沟谷高差,确定最佳汇流累积量,提取出较为精细且伪沟谷较少的沟谷网络。虽然基于地形地貌的数字地形分析方法具有明显的地理学含义,且特征设计较为简单、提取效率较高,但是部分方法提取出的沟壑结果较为破碎,往往需要人工后续处理。同时,这类方法对地形数据的分辨率要求较高,限制其应用在大区域沟壑的提取上。

(3)基于多源遥感数据的机器学习与深度学习方法

随着计算机技术的快速发展,机器学习与深度学习方法已被广泛应用于沟壑提取的研究中[15, 16, 17]。这类方法具有自动化程度高、易实现的特点,大致可分为基于像素与基于对象的机器学习,以及基于深度学习模型的方法。基于像素的机器学习方法主要是通过利用多源遥感数据上各像素的光谱、高程等特征值,使用机器学习分类算法,如最大似然法、随机森林、支持向量机等,提取出沟壑区域。该方法提取效率高,但受影像“同物异谱,同谱异物”的影响,提取结果存在较为严重的椒盐噪声[18]。同时,基于像素方法无法充分利用影像上地物对象的纹理和几何信息。对此,Blaschke [19]提出了面向对象影像分析方法,该方法通过使用影像分割算法得到具有同质性的像元集合(即对象),然后利用机器学习中常用的分类算法,以地物对象的纹理、形状、大小、光谱等特征作为分类算法的输入数据,经实验调整模型参数,得到地物轮廓较为完整的分类结果,能有效解决椒盐噪声的问题。Liu等[20]基于高分辨率影像数据与30米DEM数据,利用面向对象影像分析方法,对黄土高原重点流失区的沟壑进行提取,提取精度可达78.8%。

深度学习是机器学习的重要分支,与传统的机器学习算法相比,深度学习模型方法一般具有更好的性能[21]。深度学习(Deep Learning)由Hinton于2006年提出[22],通过使用层训练的策略提升了深层神经网络的应用范围,并解决了参数训练困难的问题。直至2012年,Alex Krizhevshy构建的AlexNet模型在ImageNet大赛中获得冠军,为深度卷积神经网络(Convolutional Neural Network,CNN)时代拉开了序幕[23]。随之,计算机领域涌现了大量的基于卷积神经网络模型,如FCN、U-Net、SegNet、DeepLab、VGGNet、GoogLeNet、ResNet等[24]。虽然深度学习是机器学习的重要分支,但深度学习可从原始数据集科学地构建高级特征,并通过端到端的解决方法预测结果,这往往比机器学习拥有更好的性能。目前,已有不少研究使用深度学习算法对沟壑进行提取。Huang等[25]利用高分辨率影像数据,基于DeepLab深度学习框架提取了青藏高原东北部的沟壑。于佩鑫等利用卷积神经网络自动提取出东北黑土区沟壑的深层特征,发现中层和深层特征比浅层特征具有更高的识别精度。Liu等[26]利用U-Net, R2U-Net和SegNet等深度学习模型识别了黄土高原浅沟,发现SegNet模型的浅沟识别与特征提取性能最好。王泽涛[27]基于高分辨率影像数据与5米DEM数据,使用U-Net模型提取了黄土高原水蚀沟谷与继承性沟谷,精度分别达到93%和76%。Chen等[28]使用0.6米谷歌影像与5米DEM数据,构建了以MobileNetV2为基础网络的DeepLabV3+语义分割模型来提取水蚀性沟壑,并与原始的以Xception为基础网络的 DeepLabV3+和U-Net语义分割模型、随机森林算法进行对比,发现新构建的模型提取精度更高。因此,利用深度学习算法能有效提升沟壑提取的精度,但目前多数研究受高分辨率数据与本地计算能力的限制,仅实现小区域沟壑提取。

综上所述,本项目提出一种新的集成策略,充分利用大尺度的遥感图像和DEM地形数据,包括使用Sentinel 2影像和数字高程模型进行面向对象的图像分割、基于机器学习的分类映射与基于地形骨架线的精度优化,该方法有望为沟渠侵蚀的控制和监测提供基础数据,也可用于黄土地貌和环境变化的研究。

[1]Hughes A, Prosser P, Stevenson J, et al. Gully erosion mapping for the national land and water audit[C]. CSIRO Land and Water, Canberra, Australia. 2001.

[2]杨力华,庞国伟,杨勤科等. 近50年来王茂沟流域侵蚀沟变化及其影响因素[J]. 水土保持学报, 2020, 34(02): 64-70.

[3]苏建华,王春梅,庞国伟等. 黄土高原切沟空间分布特征[J]. 水土保持研究, 2023, 30(01): 134-143+153.

[4]Singh B M. Interpretation of satellite imagery for delineation of ravines[J]. Journal of the Indian Society of Photo-Interpretation, 1977, 5: 31-34.

[5]刘凯. 基于多源数据的黄土高原(重点流失区)侵蚀沟提取及区域差异性研究[D]. 南京师范大学, 2017.

[6]王轲,王琤,张青峰等. 地形开度和差值图像阈值分割原理相结合的黄土高原沟沿线提取法[J]. 测绘学报, 2015, 44(01): 67-75.

[7]周毅. 基于DEM的黄土正负地形特征研究[D]. 南京师范大学, 2008.

[8]周毅,汤国安,王春等. 基于高分辨率DEM的黄土地貌正负地形自动分割技术研究[J]. 地理科学, 2010, 30(02): 261-266.

[9]闾国年,钱亚东,陈钟明. 基于栅格数字高程模型自动提取黄土地貌沟沿线技术研究[J]. 地理科学,1998 (06): 567-573.

[10]Na J,Yang X,Dai W,et al. Bidirectional DEM relief shading method for extraction of gully shoulder line in loess tableland area[J]. Physical Geography,2018,39(4): 368-386.

[11]陈靖涛,史明昌,罗志东等. 基于双向地形阴影法的黄土侵蚀沟自动提取技术[J]. 农业工程学报,2022,38(07): 127-135.

[12]杨锋,周毅,陈旻. 沟沿线约束的黄土水蚀性沟谷提取[J]. 山地学报,2016,34(04): 504-510.

[13]Passalacqua P,Do Trung T,Foufoula‐Georgiou E,et al. A geometric framework for channel network extraction from lidar: Nonlinear diffusion and geodesic paths[J]. Journal of Geophysical Research: Earth Surface,2010,115(F1).

[14]贺晓晖,陈楠. 从规则格网DEM中提取沟谷网络的方法研究[J]. 遥感信息,2015,30(01): 134-138.

[15]Makaya N P,Mutanga O,Kiala Z,et al. Assessing the potential of Sentinel-2 MSI sensor in detecting and mapping the spatial distribution of gullies in a communal grazing landscape[J]. Physics and Chemistry of the Earth,Parts A/B/C,2019,112: 66-74.

[16]Yang X,Li M,Na J,et al. Gully boundary extraction based on multidirectional hill-shading from high-resolution DEMs[J]. Transactions in GIS,2017,21(6): 1204-1216.

[17]Liu K,Ding H,Tang G,et al. Large-scale mapping of gully-affected areas:

[18]Whiteside T G,Boggs G S,Maier S W. Comparing object-based and pixel-based classifications for mapping savannas[J]. International Journal of Applied Earth Observation and Geoinformation,2011,13(6): 884-893.

[19]Blaschke T. Object based image analysis for remote sensing[J]. ISPRS journal of photogrammetry and remote sensing,2010,65(1): 2-16.

[20]Liu K,Ding H,Tang G,et al. Large-scale mapping of gully-affected areas: An approach integrating Google Earth images and terrain skeleton information[J]. Geomorphology,2018,314: 13-26.

[21]Hong H,Pradhan B,Sameen M I,et al. Improving the accuracy of landslide susceptibility model using a novel region-partitioning approach[J]. Landslides,2018,15: 753-772.

[22]Hinton G E,Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science,2006,313(5786): 504-507.

[23]Krizhevsky A,Sutskever I,Hinton G E. Imagenet classification with deep convolutional neural networks[J]. Advances in neural information processing systems,2012,25.

[24]Yuan X,Shi J,Gu L. A review of deep learning methods for semantic segmentation of remote sensing imagery[J]. Expert Systems with Applications,2021,169: 114417.

[25]Huang H,Chen Y,Clinton N,et al. Mapping major land cover dynamics in Beijing using all Landsat images in Google Earth Engine[J]. Remote sensing of environment,2017,202: 166-176.

[26]Liu B,Zhang B,Feng H,et al. Ephemeral gully recognition and accuracy evaluation using deep learning in the hilly and gully region of the Loess Plateau in China[J]. International Soil and Water Conservation Research,2022,10(3): 371-381.

[27]杨锋,周毅,陈旻. 沟沿线约束的黄土水蚀性沟谷提取[J]. 山地学报,2016,34(04): 504-510.

[28]Chen R,Zhou Y,Wang Z,et al. Towards accurate mapping of loess waterworn gully by integrating google earth imagery and DEM using deep learning[J]. International Soil and Water Conservation Research,2024,12(1): 13-28.

1)面向区域尺度的沟壑提取方法

以往对黄土高原沟壑提取的研究主要采用实地调查法、目视解译法、机器学习或深度学习算法提取,但受高精度遥感数据与研究方法的限制,对宏观尺度下不同形态特征、不同光谱特征沟壑的准确提取具有相当的难度。本文基于基于Sentinel 2影像和数字高程模型,构建了一种适用于大区域沟壑提取的方法。该方法使用SNIC算法与XGBoost 算法,充分利用了沟壑的光谱、纹理、地形、几何等50个信息特征,有效提升了沟壑的分类精度与效率。

2)基于地形骨架线的沟壑提取精度优化方法

  充分考虑地表径流对沟壑的形成和发展的影响与控制,选择基于DEM的排水网络作为地形骨架,以改善遥感影像在大尺度沟壑制图中的局限性。在ArcGIS Pro3.0.0软件上构建了基于河网-坡度的距离累积方法来优化沟壑结果,使用 AW3D30 DEM 数据进行水文分析提取的地形骨架线,根据河网及坡度,运用距离累积方法提取出非沟壑区域,并将坡度小于5°的区域划定为非沟壑区域,通过从沟壑影响区域中删除非沟壑区域来优化自动映射结果。


本项目拟运用地理信息科学、测量学、地貌学等相关理论,利用主成分分析、机器学习、图像分割等相关技术,以哨兵2号光学影像、高精度 DEM 数据等为数据源,对研究区的遥感图像进行初步处理,进行面向对象的图像分割,并建立基于XGBoost算法的沟壑映射模型,同时选择由DEM衍生的排水网络作为地形骨架进一步提高自动识别精度,最后将分类模型应用于验证样本集,计算混淆矩阵,对整体空间精度进行评估。

1)影像数据及预处理

为提取大区域黄土高原黄土沟壑,本文使用了大范围内可获取的、具有中高分辨率的多源遥感数据,包括10米分辨率的哨兵2号光学影像哨兵1SAR影像以及30米分辨率的AW3D30 DEM影像。以上数据均源自GEE平台(如 1所示),地理坐标系为WGS 84。考虑到本项目研究区位于中纬度地区,本文数据的投影均采用兰伯特投影,中心经纬度为108°E37°N,两条标准纬线为30°N60°N

1项目所用影像数据汇总表

数据名称

空间分辨率

数据源

哨兵2号光学影像

10m

https://developers.google.com/earth-engine/datasets/catalog/COPERNICUS_S2_SR

AW3D 30 DEM

30m

https://developers.google.com/earth-engine/datasets/catalog/JAXA_ALOS_AW3D30_V3_2

   哨兵1SAR影像

10m

https://developers.google.com/earth-engine/datasets/catalog/COPERNICUS_S1_GRD

同时,选择了2020年所有云量低于20%的哨兵2号光学影像,并在GEE平台上使用QA60波段对云进行了遮蔽。

2)样本数据集的制作

考虑到黄土高原地貌类型丰富,不同地貌类型区的沟壑发育情况不同,形态上存在一定的差异。因此,本项目在制作沟壑样本时,分别在不同的黄土地貌类型区勾绘沟壑样本,保证样本的多样性。本文在五个典型地貌样区选取沟壑样本,分别是神木县、绥德县、延川县、宜君县和淳化县。各典型地貌样区的地形地貌基本情况如表2所示。

本项目将在所选取的五个典型地貌类型区上绘制沟壑点状训练样本,并且在黄土高原重点流失区内随机勾绘了沟壑的面状验证样本。该样本点与样本面数据集将由团队成员在高分辨率谷歌地球影像上目视绘制与核验,每个样本被标注为沟壑与非沟壑。

2黄土高原典型地貌样区基本概况

样区

地貌类型

平均高程(m)

相对高差(m)

平均坡度(°)

地形特征

淳化县

黄土塬区

1059.3

1211.0

12.6

塬面地形平缓,多被大型沟壑深切割裂

宜君县

黄土长墚残塬沟壑

1162.3

1122.0

17.4

沟谷溯源侵蚀强烈,重力侵蚀活跃

延川县

黄土墚峁状丘陵沟壑

980.3

916.0

23.8

相对切割深度较大

绥德县

黄土峁状丘陵沟壑

990.0

691.0

21.7

丘陵起伏,土壤侵蚀较为剧烈

神木县

风沙-黄土过渡带

1155.0

750.0

10.3

连片低丘,其上覆盖薄层片沙和低缓沙丘


3)面向对象的图像分割

在进行影像分割之前,本项目使用主成分分析方法提取出20幅哨兵2号中值影像的主成分结果,即各季度红、绿、蓝、近红外波段与归一化植被指数(Normalized Difference Vegetation IndexNDVI)的主成分影像。根据主成分分析结果,选取前五个主成分作为SNIC分割算法的输入影像。

GEE上,SNIC算法的参数主要有“size”“compactness”“connectivity”“neighborhoodSize”,且各参数具有不同的含义与功能( 3.2)。考虑到沟壑的形状和宽度,本文测试了不同参数设置下的分割结果,通过对比设置出最优的分割参数。

3SNIC分割算法参数设置

参数

定义

本文设置结果

Size

对象的尺度大小,值越大,所生成的对象尺度就越大

8

Compactness

 

对象的形状,值越大,所生成的对象则更为紧凑(呈现为方形)

0.1

Connectivity

 

与相邻对象的连接类型(设置为4queen连接,8rook连接)

8

Neighborhood Size

相邻对象的尺度大小,一般设为128256,可避免瓦片边界的伪影

256

 

4)使用XGBoost算法进行分类映射

在影像分割后,需要计算各分割对象的特征信息,以实现影像分类。本项目在前人研究的基础上,分别从光谱、纹理、几何和地形信息等四个方面选取50个特征(如表3所示)。在光谱信息方面,以往研究多使用单幅影像的红绿蓝波段,未考虑到沟壑复杂的动态光谱特征。对此,本文综合考虑了沟壑在各季度的光谱信息,除了选取常用的蓝、绿、红、近红外波段以外,还计算了具有动态模式的归一化植被指数NDVI,共包含20幅光谱信息影像。在地形信息方面,由于地形因素是影响沟壑发育的重要因子,沟壑与地形因素之间存在一定的相关性。本文根据前人研究,选用了3个常用的地形因子(坡度、地表切割指数和正负地形指数),来提取黄土沟壑。此外,沟壑具有明显的地形纹理信息,通过使用灰度共生矩阵模型(Gray-Level Contribute MatrixGLCM能计算出各地形的纹理信息。GLCM模型中包含有13个纹理特征,本文选取了其中8个纹理特征来提取沟壑,分别是二阶角矩、非相似性、相关度、熵、对比度、总和平均、总和方差和惯性。在GEE上分别计算了坡度、地表切割指数和正负地形指数的8个纹理特征影像。通过对比不同核大小的纹理信息结果,最终选取了核大小参数为3×3GLCM结果,共得到24个地形纹理信息影像。最后,本文还计算了各对象的几何特征信息,主要有面积、长度和宽度。

3本文所使用的分类特征

分类特征

定义及计算公式

光谱特征

 

蓝波段中值-T1/T2/T3/T4

绿波段中值-T1/T2/T3/T4

红波段中值-T1/T2/T3/T4

近红外波段中值-T1/T2/T3/T4

NDVI指数中值-T1/T2/T3/T4

 

2020年各季度哨兵2号蓝波段中值影像、绿波段中值影像、红波段中值影像、近红外波段中值影像,以及NDVI中值影像。T1表示1~3月;T2表示4~6月;T3表示7~9月;T4表示10~12月。NDVI的计算公式为:

                   

其中,NIR为哨兵2号的近红外波段,RED为哨兵2号的红波段。

地形特征

 

坡度(Slope

 

坡度能表示出地表面在某点上的倾斜程度,是指过某点的切平面与水平面的夹角。公式为:

                    

其中, q表示高程差;p表示水平距离。

 

地表切割指数(Surface Cut DepthSCD

 

地表切割指数能反映出地表的起伏程度,是指某点邻域范围内的平均海拔与该邻域范围内的最低海拔之差。本文公式为:


其中,表示在3×3邻域范围内的平均高程值;表示在3×3邻域范围内的最小高程值。

 

正负地形指数(Positive and negative terrainPNT

 

正负地形指数能指示出地形的正负情况,在黄土高原区域,在沟沿线以上的为正地形,在沟沿线以下的为负地形。可通过计算某点邻域范围内的原始海拔高度与该邻域范围内的平均海拔高度之差获得。本文公式为:


其中,表示某点的原始高程值;为某点在3×3邻域范围内的平均高程值。

地形纹理

特征

 

二阶角矩(Angular second momentASM

 

二阶角矩可反映出纹理特征分布的均匀和粗细程度,又称为能量。公式为:

              

 

 

对比度(ContrastCON

对比度能反映出邻近栅格间的反差,也可以表示出纹理的明显度或强度。公式为:


 

 

相关度(CorrelationCorr

 

相关度能度量共生矩阵在行列方向上的相似程度,公式为:


 

 

非相似性(DissimilarityDISS

 

非相似性与对比度类似,其变化与局部对比度的相一致。公式为:

                   

 

 

熵(EntropyENT

 

熵表征图像的信息量,用来衡量灰度分布的随机性,指示纹理的复杂程度。公式为:

          

 

 

总和平均(Sum AverageSAVG

 

总和平均能用于描述图像的灰度级分布和纹理特征。公式为:


 

 

总和方差(Sum VarianceSVAR

 

总和方差能用来衡量图像中纹理的变化程度,值越大,表示图像中纹理的变化越剧烈。公式为:

      

 

 

惯性(Inertia

 

惯性主要用来衡量图像纹理的变化程度,可描述纹理在水平和垂直方向上的一致性或不一致性。当纹理越均匀、越平滑,惯性值越小;当纹理变化剧烈、不规则时,惯性值越大。公式为:


 

几何特征

面积

高度

宽度

分割对象的面积大小

分割对象纬向的最大长度

分割对象经向的最大长度

在获得分割对象的特征影像后,本项目R软件中实现的XGBoost来构建模型并使用训练数据集训练模型,并XGBoost模型设定最佳的初始参数,如学习率、最大树深度、正则化系数等以获得最佳性能考虑到其中一些指标会影响模型减少过拟合的能力,因此需要采用微调过程。选择10倍交叉验证(CV)方法,基于样本数据集对XGBoost模型进行调整。

特征选择是影响XGBoost模型性能的重要因素,是由基于平均准确率下降(MDA)的特征重要性(VI)确定。本项目将使用特征选择来确定能够实现最高分类精度的最佳特征组合,在10次计算运行后根据MDA确定VI 排名,选择最重要的 15 个特征来迭代建立XGBoost模型,同时,逐步排除最不重要的特征,以优化模型的分类效果。

5)基于地形骨架线的精度优化

过上述沟壑映射模型初步提取的沟壑结果,包含了河道区域,本项目需要将河道区域进行剔除。对此,本文在ARCGIS Pro3.0.0软件上构建了基于河网-坡度的距离累积方法来优化沟壑结果(如图1所示)。首先,基于AW3D30 DEM影像计算出研究区内各县的坡度结果,并使用水文分析方法获取各县的河网,具体步骤有填洼、流向计算和汇流累积量计算。根据本文对沟壑对象的定义,汇流累积量的阈值设置为50km2,从而获取到非沟壑的河网。然后,基于坡度与河网信息,使用距离累积方法得到河道范围。由于河道区域的地表趋于平缓,将河网作为距离累积的要素源,坡度作为成本栅格,能得到坡度成本下的河网距离累积栅格,设置栅格阈值为2000,可有效获取到河道范围,即非沟壑区域。此外,考虑到古代沟壑道内存在淤地坝等人造地貌,本项目将坡度小于的区域设置为非沟壑区域。最后,剔除掉初步识别结果上的非沟壑区域,并使用消除工具,消除结果中面积小于1000m2的碎斑,进而得到优化后的沟壑结果

                                               

1基于河网-坡度的距离累积优化方法

6)分类结果精度评价

精度验证是评估沟壑提取结果准确与否的重要步骤,本项目使用混淆矩阵的方法来进行精度验证。所使用的验证样本为面状沟壑样本,这更能准确地评估本文方法所生成的沟壑结果。以下为所应用到的精度评估指标及其计算公式:

总体精度(Overall AccuracyOA),正确提取的面积的总比例:


1

用户精度(Users AccuracyUA),正确提取的面积占总提取面积的比例:


2

生产者精度(Producers AccuracyPA),正确提取的面积占实际真实面积的比例:


3

F分数(F1),即精确度和召回率的调和平均值:


4

其中,TP代表正确提取的沟壑面积,TN代表正确提取的非沟壑面积。FP分别代表错误提取的沟壑面积,FN代表错误提取的非沟壑面积。精确度和召回率的计算分别与生产者精度和用户精度的计算相一致。

技术路线思路如下图所示:

                                                              

时间

 研究工作

 预期成果

20244-20246

 前期研究准备

1)资料收集与整理

2)相关软件和算法学

3)数据准备与分析

1)制订完备的研究方案

2)完成对研究样区的相关

资料分析与整理

202410-202412

进行图像分割和建立映射模型

1)对遥感影像进去图像分割

2计算各分割对象的特征信息

3)训练XGBoost模型

1)得到哨兵2号的主成分分析影像的分割结果

2)得到初步的提取结果

202410-202412

精度优化与准确性评价

1)基于地形骨架线进行精度优化

2) 基于混淆矩阵进行准确性评价

1)得到优化后的沟壑识别

1)空间精度评价结果

 

 

2025 1-2025 4

总结研究成果

1)分析关黄土高原沟壑自动提取方法

2)撰写项目结项报告

3)撰写论文

1)完成结项报告

2)申请一项有关黄土高原沟壑自动提取方法的发明专利

3)完成一篇论文发表

1)研究积累

指导老师在无人机摄影测量、高精度地形建模、基于 DEM 的地形特征提取、数字地形分析等相关领域开展了一系列研究,并取得了一定的研究成果,具有深厚的研究基础和独立开展科研工作的能力。此外,指导老师团队目前已经有多篇文章发表在专业权威期刊上,已验证了本项目提出的部分实验和思路的可行性,为接下来的深入研究提供了有力的保障。部分前期研究成果如下:

1.Wen Dai, Na J, Huang N, et al. Integrated edge detection and terrain analysis for agricultural terrace delineation from remote sensing images[J]. International Journal of Geographical Information Science, 2020, 34(3): 484-503.SCI Q1

2.Wen Dai, Xin Yang, Jiaming Na, et al. Effects of DEM resolution on the accuracy of gully maps in loess hilly areas[J]. CATENA,2019,177:114-125.SCI Q1

3.Wen Dai, Liyang Xiong, Gilles Antoniazza, et al. Quantifying the spatial distribution of sediment transport in an experimental gully system using the morphological method [J]. Earth surface processes and landforms, 2021; 46:1188–1208.SCI Q1

4.Dai Wen, Hu G, Yang X, et al. Identifying ephemeral gullies from high-resolution images and DEMs using flow-directional detection[J]. Journal of Mountain Science 2020, 17(12), 3024–3038. SCI Q2

5.代文,陈凯,王春,李敏,陶宇.顾及DEM误差空间自相关的地形变化检测方法[J].地球信息科学学报,2022,24(12):2297-2308. EICSCD

6.代文 杨昕 刘海龙 程益涵 周齐飞 汤国安基于多源数据的梯田田坎自动化提取方法[P]. 江苏:CN108846402A,2018-11-20.(发明专利)

        7.代文、杨昕、程益涵、刘海龙、汤国安基于高分辨率遥感影像和DEM的黄土浅沟自动化提取方法[P]. 江苏:CN108830871A,2018- 11-16.(发明专利)

       (2已取得的成就

本团队已经在GEE进行了数据获取和数据预处理的工作,加载10米分辨率的哨兵2号光学影像哨兵1SAR影像以及30米分辨率的AW3D30 DEM影像选定中国黄土高原为主研究区域,经纬度范围为100.90°E-114.55°E33.72°N-41.27°N同时,为了验证所提方法在整个黄土高原沟壑影响区测绘中的普遍适用性,选取代表不同地貌类型的 5 个典型黄土高原侵蚀区作为研究样区 淳化县,为黄土台地宜君县为黄土长岭破碎台地延川县为黄土岭丘陵沟壑绥德县为黄土丘陵沟壑神木县为黄土风积地沙丘过渡区。具体研究区信息可见4、项目研究技术路线”部分

同时,我们已经筛选出了研究区2020年所有云量低于20%的哨兵2号光学影像,并在GEE上使用位运算与QA60波段,对光学影像进行去云处理。然后,以季度为单元,获取到每季度红、绿、蓝、近红外波段的中值影像,共计20幅中值影像。

为了防止图像中高度相关的变量影响图像分割的性能,我们已经对 20 哨兵2号光学影像使用主成分分析方法(Principal Component AnalysisPCA)提取出主成分结果然后选择总信息比例大于90的前5PCA分量(如1、表1所示)为图像分割作准备。

                                 

1哨兵2光学影像中对5个研究样区提取出的主成分结果

1)淳化县;(2宜君县;(3延川县;(4绥德县;(5神木县

 

1研究样区的前五主成分所占总信息量比例

研究样区

第一主成分

第二主成分

第三主成分

第四主成分

第五主成分

总和

淳化县

42.51

41.16

7.08

4.75

2.74

98.24

宜君县

74.16

11.08

7.95

3.84

1.02

98.05

延川县

56.05

19.71

10.28

7.14

3.28

96.46

绥德县

46.79

28.95

10.88

5.79

4.02

96.43

神木县

61.05

19.47

8.97

3.36

2.98

95.83

          综上,本项目已初步完成了数据准备和预处理,并使用主成分分析法进行数据降维,以提高后续图像分割的模型性能。

1.已具备的条件

1项目负责人和团队成员已经积极投身于GEE编程的学习重点关注了JavaScript API,提高了数据处理、影像处理、遥感和地理信息系统(GIS)等方面的技能。团队成员通过参加在线课程、培训和练习,已经具备了扎实的GEE编程基础,并在在处理地表覆盖分类、植被生长动态和水文变化等方面的实际问题时表现出强大的编程能力

2)项目负责人及团队成员已投身于广泛的研究,涉猎了众多遥感影像自动识别、数字地形分析与计算机视觉的相关学术文献。这些文献研究使得团队对于研究方向和方法有了深入的了解,并在专业知识积累方面具有了明显优势。经过大量学术文献阅读与实践,团队成员对于研究课题具有清晰的认识,充分理解问题的复杂性和技术挑战,并展现出极高的研究热诚。

3)团队成员不仅仅全面理解了遥感影像处理中的各类前沿技术,如图像预处理、分类算法、地物提取、时空分析等,还深入研究了各种数字地形分析工具,如地形变量计算、地形模型提取、地形分析等。此外,团队还探讨了计算机视觉领域的相关基础原理与技术,如特征检测与匹配、目标识别与跟踪、深度学习与目标检测等。同时,项目负责人曾在生命科学竞赛中参与“基于PIE的湖泊生态环境修复与藻类污染空间分析系统”的研究,学会了用PIE对遥感影像进行校正、分类、特征提取、变化检测等多种处理和分析。这些研究为团队奠定了全面而扎实的专业基础,使得在实际应用中能迅速寻找解决问题的最佳方法。

2.尚缺少的条件及解决方法

Sentinel-2地表反射率图像和AW3D30 DEM数据可以为沟壑影响区域的测绘提供丰富的光谱和地形信息,但它们的分辨率使得在负地形中绘制一些宽度小于10 m的河岸沟壑变得困难。虽然使用高分辨率图像(例如无人机数据)有利于提高测绘精度。但是高分辨率图像由于成本较高,不适合大规模测绘。我们可以利用超分辨率方法以提高图像的分辨率,可用于增强 Sentinel-2 AW3D30 DEM 图像,以更有效地增强图像质量。绘制宽度较窄的河岸沟壑。此外,Sentinel-1A 的合成孔径雷达 (SAR) 图像在土壤侵蚀测绘方面具有优势,因为该卫星支持全天时、全天候传感;因此,所得信息可以在一定程度上提高绘图精度。

    另外,本项目所提出的方法虽然可以扩展到支持全球类似黄土高原的不同地貌类型区域的沟壑影响区域测绘,例如中国东北黑土地区的沟壑影响区域,但在其他地区的实施需要重新选择训练样本和微调参数。因此,将深度学习算法与 GEE 相结合以进一步提高绘图精度和效率非常有意义。通过离线训练深度学习模型,然后在 GEE 上重现训练后的模型,我们可以在 GEE 上使用训练后的模型时跳过选择样本的步骤

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 10000.00 6000.00 4000.00
1. 业务费 8000.00 5000.00 3000.00
(1)计算、分析、测试费 2000.00 数据处理与分析 1500.00 500.00
(2)会议、差旅费 2000.00 交流与合作费用 1000.00 1000.00
(3)文献检索费 1500.00 获取相关文献资料 900.00 600.00
(4)论文出版费 1500.00 论文版面费 1200.00 300.00
2. 实验装置试制费 1000.00 购买高性能计算机、购买图形处理器(GPU)、投资云计算资源 500.00 500.00
3. 材料费 1000.00 数据可视化产品的制作费用以及技术支持服务 500.00 500.00

项目附件

  • 地理科学学院+基于sentinel 2影像和数字高程模型的沟壑识别+李锦洲(2).pdf
    下载
结束