基于特征选择和GA-BP神经网络的多源遥感农田土壤水分反演
摘要:土壤水分是影响水文、生态和气候等环境过程的重要参数,而微波遥感是农田地表土壤水分测量的重要手段之一。针对微波遥感反演农田地表土壤水分受植被覆盖影响较大的问题,该研究提出了一种基于特征选择和GA-BP神经网络(GeneticAlgorithm-BackPropagationneuralnetwork)的多源遥感农田地表土壤水分反演方法。首先对Sentinel-1微波遥感数据和Sentinel-2光学遥感数据进行预处理并提取21个特征参数;然后采用差分进化特征选择(DifferentialEvolutionFeatureSelection,DEFS)算法从21个特征中选出包含10个参数的最优特征子集,并利用主成分分析(PrincipalComponentAnalysis,PCA)法将特征子集进行降维;之后建立BP神经网络,采用遗传算法(GeneticAlgorithm,GA)对BP网络的节点权值进行优化,使用降维后的特征矩阵和部分实测土壤含水量数据对BP网络进行训练;最后利用训练好的GA-BP网络对研究区土壤水分进行反演,并利用实测数据对反演结果精度进行对比验证。试验结果表明,该研究反演结果的决定系数为0.7893,均方根误差为0.0287cm3/cm3,相比单纯使用GA-BP神经网络,加入DEFS和PCA之后决定系数提高了0.2157,同时均方根误差降低了0.0295cm3/cm3。该结果展示了DEFS和PCA算法在土壤水分反演最优特征集选择的有效性,为多源遥感农田地表土壤水分反演提供了新思路。
关键词:土壤水分;遥感;BP神经网络;遗传算法;特征选择;主成分分析
0引言
土壤水分对于植被生长、农业生产和生态系统循环具有重要影响。土壤水分监测在气象、水文、农业等多学科中发挥着重要的作用[1-2]。在现代农业中,土壤水分更是不可或缺的重要指标,全面监测土壤水分可以对农作物产量、旱情墒情和农作物长势起到指导和决定性作用。因此,研究农作物覆盖下的地表土壤水分分布情况具有重要意义[3-5]。
1研究区与数据源
1.1研究区概况
研究区位于河南省开封市祥符区,面积约900km2,大致范围为34°36'~34°51'N,114°30'~114°45'E,如图1所示。研究区为黄河冲积平原的一部分,地势平坦,属温带大陆性季风气候,冬季寒冷干燥,夏季高温多雨,平均海拔65m,年平均气温14℃,年降水量628mm,无霜期214d。主要种植冬小麦、玉米、棉花等作物,其中冬小麦的生长周期为8个月,一般10月播种,次年6月收获。冬小麦在不同物候期的生物量和生物特征不同,地表土壤水分在不同时间、不同地点也有较大差异。试验处于冬小麦的出苗期、分蘖期和越冬期,这3个物候期内冬小麦植株较小,植被高度及覆盖度均较低,地面植被覆盖情况变化不大,且农田已不再发生犁地、播种等影响地表粗糙度的田间活动。因此,本文针对这3个相近的物候期进行统一建模和分析,使用这3个物候期的遥感数据和地面实测数据进行神经网络训练、土壤水分反演与结果精度评价。
1.2数据源及预处理
1.2.1地面实测数据
土壤水分遥感反演研究中使用的地面实测土壤水分数据主要有两种来源,一种是来源于研究区内的地面观测站点或自动观测网络[11-12,17-18],此类实测数据获取方便且通常采集频率较高、采集数量较大,以此为基础开展的土壤水分反演研究中反演算法或反演模型的可选种类较多、选择空间较大;另一种是来源于传统的人工测量方法[5-6,13-14],在卫星过境日期依靠人工进行地面采样测量,此类实测数据往往获取困难且通常采集次数有限、采集数量较少,以此为基础开展的土壤水分反演研究中反演算法或反演模型的可选种类相对较少、选择空间相对较小。本文研究区内没有地面观测站点和自动观测网络,因此采用人工测量方法来获取地面实测数据,并开展基于小样本量实测数据的土壤水分反演研究。
在Sentinel-1A卫星过境的时间,同步进行3次野外实地考察和采样,现场采集土壤水分值和经纬度坐标。研究区地面共设置20个采样点,采样点分布如图1b和图1c所示。
1.2.2遥感数据
本文使用欧空局(EuropeanSpaceAgency,ESA)提供的遥感数据,如表1所示。使用欧空局研发的哨兵应用平台(SentiNelApplicationPlatform,SNAP)软件对所获取的SAR图像进行辐射定标、多视、RefinedLee滤波和地形校正等预处理操作。根据Sentinel-1ASAR图像获取日期和是否出现云雾雨等影响土壤水分大幅度波动的天气因素,选择相近日期的3景准同步光学图像作为试验数据。在SNAP软件中使用Sen2Cor插件对所获取的多光谱成像仪(MultiSpectralImage,MSI)图像进行大气校正等预处理操作。
2研究方法
2.1特征参数提取
SAR通过向地物发射微波波束和接收回波信号来探测地物特性,波长、入射角和极化方式等雷达系统参数和目标地物的介电常数、物理结构等特征参数对雷达信息具有直接的影响,从雷达数据中提取可以表征地物特性的特征信息是雷达遥感反演的基础。
2.1.1后向散射系数
土壤水分反演时主动微波遥感主要通过后向散射系数所反映的信息进行反演。依据采样点的经纬度,从预处理之后的SAR数据中提取相应位置的入射角(θ)、VV极化后向散射系数(?0VV)、VH极化后向散射系数(?0VH)作为后续试验的特征参数。由于cos(θ)和sin(θ)与土壤湿度也存在一定的关系[18],并且?0VH/?0VV在雷达入射角一定的情况下其后向散射系数仅与地表粗糙度有关[19],所以将cos(θ)、sin(θ)和?0VH/?0VV也作为特征参数,并将?0VH+?0VV、?0VH-?0VV、?0VH×?0VV加入其中,从SAR数据中提取共计9个与雷达后向散射系数相关的特征参数。
2.1.2极化特征参数
极化分解可以将地物较为复杂的散射过程分解成若干简单的散射机理。通过极化分解的方式,可以从SAR遥感数据中提取更多的特征参数[20]。对双极化Sentine1-1A数据采用H/A/α分解,对目标地物的相干矩阵或者协方差矩阵进行特征值分解,可以从中提取出表征目标散射极化程度的极化熵H,表征目标散射机理的平均散射角α,极化熵的补充参数—反熵A,以及可以表示该散射机制强度的特征值λ1和λ2[21-22],从SAR数据中提取共计5个极化特征参数。
2.2差分进化特征选择与主成分分析
在使用神经网络进行预测时,过多的输入数据可能会造成数据灾难,影响神经网络的学习,通常会采用特征选择和特征抽取这两种方法将数据降到更低维度,达到去除冗余数据的目的。特征选择是单纯地从提取到的所有特征中有依据地选择较为重要的部分特征作为训练集特征,被选择的特征可以大概表征全体数据的信息,特征在选择前后并不改变本身值的大小。而特征抽取的本质上是从一个维度空间映射到另一个维度空间,映射过程相当于一个黑盒,没有确定的筛选依据,而是借助数学工具来进行降维,特征抽取后的特征失去了本身的物理意义,相应特征值也会改变。
3结果与分析
表3为不同试验方案反演结果精度对比,图5为不同试验方案土壤水分反演结果与实测值对比。由表3和图5试验结果可以看出,本文所提方法的反演值和实测值更为接近,Bias、RMSE和ubRMSE比方案一、方案二更小,同时R2更高。并且在方案二中,仅使用DEFS算法进行特征选择后也比方案一的反演结果精度更高。本文方法反演结果的决定系数为0.7893,均方根误差为0.0287cm3/cm3,相比单纯使用GA-BP神经网络,加入DEFS和PCA之后决定系数提高了0.2157,同时均方根误差降低了0.0295cm3/cm3。试验结果表明,本文所提方法可以有效去除多余特征参数,提高土壤水分反演精度。
使用本文所提方法获得的研究区农田土壤水分反演结果如图6所示,其中为了去除非农田区域对土壤水分反演的影响、更好地显示土壤水分分布情况,试验中滤除了建筑、道路、河流等非农田区域,如图6中白色区域所示。结果显示2019年10月18日土壤水分反演值整体较高,均值为0.155cm3/cm3,主要是由于10月上旬研究区多次降雨,土壤比较湿润。10月30日研究区土壤水分反演值均值为0.136cm3/cm3,比10月18日略低,与10月下旬天气晴朗关系较大。2019年12月29日反演结果整体较干旱,均值为0.070cm3/cm3,主要是因为入冬后温度有时会降到0℃以下,低温会导致土壤含水量降低,寒风也会助长土壤水分的蒸发。经分析可知,这3个日期的土壤水分反演结果与实际天气情况比较吻合。此外,3个日期的采样点土壤水分实测数据均值分别为0.162、0.136和0.065cm3/cm3,反演结果与采样点实测土壤水分值频率分布较为一致,进一步验证了本文所提方法的有效性。
4结论
本文基于Sentinel-1和Sentinel-2多源遥感数据,提取了21个与土壤含水量相关的特征参数,经过差分进化特征选择(DEFS)和主成分分析(PCA)算法对特征参数进行筛选和降维后,结合地面实测数据,使用GA-BP神经网络反演土壤水分,并探讨了DEFS和PCA算法对土壤水分反演精度的影响,主要结论如下:
1)不同特征参数所含的信息存在不同程度的重复和冗余,DEFS算法可以去除掉相关性较大、重复性较高的特征参数,保留信息含量多且相关性较小的特征参数。
2)在使用GA-BP神经网络反演土壤水分的过程中,多余的特征参数会影响土壤水分反演结果的精度,组合使用DEFS和PCA算法可以剔除冗余特征参数,有效提高反演精度。本文方法反演结果的决定系数为0.7893,均方根误差为0.0287cm3/cm3,相比单纯使用GA-BP神经网络,加入DEFS和PCA之后决定系数提高了0.2157,同时均方根误差降低了0.0295cm3/cm3。
虽然本文试验考虑了地表粗糙度,但由于缺乏地面实测粗糙度数据,所以试验中参考已有研究成果使用了从SAR数据中提取的地表粗糙度参数,这可能会影响反演精度。此外,相比于本文所用的双极化SAR数据,全极化SAR数据中包含更多与土壤湿度相关的信息,可以提取更多的特征参数,使用全极化SAR数据有可能会进一步提高反演精度。在今后的研究中,可以考虑针对以上因素对试验进行改进。
[参考文献]
[1]WangHQ,MagagiR,GoitaK.Potentialofatwo-componentpolarimetricdecompositionatC-bandforsoilmoistureretrievaloveragriculturalfields[J].RemoteSensingofEnvironment,2018,217:38-51.
[2]AnagnostopoulosV,PetropoulosGP,IrelandG,etal.Amodernizedversionofa1Dsoilvegetationatmospheretransfermodelforimprovingitsfutureuseinlandsurfaceinteractionsstudies[J].EnvironmentalModellingandSoftware,2017,90:147-156.
[3]BeckHE,DeJeuRAM,SchellekensJ,etal.Improvingcurvenumberbasedstormrunoffestimatesusingsoilmoistureproxies[J].IEEEJournalofSelectedTopicsinAppliedEarthObservationsandRemoteSensing,2009,2(4):250-259.
赵建辉1,2,3,张晨阳1,2,3,闵林2,3,4※,李宁1,2,3,王颖琳1,2,3
《基于特征选择和GA-BP神经网络的多源遥感农田土壤水分反演》
- 职称论文刊发主体资格的
- 政法论文浅析工会法主体
- 化学在初中教学中的情感
- 中学教育论文思想政治方
- 法治论文投稿法治型市场
- 杂志社论文发表浅析推动
- 新疆教育报投稿浅析学生
- 分男女招生录取的合宪性
最新优质论文
- 职称晋级论文检索才认可
- 教师类职称论文一般多少
- 新闻专业有哪些职称
- 医学领域cscd期刊怎么查找
- 浙江师范大学学报编辑部
- 职称评定需要发表什么样
- 如何提供职称论文的知网
- 论文发表三步曲
论文发表问题热点
- 毕业及职称论文发表需要
- 工程管理专业论文摘要准
- 《教育探索》核心级教育
- 博士生毕业论文答辩技巧
- 电力系统职称核心期刊怎
- 发表职称论文如何鉴别期
- 简述机械工程师基础考试
- 硕士从助工晋升中级职称