Regional tropospheric delay modeling considering terrain environment factors
-
摘要:
对流层延迟是影响GNSS精密定位的主要误差源之一. 近年来,机器学习被广泛应用于对流层延迟建模领域,本文基于中国区域的GNSS对流层数据和归一化植被指数(normalizeddifference vegetation index, NDVI),建立了一种顾及以NDVI为代表的地形因素的区域对流层延迟(NDVI constrained regional zenith tropospheric delay, NZTD)模型. 结果表明,NZTD模型在中国区域内的均方根误差(root mean square error, RMSE)为7.91 mm,平均偏差(Bias)为1.43 mm,较GPT3模型分别减少了70%和65%,且对季节性变化具有更强的抗干扰性. 此外,NZTD模型的预测性能较未约束NDVI的区域对流层延迟模型具有显著提升,平均精度提升为8%. 这表明,NZTD模型能够细化不同地理区域的环境特征、反映对流层延迟的精细变化,具有更好的适应性和准确性.
-
关键词:
- GNSS /
- 对流层延迟 /
- 归一化植被指数(NDVI) /
- 机器学习
Abstract:Tropospheric delays act as one of the main error sources affecting the precision positioning of the GNSS. In recent years, machine learning has been widely used for modeling tropospheric delays. Based on the GNSS tropospheric delay and normalized difference vegetation index (NDVI) in China, a novel NDVI-constrained regional tropospheric delay model (NZTD) is established by considering the topographic factors represented by NDVI. The results show that the root mean square error (RMSE) and the mean bias (Bias) of the NZTD model in China are 7.91 mm and 1.43 mm, showing 70% and 65% decreases compared with that of the GPT3 model, respectively. Meanwhile, the NZTD model possesses stronger anti-interference to seasonal changes than the GPT3 model. In addition, the NZTD model demonstrates significantly improved accuracy performance compared with the regional tropospheric delay model without NDVI constraint, evidenced by the average enhancement of 8%. It shows that the NZTD model can refine the environmental characteristics of different geographical regions and reflect the fine changes of tropospheric delay, with better adaptability and accuracy.
-
0. 引 言
对流层作为地球空间环境中重要的组成部分之一,包含了地球大气层中绝大部分的大气水汽,是与人类活动联系最为密切的大气圈层[1]. 由于无线电信号的传播会受到水汽的影响,GNSS的电磁波信号在穿过对流层时会产生传播路径弯曲及传播速度衰减的现象,从而产生传播时间上的滞后,由此引起的信号延迟被称为对流层延迟,其在测站天顶方向的投影被称为天顶对流层延迟(zenith tropospheric delay,ZTD). 作为在GNSS定位服务中不可忽视的误差源之一,ZTD的精确改正对于GNSS快速高精度定位应用至关重要. 目前,常见的ZTD经验模型可分为两种:第一种ZTD模型需要实测气象参数,主要包括Saastamoinen[2]和Hopfield[3]等模型;第二种ZTD模型则无需实测气象参数[4],主要依靠大量的历史经验数据建立各类影响因素与ZTD之间的映射关系,主要包括欧洲地球静止导航重叠服务(European Geostationary Navigation Overlay Service, EGNOS)[5]模型、GPT2[6]和GPT2w[7]等模型.
受限于简单的函数表达结构,上述模型的精度表现在厘米级到分米级不等,难以满足当前GNSS精密定位对实时高精度的应用需求[8]. 近年来,随着人工智能的发展,机器学习在数据挖掘中展现出强大的时空特征提取能力,使其在ZTD等非线性模型的构建中有着广阔应用前景. 王勇等[9]基于反向传播(back propagation,BP)神经网络建立了精度较高的ZTD模型. 肖恭伟等[10]提出了基于改进的BP神经网络建立区域ZTD模型,较好地解决了BP神经网络处理大量数据时易出现过拟合现象的问题. 此外,时瑶佳等[11]提出了一种基于开源人工智能计算平台的长短期记忆网络(long short-term memory,LSTM)的ZTD模型,模型精度相比于BP神经网络模型具有较大的提升.
上述基于机器学习建立的ZTD模型相比于传统的经验模型在精度方面都有所改善,然而,由于ZTD中的湿分量主要受水汽含量的影响[12],而对于植被覆盖情况等影响水汽传输的地形因素[13]并未在上述模型中进行考虑,使得上述模型难以准确捕捉ZTD的时空变化特性. 基于此,为了更精确地描述对流层延迟的时空分布特性、提高ZTD模型的可靠性,本文利用中国区域的GNSS对流层延迟数据和归一化植被指数(normalized difference vegetation index,NDVI),基于多层感知器(multi-layer perception,MLP)构建了NDVI约束的区域对流层延迟模型(NDVI constrained regional zenith tropospheric delay model,NZTD),旨在为GNSS精密定位和气象应用研究提供参考依据.
1. 数据来源及数据预处理
本文使用的数据包括中国地壳运动观测网络(Crustal Movement Observation Network of China,CMONOC)和中国大陆构造环境监测网络发布的GNSS对流层延迟产品及由MODIS植被指数产品(MOD13)[14]提供的NDVI数据. 本文所选的研究区域范围为10°N~60°N,80°E~140°E,并在实验区域内选取了共106个GNSS测站. 其中所使用的GNSS ZTD是IGS基于GAMIT软件解算得到的事后对流层产品,其时间分辨率为2 h. 本实验的时间跨度为2020年1月1日至12月31日. 为了对本文所提出的NZTD模型进行构建与评估,实验将106个测站随机划分为训练集和测试集,其中训练集测站的ZTD用于构建对流层模型,共包含86个GNSS测站;测试集则由剩余的20个GNSS测站组成,其对流层产品不参与NZTD模型的构建,而是作为参考真值对模型进行精度评定. 上述测站在研究区域内的分布如图1所示,其中蓝色圆形标记为训练站点,橘黄色正方形标记为测试站点.
此外,由MOD13提供的NDVI数值有效表征了地球陆地的植被活动和动态变化,其时间分辨率为15 d. 本研究同样使用了中国区域2020年1月1日至12月31日期间的NDVI数据. 需要说明的是,在NZTD模型的构建中,为确保NDVI和GNSS对流层产品的时间分辨率具有一致性,需要对NDVI进行插值处理. 考虑到植被覆盖情况受时间变化的影响较小,故选取NDVI产品最近更新时间的数值进行最近邻匹配,得到与GNSS ZTD时间分辨率相符的NDVI数据集以进行模型构建.
2. NZTD模型构建
2.1 MLP算法原理
MLP是一种人工神经网络结构,主要由输入层、隐藏层和输出层组成,且每个隐藏层中包含若干个神经元. MLP神经网络的算法公式为
$$ {{\boldsymbol{a}}^{\left( {\text{l}} \right)}} = f\left( {{{\boldsymbol{W}}^{\left( {\text{l}} \right)}} \cdot {{\boldsymbol{a}}^{\left( {{{{\mathrm{l}} - 1}}} \right)}} + {{\boldsymbol{b}}^{\left( {\text{l}} \right)}}} \right) $$ (1) 式中:
${{\boldsymbol{a}}^{\left( {\text{l}} \right)}}$ 为第$l$ 层的激活值矩阵;$f$ 为激活函数;${{\boldsymbol{W}}^{\left( {\text{l}} \right)}}$ 为第$l$ 层到第$l - 1$ 层的权重矩阵;${{\boldsymbol{b}}^{\left( {\text{l}} \right)}}$ 为第$l$ 层的偏置向量.由于MLP可以直接从原始数据中学习到更具有信息量的特征,在学习复杂非线性模型中存在优势[15],本研究基于MLP对ZTD进行了建模.
2.2 NZTD模型
目前,已有的ZTD模型通常包含时间、经纬度和高程等信息[16]. 本研究利用可以反映植被覆盖情况的NDVI数据与年积日、时间、经纬度和高程信息相结合,基于MLP机器学习方法,构建了顾及植被覆盖情况的区域对流层延迟模型NZTD. 具体公式为
$$ {X_{{\text{ZTD}}}} = f\left( {B,L,H,D,T,N} \right) $$ (2) 式中:
${X_{{\text{ZTD}}}}$ 为ZTD预测值;$B$ 为纬度;$L$ 为经度;$H$ 为高程;$D$ 为年积日;$T$ 为时间;$N$ 为NDVI数据.图2展示了NZTD模型的架构.
模型网络架构完成后,还需要确定其最优参数. 已有研究表明,当MLP神经网络的隐藏层数为1时,只要其隐藏层节点数足够多,就可以以任意精度逼近一个非线性函数[8]. 同时,由于在利用MLP进行ZTD建模时,没有明确的公式和原则可以准确选取最优的隐藏层节点数,但是可以通过一些经验公式确定隐藏层节点数的大致范围,本文采用的经验公式[8]为
$$ w = \sqrt {n + m} + a $$ (3) 式中:
$w$ 为隐藏节点数;$n$ 为输入层神经元个数,本实验中取值为6;$m$ 为输出层神经元个数,本实验中取1;$a$ 为取值1~10的整数.根据经验公式计算得到的
$w$ 取值范围为3~14,采用“试错法”对隐藏层的节点数进行调整,步长为1,并统计不同节点数的模型的预测精度. 图3展示了隐藏层不同节点数下NZTD的均方根误差(root mean square error,RMSE)变化. 随着节点数的不断增加,RMSE有着先减小后增大的趋势,其中在节点数为12时达到最小值7.91 mm. 因此,本实验最终选择隐藏层为1,隐藏节点数为12,学习率为0.0001 的参数配置进行NZTD模型的构建.2.3 精度评定指标
本文对NZTD模型的精度评定采用RMSE、平均偏差(Bias)和相关系数(R)进行分析. RMSE用于衡量模型预测值和实际观测值之间的差异程度[17],Bias表示模型的预测值与真实值之间的平均差异,R是一个用于衡量回归模型拟合优度的指标[18],一般地,R越接近1,表示回归分析中自变量对因变量的解释越好. 以上精度指标的计算公式如下:
$$ {{{\text{RMSE}}}} = \sqrt {\frac{1}{N}\sum\limits_{{{j}} =1 }^{N} {{{({y_{{j}}} - {{\hat y}_{{j}}})}^2}} } $$ (4) $$ {\text{Bias}} = \frac{1}{N}\sum\limits_{{{j}}=1}^{N} {\left( {{y_{{j}}} - {{\hat y}_{{j}}}} \right)} $$ (5) $$ R = \sqrt {1 - \frac{{{S_{{\text{res}}}}}}{{{S_{{\text{tot}}}}}}} $$ (6) 式中:
${y_{{j}}}$ 为真值;${\hat y_{{j}}}$ 为预测值;$N$ 为样本数目;${S_{{\text{res}}}}$ 为残差平方和;${S_{{\text{tot}}}}$ 为总平方和.3. 结果分析
为了进一步探究NZTD模型在中国区域的精度表现情况,本节以未参与建模的测试站ZTD作为参考真值,从单站和整体区域等不同角度将NZTD模型与GPT3模型[19]进行对比分析,并进一步分析了约束植被覆盖率在NZTD模型中的增益效果.
3.1 模型在单站的预测精度分析
基于测试集测站的ZTD参考真值(REF_ZTD)(时间分辨率为1 d),首先对NZTD模型的单站精度表现进行了评估. 图4展示了FJPT、CQCS、AHAQ、BJFS 4个测站于2020年NZTD_ZTD、GPT3_ZTD以及REF_ZTD的时间序列图,测站按纬度升序排列. 可以发现,在4个测站时间跨度为2020年全年的时间序列中,NZTD与参考真值的时间序列展现出很好的一致性,且能捕捉小时间尺度上的ZTD变化;相比之下,GPT3虽然也有与参考真值相符的变化趋势,但其无法对ZTD的短时变化进行准确描述.
为了进一步评估NZTD模型在单站上的精度表现,表1给出了上述测站在NZTD模型以及GPT3模型下的精度评定指标. 在RMSE方面,NZTD模型在目标测站上为5.75~7.86 mm之间,GPT3模型则在25.55~29.91 mm之间,NZTD模型相较于GPT3模型的RMSE降低百分比在72%~78%之间;在Bias方面,NZTD模型在单站上小于1.2 mm,GPT3模型则大于3.4 mm,NZTD模型相较于GPT3模型有着更小的Bias;在R方面,NZTD模型均大于0.95,而GPT3模型在0.75~0.85范围内波动. 上述结果表明,NZTD模型能提供比GPT3更为准确可靠的ZTD产品.
表 1 NZTD模型与GPT3模型于2020全年在单站的精度指标站点 NZTD GPT3 RMSE/mm Bias/mm R RMSE/mm Bias/mm R FJPT 6.99 −1.05 0.97 29.38 4.19 0.81 CQCS 7.86 1.14 0.96 29.91 4.21 0.79 AHAQ 6.75 1.02 0.97 25.93 −3.97 0.80 BJFS 5.75 −0.98 0.98 25.55 3.48 0.82 此外,图5展示了2种模型于2020全年在20个测试站的RMSE柱状图,其中测站按照地理纬度升序排列. 结果表明,NZTD模型在所有测试站的RMSE均在10 mm以内,而GPT3模型的RMSE均在20 mm以上,NZTD模型相较GPT3模型在各测站上的精度增益平均值为75%. 此外,2种ZTD模型在低纬度地区的RMSE均高于高纬度地区,这可能是因为低纬度地区往往更容易受到天气变化的影响,高纬度地区通常具有较为稳定的大气条件,而稳定的大气条件使ZTD更容易被NZTD模型与GPT3模型准确预测,从而降低了ZTD模型的误差[20].
3.2 模型在区域的预测精度分析
为了更好地体现NZTD模型在区域的ZTD预测性能,表2给出了NZTD模型与GPT3模型于2020全年在测试集20个测站的整体预测精度指标. 结果表明,NZTD模型的RMSE显著低于GPT3模型,两者分别为7.91 mm和25.94 mm,前者较后者精度提高了70%;此外,在Bias方面,NZTD模型较GPT3模型从4.03 mm降至1.43 mm,精度提高了65%;在R方面,NZTD模型较GPT3模型从0.81升至0.97. 这表明NZTD模型在区域内的模型预测误差较小,表现更为稳定. 可以确定NZTD模型在区域层面有着很好的预测性能.
表 2 NZTD模型与GPT3模型于2020全年在测试集的预测精度指标模型 RMSE/mm Bias/mm R NZTD 7.91 1.43 0.97 GPT3 25.94 4.03 0.81 为了进一步分析NZTD模型和GPT3模型的季节性特征,图6绘制了2种模型在中国区域月平均RMSE的时间序列图. 从图中可以看出,相比于GPT3模型,NZTD模型的RMSE较小且变化相对平稳,没有表现出明显随季节变化的波动,在2020全年期间为5~10 mm. GPT3模型的RMSE整体较大且变化较为剧烈,月份间差异最高达到10 mm以上. 这表明NZTD模型相较于GPT3模型可以更好地应对季节性变化,具有更优的稳定性和抗干扰性.
为了更直观地展现出2种模型性能的季节性差异,按照3~5月为春季、6~8月为夏季、9~11月为秋季及12~2月为冬季的方式对全年数据进行划分,分别统计了NZTD模型与GPT3模型在各个季节的RMSE,如表3所示. 结果显示,NZTD模型在春季的RMSE为6.91 mm,夏季上升至9.12 mm,秋季为8.55 mm,冬季降至6.09 mm. 而GPT3模型在春季的RMSE为20.04 mm,夏季增至29.72 mm,秋季为29.55 mm,冬季降至20.43 mm,2种模型的精度均存在季节性特征,且均表现为夏季的RMSE最大、冬季的RMSE最小. 这可能是因为夏季通常会伴随着更多的降水与对流活动,而冬季则更加干燥和稳定,气象因素的变化会影响大气延迟的传播和分布,导致ZTD的预测难度存在差异. 此外,还可以观察到GPT3模型较NZTD模型的季节性差异更为突出,原因可能是GPT3模型未充分考虑到季节性因素的影响[21],而NZTD模型通过利用NDVI顾及植被覆盖变化情况,从一定程度上对目标位置的季节性变化进行了考虑,从而能更好地刻画ZTD在不同季节下的时变特征.
表 3 NZTD模型与GPT3模型在4个季节预测ZTD的RMSEmm 季节 NZTD GPT3 春季 6.91 20.04 夏季 9.12 29.72 秋季 8.55 29.55 冬季 6.09 20.43 3.3 NDVI在NZTD模型中的影响分析
为了进一步探究植被覆盖情况在NZTD模型中的增益情况,本研究将输入特征中的NDVI剔除,并设置了相同的隐藏层、节点数以及学习率进行对照实验,得到了不考虑NDVI数据的区域对流层延迟(non-NZTD, NNZTD)模型. 图7绘制了测试集所有测站上NZTD模型和NNZTD模型RMSE柱状图,以及前者较后者的RMSE数值降低百分比折线图,其中横坐标的测站名按照NDVI年均值升序排列. 结果显示,在考虑NDVI特征后,各测站的RMSE均有所下降,NZTD模型较NNZTD模型平均精度提升8%. 此外,拥有较大植被覆盖率的测站位置处的NZTD模型可获得更显著的精度提升,尤其是LHAS测站,NZTD模型较NNZTD的模型精度提升达到14%. 这可能是因为植被覆盖情况更高的区域会有更多的水汽交换过程,顾及地形因素的NZTD模型能够获取更加准确的ZTD时空分布特性,从而提高ZTD模型的预测精度.
4. 总 结
本文基于机器学习方法建立了引入NDVI特征的NZTD区域对流层延迟模型,通过NZTD与GPT32种模型的精度对比,分析了引入地形因素对ZTD建模的影响. 结果表明,NZTD模型在单站的RMSE为10 mm以内,显著低于GPT3模型的20 mm以上. 区域整体结果显示,NZTD模型的RMSE在全年范围内基本保持在5~10 mm之间,GPT3模型的RMSE在20~30 mm之间波动,模型精度提升平均值为75%. 进一步分析表明,NZTD模型对季节性变化具有更强的抗干扰性,全年测试集的RMSE为7.91 mm,显著低于GPT3模型的25.94 mm,整体预测精度提高了70%. 此外,相比于不考虑NDVI特征的机器学习对流层延迟模型NNZTD,NZTD模型在测试集各测站的精度均有所提高,平均提升百分比为8%,且对于NDVI年均值较高的测站提升尤为显著. 综上所述,在引入以NDVI代表的地形因素后,NZTD模型能够细化不同地理区域的环境特征,反映出不同区域、不同时间ZTD的精细变化,具有更好的时间适应性和空间适应性.
在今后的工作中,本研究将进一步优化模型的训练过程和参数选择,同时考虑引入更多的地形因素,如地表温度、降水量等,进一步细化模型对不同区域大气条件的描述. 此外,也可以采用更为先进的深度学习算法,结合多源遥感数据和气象数据,进一步提升ZTD建模的准确性和鲁棒性. 随着大气科学和遥感技术的发展,未来的研究可以将更多动态环境数据引入模型,实时更新和预测ZTD的时空变化,提高其在导航、气象预报等领域的应用价值.
致谢:本文的研究得到了国家重点研发计划项目(2021YFC3000504)的支持.
-
表 1 NZTD模型与GPT3模型于2020全年在单站的精度指标
站点 NZTD GPT3 RMSE/mm Bias/mm R RMSE/mm Bias/mm R FJPT 6.99 −1.05 0.97 29.38 4.19 0.81 CQCS 7.86 1.14 0.96 29.91 4.21 0.79 AHAQ 6.75 1.02 0.97 25.93 −3.97 0.80 BJFS 5.75 −0.98 0.98 25.55 3.48 0.82 表 2 NZTD模型与GPT3模型于2020全年在测试集的预测精度指标
模型 RMSE/mm Bias/mm R NZTD 7.91 1.43 0.97 GPT3 25.94 4.03 0.81 表 3 NZTD模型与GPT3模型在4个季节预测ZTD的RMSE
mm 季节 NZTD GPT3 春季 6.91 20.04 夏季 9.12 29.72 秋季 8.55 29.55 冬季 6.09 20.43 -
[1] 姚宜斌, 赵庆志. GNSS对流层水汽监测研究进展与展望[J]. 测绘学报, 2022, 51(6): 935-952. [2] SAASTAMOINEN J. Atmospheric correction for the troposphere and stratosphere in radio ranging satellites[J]. The use of artificial satellites for geodesy, 2013(15): 247-251. DOI: 10.1029/GM015p0247
[3] FARHAT NH, PSALTIS D, PRATA A, et al. Optical implementation of the hopfield model[J]. Applied optics, 1985, 24(10): 1469. DOI: 10.1364/AO.24.001469
[4] 孙鹏. GNSS实时水汽反演关键算法研究[D]. 徐州: 中国矿业大学, 2022. [5] PENNA N, DODSON A, CHEN W. Assessment of EGNOS tropospheric correction model[J]. Journal of navigation, 2001, 54(1): 37-55. DOI: 10.1017/s0373463300001107
[6] LAGLER K, SCHINDELEGGER M, BOHM J, et al. Gpt2: empirical slant delay model for radio space geodetic techniques[J]. Geophysical research letters, 2013, 40(6): 1069-1073. DOI: 10.1002/grl.50288
[7] BOHM J, MOLLER G, SCHINDELEGGER M, et al. Development of an improved empirical model for slant delays in the troposphere (GPT2w)[J]. GPS solutions, 2015, 19(3): 433-441. DOI: 10.1007/s10291-014-0403-7
[8] 杨旭, 何祥祥, 王媛媛, 等. 一种基于机器学习算法的区域/单站ZTD组合预测模型[J]. 全球定位系统, 2022, 47(1): 98-102,126. [9] 王勇, 张立辉, 杨晶. 基于BP神经网络的对流层延迟预测研究[J]. 大地测量与地球动力学, 2011, 31(3): 134-137. [10] 肖恭伟, 欧吉坤, 刘国林, 等. 基于改进的BP神经网络构建区域精密对流层延迟模型[J]. 地球物理学报, 2018, 61(8): 3139-3148. [11] 时瑶佳, 吴飞, 朱海, 等. 基于Keras平台的LSTM模型的对流层延迟预测[J]. 全球定位系统, 2020, 45(6): 115-122. [12] 张洛恺. 地基GNSS反演大气水汽含量方法研究[D]. 郑州: 解放军信息工程大学, 2014. [13] PETTORELLI N. Using the satellite-derived NDVI to assess ecological responses to environmental change[J]. Trends in ecology & evolution, 2005, 20(9): 503-510. DOI: 10.1016/j.tree.2005.11.006
[14] HE T, LIU F Y, WANG A, et al. Estimating monthly surface air temperature using MODIS LST data and an artificial neural network in the loess plateau, china[J]. Chinese geographical science, 2023, 33(4): 751-763. DOI: 10.1007/s11769-023-1370-0
[15] SAVICH AW, MOUSSA M, AREIBI S. The impact of arithmetic representation on implementing MLP-BP on FPGAs: a study[J]. IEEE transactions on neural networks, 2007, 18(1): 240-252. DOI: 10.1109/TNN.2006.883002
[16] 谢劭峰, 潘清莹, 黄良珂, 等. 中国区域ZTD、ZWD高程缩放因子的时空特性分析[J]. 大地测量与地球动力学, 2021, 41(12): 1211-1215,1240. [17] CHAI T, DRAXLER R R. Root mean square error (RMSE) or mean absolute error (MAE)? -arguments against avoiding RMSE in the literature[J]. Geoscientific model development discussions, 2014, 7(3): 1247-1250. DOI: 10.5194/gmd-7-1247-2014
[18] SHINICHI N, HOLGER S. A general and simple method for obtaining R2 from generalized linear mixed-effects models[J]. Methods in ecology and evolution, 2013, 4(2): 133-142. DOI: 10.1111/j.2041-210x.2012.00261.x
[19] 文仙姣. GPT3模型的综合性能评价与优化方法[J]. 科技通报, 2023, 39(11): 9-14,27. [20] 罗亦泳, 张静影, 陈郡怡, 等. 基于相空间重构和高斯过程回归的对流层延迟预测[J]. 武汉大学学报(信息科学版), 2021, 46(1): 103-110. [21] 綦子民, 屈小川, 赖山东, 等. GPT3模型在安徽地区的性能[J]. 大地测量与地球动力学, 2023, 43(5): 481-486.