论文部分内容阅读
高斯-马尔可夫(Gauss-Morkov,GM)模型是测量平差理论体系的模型基础,最小二乘(Least-Squares,LS)估计可以得到GM模型的最优参数估值。而在测量数据处理中,系数矩阵也可能包含随机误差,具有随机系数矩阵的GM模型被称之为变量误差(Errors-In-Variables,EIV)模型,在均方误差意义下,总体最小二乘(Total Least-Squares,TLS)估计得到的EIV模型参数估值优于LS估计。自Gloub and Van Load(1980)提出TLS估计的奇异值分解(Singular Value Decomposition,SVD)算法以来,TLS估计引起了各领域的广泛关注,如:信号处理、自动控制、系统识别、计量经济、生物医药和大地测量等,并成为各领域的一种基本参数估计方法。近些年来,TLS估计逐步演变成一个完备的理论体系,但是相关研究成果仍不够成熟和完善,有待进一步提高和发展。本文从加权总体最小二乘(Weighted Total Least-Squares,WTLS)估计的分类、结构总体最小二乘(Structured Total Least-Squares,STLS)估计、STLS问题的(非负)方差分量估计、基于总残差(total residual)的抗差总体最小二乘(Robust Total Least-Squares,RTLS)估计以及具有高崩溃污染率的RTLS估计等五方面展开了系统性的研究。论文主要结论和贡献包括:(1)系统地总结了WTLS估计的解法。本文从WTLS问题的数学模型表达、优化方法选择和迭代公式设计等三方面对WTLS估计的解法进行分类。在不同的模型假设下,采用Gauss-Newton法推导了各种解法的估计公式,并说明它们具有LS估计的形式,这为总体最小二乘的其它拓展研究奠定了方法基础。(2)针对测绘领域诸多实际应用中系数矩阵和观测向量具有结构特征这一问题,即系数矩阵和观测向量中包含固定量(甚至固定列)和随机量,并且不同位置的随机量线性相关。从EIV函数模型出发,引入变量投影法对系数矩阵和观测向量中的结构特征进行提取,然后基于Gauss-Newton法构造了两种STLS估计算法,这两种STLS估计算法具有相同的LS估计的形式,通过算例分析表明该算法相对于WTLS估计算法减少了预测残差的数量,相对于Markavsky给出的SLTS估计算法减少了迭代次数。本文还阐明了STLS估计和WTLS估计具有等价性。(3)通过多线性拟合问题研究了TLS估计得到的预测残差特点,说明相对于LS估计,TLS估计并不适合于进行残差预测,推荐采用总残差对等式误差进行预测,用于后续的方差分量估计和抗差估计研究。(4)在以上研究成果基础上,考虑到系数矩阵和观测向量中的随机量可能来源于不同的观测或者以前的平差结果,甚至不同期的观测,因而可能具有不同的方差分量,如果考虑随机量之间的相关性,也可能具有不同的协方差分量这一问题,本文基于总残差将最小二乘方差分量估计(Least-Squares Variance Component Estimation,LS-VCE)算法应用到STLS问题的方差和协方差分量估计,并进一步拓展了Xu and Liu(2014)中关于方差和协方差分量可估性的结论。同时采用非负函数对方差分量重新参数化,推导出了结构变量误差(Structured Errors-In-Variables,SEIV)模型的非负函数约束最小二乘方差分量估计(Nonnegative Function Constrained Least-Squares Variance Component Estimation,NFC-LS-VCE)算法,通过算例分析表明该算法可以有效解决初值选取不当引起的负方差问题。(5)由于外界环境、测量仪器和人为因素等的影响,观测值中也可能混入粗差,在测绘领域,数据探测法和M估计是处理粗差问题的两类基本方法,它们均是基于观测值的预测残差进行算法实施。虽然TLS估计可以给出每个观测值的预测残差,但是相对于LS估计,TLS估计并不适合用于残差预测。针对这一问题,本文以标准化总残差为基础采用中位数法计算后验单位权方差,然后结合IGGⅢ权函数进行重定权并构造了相应的M估计算法——RSTLS-LS-IGGⅢ,最终通过算例分析说明其性能优于基于单个观测值重定权的策略。(6)虽然M估计具有很高有效性,但是M估计的崩溃污染率为0,它的抗差性高度依赖于初值。针对WTLS估计或者STLS估计不具抗差性这一问题,本文设计了三种高崩溃污染率的抗差估计方法,即基于枚举法的重复中位数(Repeated Median,RM)估计、基于重采样方法的总体最小平方中位数(Total Least Median of Squares,TLMS)估计和基于分支定界(Branch And Bound,BAB)算法的总体最小截断平方(Total Least Trimmed Squares,TLTS)估计,这三种估计方法均具有50%的渐进崩溃污染率(Breakdown Point,BP)。在不顾及不同观测方程中随机量的相关性的情况下,通过算例分析表明上述三种算法有效性较低,并且由于采用部分观测方程搜索全局最优解也存在明显偏差,并不适合作为最终的参数估值。实践中,可以首先采用高崩溃污染率的抗差估计方法计算参数初值,然后进行标准化总残差预测和后验单位权方差估计,最终应用回降M估计计算参数估值,即带有抗差初值的M估计——MM估计,通过算例分析表明该算法可以同时具有高有效性和高崩溃污染率。