参数拟合:需要测量参数解决方案的数据“支持”

计算科学 回归 条件数 数据分析 数据集
2021-12-02 11:34:12

我正在估计一个数据集上的参数,这些参数在很大程度上会导致一个弱约束的解决方案。然而,数据集还包含更多数据点,这些数据点使解决方案具有良好的条件。下图中的简单线条拟合示例说明了该问题。
虽然少数约束点实际上可能是好的/内点,但获得的解决方案显然仍然严重依赖于这几个数据点。

我现在想要一个直接的测量方法,它可以告诉我有助于解决方案“良好约束”的证据的相对数量。(在下图中,该数字表示证据量较少)。
这种直接测量是否存在,或者我是否必须通过采样/聚类/分割数据集?

在有问题的数据集上进行线拟合

2个回答

正如前面的答案所指出的,您正在寻找的概念是敏感性。

您采用计算回归线参数的公式并计算关于您的点位置的导数。对于三个孤立的点,这些应该很大,表明移动它们会产生很大的影响。

您想在参数估计中寻找“参数敏感性”的概念。

另一个值得研究的方向是贝叶斯反演,它为您提供参数空间中非常窄或宽的概率分布。有很多很好的介绍。我(部分,有偏见)最喜欢的是这里的第 35 号:http: //www.math.tamu.edu/~bangerth/publications.html#x-reviewed