观测数据中的“噪声”是什么?

数据挖掘 机器学习 数据 可能性
2022-02-19 07:00:29

我正在阅读 Bishop 的模式识别和机器学习,在关于概率的章节中,多次提到“观察数据中的噪声”。我在网上读到噪音是指读取数据时的不准确,但我不确定它是否正确。那么,观测数据中的噪声究竟是什么?什么是加性噪声和高斯噪声?

1个回答

当您有传感器时,即使记录的信号没有变化,您收到的值也会发生变化。这是噪音的一个例子。

当你有一个世界模型时,它会通过简化不太重要的事情来从真实的关系中抽象出来。考虑到简化,您将误差​​建模为噪声(例如在卡尔曼滤波器中)。

但噪声源可以是任何东西。例如,在图像分类问题中,数据压缩会扭曲图像。图像可以有不同的分辨率;低分辨率信号比高分辨率数字更难分类。锯齿效果也会扭曲图像。

什么是加性噪声?

假设你的系统方程是

z=Hx

在哪里zRnm是观察,xRnx是你感兴趣的状态并且HRnmnx是一个变换矩阵。然后噪音可能会以任何方式与您的系统相互作用。但大多数情况下,噪声是加法的,这意味着你的模型是合乎逻辑和实际的

z=Hx+r

在哪里r从任何分布的随机变量中采样。

什么是(加性)高斯噪声?

rN(μ,σ2)

正态分布