数据挖掘 - 观测数据中的“噪声”是什么？ - 吾爱随笔录

观测数据中的“噪声”是什么？

数据挖掘机器学习数据可能性

2022-02-19 07:00:29

我正在阅读 Bishop 的模式识别和机器学习，在关于概率的章节中，多次提到“观察数据中的噪声”。我在网上读到噪音是指读取数据时的不准确，但我不确定它是否正确。那么，观测数据中的噪声究竟是什么？什么是加性噪声和高斯噪声？

1个回答

当您有传感器时，即使记录的信号没有变化，您收到的值也会发生变化。这是噪音的一个例子。

当你有一个世界模型时，它会通过简化不太重要的事情来从真实的关系中抽象出来。考虑到简化，您将误差建模为噪声（例如在卡尔曼滤波器中）。

但噪声源可以是任何东西。例如，在图像分类问题中，数据压缩会扭曲图像。图像可以有不同的分辨率；低分辨率信号比高分辨率数字更难分类。锯齿效果也会扭曲图像。

什么是加性噪声？

假设你的系统方程是

z = H \cdot x

$z = H \cdot x$

在哪里 $z \in \mathbb{R}^{n_m}$ 是观察， $x \in \mathbb{R}^{n_x}$ 是你感兴趣的状态并且 $H \in \mathbb{R}^{n_m \cdot n_x}$ 是一个变换矩阵。然后噪音可能会以任何方式与您的系统相互作用。但大多数情况下，噪声是加法的，这意味着你的模型是合乎逻辑和实际的

z = H \cdot x + r

$z = H \cdot x + r$

在哪里 $r$ 从任何分布的随机变量中采样。

什么是（加性）高斯噪声？

r \sim N (μ, σ^{2})

$r \sim \mathcal{N}(\mu, \sigma^2)$

见正态分布

其它你可能感兴趣的问题

上一篇如何通过词嵌入改进循环神经网络的文本（新闻文章）的二元分类模型？下一篇使用深度学习对文章进行分类