数据挖掘 - 我们可以使用先验信息来改进神经网络的结果吗？如果是这样，我们如何将其纳入学习过程？ - 吾爱随笔录

令为函数在区间上。假设，我们的目标是使用某种形式的神经网络看起来像这样： $f_\alpha(x)$

f_{α} (x) = x^{2} + α \sin (x),

$f_\alpha(x) = x^2 + \alpha\sin(x),$

[- 5, 5]

$[-5,5]$

α = 2

$\alpha = 2$

f_{2} (x)

$f_2(x)$

f_{2}

$f_2$

我们得到一组 f_2 的噪声测量值我们想从中学习。具体来说，给定一组随机样本，其中其中为的正态分布噪声： $f_2$ $f_2$ $\{y_i,x_i\}_{i=1}^n$

y_{i} = f_{2} (x_{i}) + N (0, σ),

$y_i = f_2(x_i) + N(0,\sigma),$

N (0, σ)

$N(0,\sigma)$

σ

$\sigma$

现在我们可以使用样本来估计未知函数。但是，在此之前，请注意的一般行为被函数很好地捕获： $\{y_i,x_i\}_{i=1}^n$ $f_2$ $f_2$ $f_0(x) = x^2$

现在假设不仅给出了，我们还给出了噪声样本和函数，我们被告知是一个不错的近似值。换句话说，我们对函数的一般外观有一些先验知识。 $\{y_i,x_i\}_{i=1}^n$ $f_2$ $f_0$ $f_2$ $f_2$

的这种先验知识纳入我们的神经网络学习过程中，以便我们能够比仅根据噪声样本自己估计 $f_2$ $f_2$

如果是这样，我们有哪些选择可以将这些知识整合到神经网络中？神经网络的类型（CNN、RNN 等）是否会影响我们整合先验信息的方式？

PS 我来自统计学/数学，虽然我了解神经网络的一般原理，但我才刚刚开始使用它们。

PPS 这是图像的 Matlab 代码

rng(123);

N = 100;
x = linspace(-5,5,N);
alpha = 2;
sigma = 4;

f_0 = x.^2;
f_alpha = x.^2 + alpha*sin(5*x);
f_sigma = f_alpha + sigma*randn(N,1).';

figure
hold on, grid on
plot(x,f_0,'k--')
plot(x,f_alpha,'b')
plot(x,f_sigma,'r.')