机器算法验证 - 什么是稀疏回归模型 - 吾爱随笔录

什么是稀疏回归模型

机器算法验证回归时间序列参考特征选择疏

2022-03-31 20:58:07

我正在学习稀疏回归的概念并面临术语方面的初步障碍。

稀疏回归模型解释了稀疏的定义。当样本数 $n$ 小于信号维度 $p$ 然后我们说它是稀疏回归模型。

对于一个模型， $x_t = a1x_{t-1} + a2x_{t-2} + white gaussian noise$ , 参数 $(a1,a2)$ 不随时间而变化 $n=t$ 样本我们只得到两个参数。那么，报纸怎么这么说 $A \in R^{n \times p}$ ? 这是什么意思？ $A$ 是系数向量而不是矩阵。然后做什么 $R^{n \times p}$ 意思是？
我所理解的是，零系数的数量更多，但如果是这样，那么是否有一个上限表明信号是稀疏的？
我正在寻找可以找到如此稀疏的 AR 和 MA 模型的参考。有人可以指出一个链接或帮助创建这样一个模型吗？

谢谢

2个回答

我正在使用稀疏回归进行一个研究项目，到目前为止我学到和理解的是 $\mathbf{A}$ 是输入矩阵，使得 $\mathbf{A} \in \mathbb{R}^{n \times p}$ 在哪里 $n$ 是样本数，并且 $p$ 是特征的数量。

您正在尝试找到一组最佳投影向量 $\vec{x_i} \in \mathbb{R}^{p}$ 这主要是零，很少有非零条目，因此非零条目的比率数和 $p$ 是你的稀疏参数（通常 $s$ ) 乘以输入矩阵时的此类向量 $\mathbf{A}$ 将丢弃大部分输入特征，并产生投影 $\vec{p_i} = \mathbf{A} \vec{x_i}$ 这样， $\vec{p_i} \in \mathbb{R}^{n}$

我在做什么（不确定这是否是标准），是我找到另一个向量 $\vec{\beta}$ 使用投影向量拟合回归模型 $\vec{p_i}$ 较早发现，因此 $\hat{y}=\beta_0+\sum_i{\beta_i p_i}$

我希望这有帮助

我自己一直在寻找这个问题的答案，并一直在这个线程上结束。我想解决您的问题 #2，以防您仍然感兴趣或其他人偶然发现这篇文章。

我认为您对稀疏回归的理解是错误的。我相信稀疏回归是惩罚大型模型并因此执行变量选择的任何回归的总称。例如 LASSO、岭回归或稀疏主成分分析（依赖于 LASSO）。

“稀疏”是指参数向量的维数已经降低。这和稀疏数据不一样！以下是维也纳科技大学研究人员的引述：

“'sparse' 表达式不应与包含许多零条目的稀疏数据技术混淆。这里，稀疏性是指估计的参数向量，它被迫包含许多零。” http://www.statistik.tuwien.ac.at/public/filz/papers/2011JChem.pdf

其它你可能感兴趣的问题

上一篇找到随机森林估计器的全局最小值下一篇符号：确定性变量、随机变量、随机变量的实现、函数