拟合非线性定制模型

数据挖掘 r 线性回归 ggplot2
2022-03-07 22:44:57

我有一个data.frame有两个cols,x=mzy=res. DF 中有大约 200 万行。当我绘制图表时,我得到以下信息。散点图

我想做的是找到一种方法来定义两个二次曲线,以使两条曲线用橙色严重勾勒出来。能够在ggplot中做到这一点会很好。我试图适应 stat_smooth 但我无法接近我想要的结果。

plot <- ggplot(data=df, aes(mz, res)) + geom_point()
plot + stat_smooth(method = "lm", formula = y ~ I(x^-2) - x)

在此处输入图像描述 如果这真的是微不足道和显而易见的事情,我深表歉意,但我不是数据科学家,我只是想帮助一个朋友。

1个回答

您可以尝试使用“广义加法”模型进行分位数回归。R我猜你可以使用这个qgam您需要做的是估计分布的上/下值的模型。下图显示了qgam上面链接的小插图的情节。

在此处输入图像描述