在 RI 有data哪里head(data)给出
day promotion profit new_users
1 105 45662 33
2 12 40662 13
3 44 46800 20
4 203 54102 46
现在day只是这一天(并且是有序的)。promotion是当天的促销价值,是当天profit的利润,是当天new_users的新用户数。
promotion我想调查toprofit和之间的关系new_users。我们看到 和 之间存在明显的正相关,promotion并且和 之间也profit存在正相关。在 RI 中简单地测试相关性promotionnew_users
cor.test(data$promotion, data$profit, method="kendall", alternative="greater" )
cor.test(data$promotion, data$new_users, method="kendall", alternative="greater")
这两者都给出了一个低 p 值,即我们有一个正相关。
我想找到一个增加promotion不增加profit或new_users必须增加的点,即一个甜蜜点。
这是 2 个图和这些图的 R 代码
plot(data$promotion, data$profit, col="brown")
plot(data$promotion, data$new_users)
这应该怎么做?
我的想法在哪里制作回归模型。对于第一个“promotion vs. new_users”,可以使用毒药模型,因为它是一个计数过程,所以这样的模型会是一个不错的选择吗?
glm(formula= data$new_users ~ data$promotion, family="poisson", data=data)
接下来应该为下一个选择什么回归模型。可以说这个回归模型是一个不错的选择吗?(我使用 sqrt 命令)
glm(formula=data$profit ~ sqrt(data$promotion) , data=data)
或者也许根本不需要使用回归模型来找到最佳位置?
谢谢。
我现在看到了“好”的新用户。对于每个day我们都有一个promotion价值,我们有一个count价值,即新的好用户的数量。该图向我们展示了我们每天通过促销获得的优秀新用户数量。例如,对于促销价值 90,我们有一天获得 8 个新的好用户,一天我们获得了 14 个新的好用户。
找到使用促销的最佳位置的正确方法是什么?


