我拥有具有这些功能的 250k 数据集
date_time FullAddress call_type priority lat long
0 6/14/17 21:54 10 14TH ST\, San Diego\, CA 1151 2.0 32.705449 -117.151870
1 3/29/17 22:24 10 14TH ST\, San Diego\, CA 1016 2.0 32.705449 -117.151870
2 6/3/17 18:04 10 14TH ST\, San Diego\, CA 1016 2.0 32.705449 -117.151870
3 3/17/17 10:57 10 14TH ST\, San Diego\, CA 1151 2.0 32.705449 -117.151870
4 3/3/17 23:45 10 15TH ST\, San Diego\, CA 911P 2.0 32.705722 -117.15035
日期和时间、完整地址、经纬度、电话类型和犯罪严重程度。我想预测未来犯罪发生的时间或预测再次发生的地点。我怎样才能做到这一点,我会使用回归还是分类?我已经预测了优先级,但我如何预测它会发生的时间或位置?
我预测了优先级,但并没有真正给我任何东西。我想预测时间和地点或两者之一。
这是我的优先级预测的一些代码
from sklearn.ensemble import RandomForestClassifier
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
my_RandomForest = RandomForestClassifier(n_estimators=100, random_state=0)
my_RandomForest.fit(X_train, y_train)
y_predict_fr = my_RandomForest.predict(X_test)
from sklearn.metrics import accuracy_score
print(y_predict_fr)
accuracy_fr = accuracy_score(y_test, y_predict_fr)
print(accuracy_fr)
[4. 3. 2. ... 3. 1. 2.]
0.95100761598545