在 R 中读取广泛的数据集

数据挖掘 r 预测建模 CSV
2022-03-04 18:40:36

我最初有一个大约 18000 列(和大约 80 行)的宽 CSV 数据集,我试图在 R 中读取它。它存储在 Excel 工作表中,不幸的是它的限制只有 16384 列。因此,采用我获得的维度:

> dim(train_set)
[1]    83 16384

即 1000+ 列被吃掉,这将严重影响预测的准确性。如何阅读 R 中的所有列?

非常感谢您的建议。非常感谢!

2个回答

参考我的评论,我相信你需要的是

df <- read.csv("./yourpath/yourfile", sep = ";", header = TRUE) # play around with the arguments per your file.

如果 CSV 真的来自 Excel,我担心会丢失其他列...如果您还有源文件(即包含所有 18.000 列的文本文件),我建议使用freadfrom high-performance package data.table其他需要学习但绝对值得大量数据的东西...类似于 read.csv 的语法。