我最初有一个大约 18000 列(和大约 80 行)的宽 CSV 数据集,我试图在 R 中读取它。它存储在 Excel 工作表中,不幸的是它的限制只有 16384 列。因此,采用我获得的维度:
> dim(train_set)
[1] 83 16384
即 1000+ 列被吃掉,这将严重影响预测的准确性。如何阅读 R 中的所有列?
非常感谢您的建议。非常感谢!
我最初有一个大约 18000 列(和大约 80 行)的宽 CSV 数据集,我试图在 R 中读取它。它存储在 Excel 工作表中,不幸的是它的限制只有 16384 列。因此,采用我获得的维度:
> dim(train_set)
[1] 83 16384
即 1000+ 列被吃掉,这将严重影响预测的准确性。如何阅读 R 中的所有列?
非常感谢您的建议。非常感谢!
参考我的评论,我相信你需要的是
df <- read.csv("./yourpath/yourfile", sep = ";", header = TRUE) # play around with the arguments per your file.
如果 CSV 真的来自 Excel,我担心会丢失其他列...如果您还有源文件(即包含所有 18.000 列的文本文件),我建议使用freadfrom high-performance package data.table。其他需要学习但绝对值得大量数据的东西...类似于 read.csv 的语法。