数据挖掘 - 在 R 中读取广泛的数据集 - 吾爱随笔录

在 R 中读取广泛的数据集

数据挖掘 r 预测建模 CSV

2022-03-04 18:40:36

我最初有一个大约 18000 列（和大约 80 行）的宽 CSV 数据集，我试图在 R 中读取它。它存储在 Excel 工作表中，不幸的是它的限制只有 16384 列。因此，采用我获得的维度：

> dim(train_set)
[1]    83 16384

即 1000+ 列被吃掉，这将严重影响预测的准确性。如何阅读 R 中的所有列？

非常感谢您的建议。非常感谢！

2个回答

参考我的评论，我相信你需要的是

df <- read.csv("./yourpath/yourfile", sep = ";", header = TRUE) # play around with the arguments per your file.

如果 CSV 真的来自 Excel，我担心会丢失其他列...如果您还有源文件（即包含所有 18.000 列的文本文件），我建议使用freadfrom high-performance package data.table。其他需要学习但绝对值得大量数据的东西...类似于 read.csv 的语法。

其它你可能感兴趣的问题

上一篇在 R 中估计面板模型下一篇是否有关于 Apache Spark 的文本试图像 White 的 Hadoop：权威指南一样全面？