读取数据集后:
dataset <- read.csv("forR.csv")
- 我怎样才能让 R 给我它包含的案例数量?
- 此外,返回值是否包括用 ? 省略的排除情况
na.omit(dataset)?
读取数据集后:
dataset <- read.csv("forR.csv")
na.omit(dataset)?dataset将是一个数据框。由于我没有forR.csv,我将组成一个小数据框进行说明:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
要获取案例数,请使用nrow()or计算行数NROW():
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
要在省略 后计算数据,请使用相同的NA工具,但包含:datasetna.omit()
> NROW(na.omit(dataset))
[1] 993
NROW()和NCOL()和它们的小写变体(ncol()和)之间的区别在于nrow(),小写版本仅适用于具有维度(数组、矩阵、数据框)的对象。大写版本将与向量一起使用,它们被视为 1 列矩阵,并且如果您最终对数据进行子集化以使 R 删除一个空维度,则它们是稳健的。
或者,使用complete.cases()and sumit (complete.cases()返回一个逻辑向量 [TRUE或FALSE] 指示是否有任何观察是NA针对任何行的。
> sum(complete.cases(dataset))
[1] 993
简要地:
运行dim(dataset)以检索n和k,您还可以使用nrow(df)and ncol(df)(甚至NROW(df)和NCOL(df)- 其他类型也需要变体)。
如果您转换例如 via dataset <- na.omit(dataset),则案例消失且不计算在内。但是,如果您这样做,例如 summary(dataset)NA 案例将被计算在内。