我试图了解 PrefixSpan 模型(pyspark)的输入。我认为在输入 RDD 中,每一行都应该是一个列表。但是,当我查看源代码时,每一行实际上都是一个列表。为什么它需要一个列表而不是列表?谢谢!
def trainPrefixSpanModel(
data: JavaRDD[java.util.ArrayList[java.util.ArrayList[Any]]],
minSupport: Double,
maxPatternLength: Int,
localProjDBSize: Int ): PrefixSpanModelWrapper = {...}