我的数据集包含许多数字属性和一个分类属性。
说NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr,,
其中CategoricalAttr取三个可能值之一CategoricalAttrValue1:CategoricalAttrValue2或CategoricalAttrValue3。
我正在为 Octave 使用默认的 k-means 聚类算法实现。它仅适用于数字数据。
所以我的问题是:将分类属性拆分CategoricalAttr为三个数字(二进制)变量是否正确,例如IsCategoricalAttrValue1, IsCategoricalAttrValue2, IsCategoricalAttrValue3?
