机器学习中归一化与标准化
1、归一化
在Python中使用归一化 from sklearn.preprocessing import MinMaxScaler #实例化 mm = MinMaxScaler() mm.fit_transform(x)
因为归一化易受异常点的影响,一般使用较少
2、标准化
在Python中使用标准化 from sklearn.preprocessing import StandarScaler #实例化 ss = StandarScaler() ss.fit_transform(x)
3、PCA 主成分分析
当样本特征过多时,使用主成分分析可以减少特征的数量,并且尽可能的保留原有的信息。 PCA(n_components=0.9) # 表示保留原有信息的90%,通常使用90%~95%