使用one-hot编码,可以使得离散特征变量扩展到欧式空间,有助于特征空间中的距离计算,而在机器学习,深度学习中,在欧式空间中的距离、相似度的计算是非常重要、常见的。
但如果特征是离散的,并且不用one-hot编码就可以很合理的计算出距离,那么就没必要进行one-hot编码。