pandas计算相关系数
在二元变量的相关分析过程中比较常用的有Pearson相关系数、Spearman秩相关系数和判定系数
1. Pearson相关系数
一般用于分析两个连续性变量之间的关系。计算公式如下:
2. Spearman秩相关系数
Pearson线性相关系数要求连续变量的取值分布服从正态分布。 不服从正态分布的变量、分类或等级变量之间的关联性可以采用Spearman秩相关系数,也称等级相关系数来描述。
3. 判定系数
判定系数是相关系数的平方,用r2表示;用来衡量回归方程对y的解释程度。
例子
data
.corr
()
data
.corr
()['百合酱蒸凤爪']
data
['百合酱蒸凤爪'].corr
( data
['翡翠蒸香茜饺'])