欢迎关注”生信修炼手册”!
除了统计图表外,seaborn也可以绘制热图,而且支持聚类树的绘制,绘制热图有以下两个函数
1. heatmap, 绘制普通的热图
2. clustermap,绘制带聚类数的热图
1. heatmap
相比matplotlib的imshow功能,该函数提供了更加简洁的接口,可以轻松实现文字注释的添加等功能,基本用法如下
>>> import numpy as np >>> data = np.random.rand(10, 10) >>> sns.heatmap(data) >>> plt.show()输出结果如下
在imshow中的部分参数在该函数中也是可以使用的,比如vmin, vmax,cmap等参数。除了通用参数外,该函数有两个特色,第一就是可以方便的添加分割线,使图片更加的美观,使用linescolor和linewidth参数指定分割线的颜色和宽度,用法如下
>>> sns.heatmap(data, linewidth=1) >>> plt.show()输出结果如下
第二个特色是添加数字注释,在单元格上显示对应的数值,用法如下
>>> sns.heatmap(data, linewidth=1, annot=True) >>> plt.show()输出结果如下
2. clustermap
clustermap绘制带聚类数的热图,基本用法如下
>>> data = np.random.rand(10,5) >>> df = pd.DataFrame(data) >>> df.columns = ['sampleA', 'sampleB', 'sampleC', 'sampleD', 'sampleE'] >>> sns.clustermap(df) >>> plt.show()输出结果如下
图中的聚类树是通过scipy模块中提供的距离矩阵和聚类算法实现的,通过method和metrix参数可以分别指定聚类算法和距离矩阵的算法。
对于可视化而言,我们常用的参数有以下3个,第一个standard_scale, 对数据进行标准化,比如按行进行标准化,用法如下
>>> sns.clustermap(df, standard_scale=0) >>> plt.show()输出结果如下
第二个参数为z_score, zscore也是数据标准化的一种手段,按照行列计算zscore的用法如下
>>> sns.clustermap(df, z_score=0) >>> plt.show()输出结果如下
第三个参数为row_color/col_color. 用来对行标签和列标签进行注释,用法如下
>>> sns.clustermap(df, col_colors=['r','g','b','b','b']) >>> plt.show()输出结果如下
以上只是介绍了两个函数的基本用法和常用参数,其实具体的参数还要很多,可以通过官网的API文档来详细学习每个参数的用法。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
更多精彩
KEGG数据库,除了pathway你还知道哪些
全网最完整的circos中文教程
DNA甲基化数据分析专题
突变检测数据分析专题
mRNA数据分析专题
lncRNA数据分析专题
circRNA数据分析专题
miRNA数据分析专题
单细胞转录组数据分析专题
chip_seq数据分析专题
Hi-C数据分析专题
HLA数据分析专题
TCGA肿瘤数据分析专题
基因组组装数据分析专题
CNV数据分析专题
GWAS数据分析专题
2018年推文合集
2019年推文合集
写在最后
转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。
扫描下方二维码,关注我们,解锁更多精彩内容!
一个只分享干货的
生信公众号