对于分组观察数据的频数,从而了解数据在不同区间的分布,我们可以创建数据桶。创建分为按照建议的区间长度进行划分,也可以自行设置参数。这里主要讲解自行设置参数,将最大值,最小值,步长设置好。对于频数的大小,一直不是很清楚,所以自己创建一个小数据集,研究了一下。tableau应该是按照左开右闭的规则统计频数的。
数据源:1.5 2 3 4 5 6.5 7 7.1 9 10
区间划分含义:
区间包含的数字频数[1,2)1.51[2,3)21[3,4)31[4,5)41[5,6)51[6,7)6.51[7,8)7 7.12[8,9)没有0[9,10)91[10,11)101
当把步长参数设置为5时,tableau自动调整了数据的起始位置,变为从0开始了。因为这样才能刚好0~5,5~10,10~15,区间划分更好看。
区间划分含义:
区间包含的数字频数[0,5)1.5 2 3 44[5,10)5 6.5 7 7.1 95[10,15)101