Python数据可视化(1):matplot画图
趁着国庆假期,完整的过了一遍Eric Mattes的《Python编程从入门到实践》。其中项目部分,很多小的知识点十分实用,尤其是数据可视化这里,十分适合入门matplotlib。学会画出漂亮的数据图像,对于提高自己的论文等级,让老板对数据处理结果有明确的认识,也有那么一点作用。由于各种小的知识点比较零散,因此在这里做一个简要的记录。 博主所用python版本为3.7.7,本篇博客涉及的python第三方库为matplotlib。
matplotlib基本画图函数如下:
plt.plot() # 画图 plt.scatter() # 画散点图 plt.title() # 设置图表标题 plt.xlabel() # 给坐标轴加标签 plt.ylabel() plt.tick_params() # 设置刻度标记大小 plt.savefig() # 保存图片以折线图为例,说明上述各类函数的使用方法,及其相关实参定义方法:
import matplotlib.pyplot as plt input_values = [1, 2, 3, 4, 5] squares = [1, 4, 9, 16, 25] # 'linewidth'决定plot()绘制线条粗细 plt.plot(input_values, squares, linewidths=5) # 'fontsize'决定图表中文字大小 plt.title("Square Numbers", fontsize=24) plt.xlabel("value", fontsize=14) plt.ylabel("Square of Value", fontsize=24) # 'labelsize'决定刻度标记字号 plt.tick_params(axis="both", labelsize=14) # 'savefig'函数中,第一个实参指定以什么样的文件名保存图表,第二个实参指定将图表多余的空白区域裁剪掉 plt.savefig('squares_plot.png', bbox_inches='tight') plt.show()所得折线图结果如下: 以散点图为例,说明上述各类函数的使用方法,及其相关实参定义方法:
import matplotlib.pyplot as plt x_value = list(range(1001)) # 自动计算数据 y_value = [x**3 for x in x_value] # 向scatter()传递参数c可修改数据点颜色,例如c='red',则数据点为红色 # 传递实参edgecolor='none',删除数据点轮廓 # 基于上述颜色定义,可通过颜色映射(colormap)设置数据颜色渐变 # 如下,将参数c设置成了一个y值列表,并使用参数camp告诉pyplot使用哪个颜色映射,此时y值较小的点为浅蓝色,y值较大的点为深蓝色 plt.scatter(x_value, y_value, c=y_value, cmap=plt.cm.Blues, edgecolor='none', s=40) plt.savefig('squares_scatter.png', bbox_inches='tight') plt.show()所得散点图结果如下:
随机漫步是在随机行走,没有明确方向的情况下行走得到的路径,结果由一系列随机决策决定。随机漫步在各个领域均有其实际用途,例如,漂浮在水面的花粉因不断受到水分子挤压而在水面上移动,由于水分子运动是随机的,因此花粉在水面的运动可以认为是随机漫步。 在了解了上一节的内容后,我们就可以用matplotlib以引人注目的方式将Python生成的随机漫步数据呈现出来。
创建RandmWalk()类: 代码如下(示例):
from random import choice class RandomWalk(): """一个生成随机漫步数据的类""" def __init__(self, num_points=5000): """初始化随机漫步的属性""" self.num_points = num_points # 所有随机漫步均始于(0,0) self.x_values = [0] self.y_values = [0] def get_step(self): """确定每次漫步的距离和方向""" # 决定前进方向以及沿这个方向前进的距离 x_direction = choice([1, -1]) x_distance = choice([0, 1, 2, 3, 4, 5]) x_step = x_direction * x_distance y_direction = choice([1, -1]) y_distance = choice([0, 1, 2, 3, 4]) y_step = y_direction * y_distance return x_step, y_step def fill_walk(self): """计算随机漫步包含的所有点""" # 不断漫步,直到列表达到指定的长度 while len(self.x_values)<self.num_points: x_step, y_step = self.get_step() # 拒绝原地踏步 if x_step == 0 and y_step == 0: continue # 计算下一个点的x和y值 next_x = self.x_values[-1] + x_step next_y = self.y_values[-1] + y_step self.x_values.append(next_x) self.y_values.append(next_y)绘制随机漫步图:
import matplotlib.pyplot as plt from random_walk import RandomWalk # 只要程序处于活动状态,就不断模拟随机漫步 while True: # 创建一个RandomWalk的实例,并将其包含的点都绘制出来 rw = RandomWalk(50000) rw.fill_walk() # 设置绘图窗口的尺寸 plt.figure(dpi=128, figsize=(10,6)) point_number = list(range(rw.num_points)) # 颜色映射 plt.scatter(rw.x_values, rw.y_values, c=point_number, cmap=plt.cm.Blues, edgecolors='none', s=1) # 重新绘制起点和终点 plt.scatter(0, 0, c='green', edgecolors='none', s=100) plt.scatter(rw.x_values[-1], rw.y_values[-1], c='red', edgecolors='none', s=100) # 隐藏坐标轴 plt.axes().get_xaxis().set_visible(False) plt.axes().get_yaxis().set_visible(False) plt.show() # 模拟多次随机漫步 keep_running = input("Make another walk?(y/n):") if keep_running == 'n': break一次随机漫步的结果图: 实际上,由于random的使用,我们每次随机漫步结果都不尽相同。
将上述程序中的scatter()改为plot(),并做适当修改,可得到花粉运动的轨迹图像。 修改程序如下:
import matplotlib.pyplot as plt from random_walk import RandomWalk # 只要程序处于活动状态,就不断模拟随机漫步 while True: # 创建一个RandomWalk的实例,并将其包含的点都绘制出来 rw = RandomWalk(5000) rw.fill_walk() # 设置绘图窗口的尺寸 plt.figure(dpi=128, figsize=(10,6)) point_number = list(range(rw.num_points)) plt.plot(rw.x_values, rw.y_values, linewidth=1) plt.scatter(0, 0, c='green', edgecolors='none', s=100) plt.scatter(rw.x_values[-1], rw.y_values[-1], c='red', edgecolors='none', s=100) # 隐藏坐标轴 plt.axes().get_xaxis().set_visible(False) plt.axes().get_yaxis().set_visible(False) keep_running = input("Make another walk?(y/n):") if keep_running == 'n': break plt.show()花粉轨迹图像:
关于matplotlib库的使用,暂时记录到这里,之后继续补充。