python 数据可视化练习

来源:互联网 发布:淘宝买欢乐豆 编辑:程序博客网 时间:2024/05/21 11:31

针对数据可视化,对matplotlibpygal这两个包进行简单是使用,尝试利用python绘制折线图、散点图、产生随机漫步数据、模拟投掷骰子并对结果进行统计。


例子来自: 《Python编程从入门到实战》【美】Eric Matthes

安装

如果使用anaconda,则matplotlib已经安装。若果没有可以使用pip命令安装。这里不做过多赘述。

import matplotlib

测试,如果没有报错,则证明组件包可以正常使用。


使用

plot()

简单使用

import matplotlib.pyplot as pltsquares = [1,4,8,16,25]plt.plot(squares)plt.show()

输出图像


修饰图表

import matplotlib.pyplot as pltsquares = [1,4,8,16,25]plt.plot(squares,linewidth=5)      # 设置绘制的线条的粗细#设置图表标题 坐标轴plt.title("Square Numbers", fontsize=24)    # 图表的标题plt.xlabel("Value", fontsize=14)            plt.ylabel("Square of Value", fontsize=14)# 设置刻度标记的大小plt.tick_params(axis='both', labelsize=14)   #设置刻度样式plt.show()

输出图像

对应 X Y 坐标

input_values = [1, 2, 3, 4, 5]squares = [1,4,8,16,25]plt.plot(input_values,squares,linewidth=5)

plot()函数将接受对用的xy值用于画图。

scatter() 绘制散点图

import matplotlib.pyplot as pltplt.scatter(2, 4, s=200)# 设置图表标题并给坐标轴加上标签plt.title("Square Numbers", fontsize=24)plt.xlabel("Value", fontsize=14)plt.ylabel("Square of Value", fontsize=14)# 设置刻度标记的大小plt.tick_params(axis='both', which='major', labelsize=14)plt.show()

x_values = [1, 2, 3, 4, 5]y_values = [1, 4, 9, 16, 25]plt.scatter(x_values, y_values, s=100)

绘制一系列点的方法


典型函数

坐标轴范围设置

plt.axis([0, 1100, 0, 1100000])

设置坐标轴的范围。例如把x轴设置为0~1100 y轴设置为0~1100000

设置颜色

plt.scatter(x_values, y_values, c='red', edgecolor='none', s=40)plt.scatter(x_values, y_values, c=(0, 0, 0.8), edgecolor='none', s=40)

两种设置颜色的方法

颜色渐变

import matplotlib.pyplot as pltx_values = list(range(1,1001))y_values = [x**2 for x in x_values]plt.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues, edgecolor='none', s=40)plt.axis([0, 1100,-200, 1100000])plt.show()

我们将参数c设置成了一个y值列表,并使用参数cmap告诉pyplot使用哪个颜色映射。这些代
码将y值较小的点显示为浅蓝色,并将y值较大的点显示为深蓝色。集体样式如下:

自动保存图表

plt.savefig('squares_plot.png', bbox_inches='tight')

第二个实参指定将图表多余的空白区域裁剪掉


随机漫步

编写类

from random import choiceclass RandomWalk():    """生成一个随机漫步数据的类"""    def __init__(self, num_points = 5000):        """初始化随机漫步类的属性"""        self.num_points = num_points        # 所有随机漫步起始于 (0,0)        self.x_values = [0]        self.y_values = [0]    def fill_walk(self):        """计算随机漫步包含的点"""        while len (self.x_values) < self.num_points:            x_direction = choice([1,-1])            x_distance = choice([0,1,2,3,4])            x_step = x_direction * x_distance            y_direction = choice([1, -1])            y_distance = choice([0, 1, 2, 3, 4])            y_step = y_direction * y_distance            if x_step == 0 and y_step == 0:                continue            # 计算下一个点的x和y值            next_x = self.x_values[-1] + x_step            next_y = self.y_values[-1] + y_step            self.x_values.append(next_x)            self.y_values.append(next_y)

实例化对象并使用

import matplotlib.pyplot as pltfrom random_walk import RandomWalkrw = RandomWalk()rw.fill_walk()point_numbers = list(range(rw.num_points))plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues,edgecolor='none', s=15)plt.show()

结果

突出绘制起点和终点。

# 突出起点和终点plt.scatter(0,0,c ='green',edgecolors = 'none',s=100)plt.scatter(rw.x_values[-1],rw.y_values[-1],c='red',edgecolor = 'none',s =100)

模拟骰子 结果可视化

模拟骰子

from random import randintclass Die():    """表示一个骰子的类"""    def __init__(self,num_sides=6):        """默认是6个面"""        self.num_sides = num_sides    def roll(self):        """返回一个1到最大面数之间的随机数"""        return randint(1,self.num_sides)

产生1000次结果并绘制条形图

from die import Dieimport pygal# 创建一个D6die = Die()results = []for roll_num in range(1000):    result = die.roll()    results.append(result)#  分析结果frequencies = []for value in range(1,die.num_sides+1):    frequency = results.count(value)    frequencies.append(frequency)# print(frequencies)# 对结果进行可视化hist = pygal.Bar()hist.title = "Result of rolling one D6 1000 times."hist.x_labels = ['1','2','3','4','5','6']hist.x_title = "Result"hist.y_title = "Frequency of Result"hist.add('D6',frequencies)hist.render_to_file('die_visual.svg')

结果

投掷2个骰子

from die import Dieimport pygaldie_1 = Die()die_2 = Die()results = []for roll_num in range(1000):    result = die_1.roll() + die_2.roll()    results.append(result)#  分析结果frequencies = []max_result = die_1.num_sides+die_2.num_sidesfor value in range(2,max_result+1):    frequency = results.count(value)    frequencies.append(frequency)# print(frequencies)# 对结果进行可视化hist = pygal.Bar()hist.title = "Result of rolling two D6 1000 times."hist.x_labels = ['2','3','4','5','6','7','8','9','10','11','12']hist.x_title = "Result"hist.y_title = "Frequency of Result"hist.add('D6 + D6', frequencies)hist.render_to_file('dice_visual.svg')

结果

原创粉丝点击