python基础知识巩固(二)——数据处理
来源:互联网 发布:女生必知 编辑:程序博客网 时间:2024/05/17 04:09
一、数据读取与格式转换
1、将txt文件转换为csv文件:
import pandas as pdimport numpy as npdata_txt_train=np.loadtxt('train_20171215.txt',skiprows=1)data_df = pd.DataFrame(data_txt_train,columns=['date','day of week','brand','cnt'],index=np.arange(n))#n为样本数data_df.to_csv('./train.csv')
2、数据可视化
import matplotlib.pyplot as pltimport matplotlib as mpl#设置字体及图片的正确显示mpl.rcParams['font.sans-serif'] = [u'fangsong']mpl.rcParams['axes.unicode_minus'] = False#绘制普通函数图fig,ax =plt.subplots(1)fig.set_size_inches(50,16)ax.plot(y)ax.set_xlabel('data',fontsize=30)ax.set_ylabel('cnt',fontsize=30)ax.set_title('上牌量',fontszie=160)ax.set_xticks(range(0,1033,344),fontsize=40)#绘制柱状图x=data_df_week_sum.indexy=data_df_week_sum['cnt']plt.figure(figsize=(16,9))plt.bar(x,y)#显示每个柱状图对应的数值for x, y in zip(x, y): plt.text(x + 0.05, y + 0.1, '%d' % y, ha = 'center', va = 'bottom')plt.xlabel('周几',fontsize=15)plt.ylabel('上牌量',fontsize=15)plt.title('与星期几的相关性',fontsize=20)plt.show()
阅读全文