单变量分析绘制-学习笔记

来源:互联网 发布:mac系统截图快捷键 编辑:程序博客网 时间:2024/06/02 06:48
import numpy as npimport pandas as pdfrom scipy import stats,integrate #stats统计简写,integrate积分import matplotlib.pyplot as pltimport seaborn as snssns.set_color_codes()np.random.seed(sum(map(ord,'distributions')))##1# x=np.random.normal(size=100)# sns.distplot(x,bins =20,kde = False,fit=stats.gamma()) #distplot一般用于查看单变量的分布,kde是核密度函数,以后会讲
##2 曲线拟合gamma分布# x = np.random.gamma(6,size=200)# sns.distplot(x,kde=False,fit=stats.gamma) #重要fit拟合曲线重要#3 根据均值和协方差生成数据mean, cov = [0,1],[(1,.5),(.5,1)]data = np.random.multivariate_normal(mean,cov,200)#multivariate_normal多变量正态分布df= pd.DataFrame(data,columns=['x','y'])# print(df)##4 观察两个变量之间的分布关系最好用散点图jointplot,优势是既有散点图又有直方图,还有相关系数# sns.jointplot(x='x',y='y',data=df)#x变量,y变量,传入数据##分块散点图hex参数,颜色深的表示出现的次数多x,y=np.random.multivariate_normal(mean,cov,1000).Twith sns.axes_style('white'):    sns.jointplot(x=x,y=y,kind='hex',color='k')iris = sns.load_dataset('iris')#sns.pairplot(iris)##指定分类变量的散点图sns.pairplot(iris,hue='species')#hue参数是指定分类变量##使用调色板palette='husl'sns.pairplot(iris,hue='species',palette='husl')#palette='husl'是使用调色板的意思##使用不同的形状markers=["o", "s", "D"]sns.pairplot(iris,hue='species',palette='husl',markers=["o", "s", "D"])##改变对角图,diag_kind='kde'sns.pairplot(iris,diag_kind='kde',hue='species',palette='husl',markers=["o", "s", "D"])##使用回归regsns.pairplot(iris,kind='reg',palette='husl')##改变点的形状使用参数,使用edgecolorg7 = sns.pairplot(iris, diag_kind="kde", markers="+",                  plot_kws=dict(s=50, edgecolor="b", linewidth=1),                  diag_kws=dict(shade=True))plt.show()


阅读全文
0 0
原创粉丝点击