数据分析 基础篇

来源:互联网 发布:代码段和数据段 编辑:程序博客网 时间:2024/05/28 03:02
  • 基本函数库
    • Numpy                                   提供数组支持,以及相应的高效的处理函数
    • Scipy                                      提供矩阵支持,以及矩阵相关的数值计算模块
    • Matplotlib                               强大的数据可视化工具,组图库
    • Pandas                                  强大,灵活的数据分析和探索工具
    • StataModels                         统计建模和计量经济学,包括描述统计学,统计模型估计和推断
    • Scikit-Learn                          支持回归,分类,聚类等强大的机器学习库
    • Keras                                     深度学习库,用于建立神经网络以及深度学习模型
    • Gensim                                 用于做文本主题模型的库,文本挖掘可能用到
  • windows 安装 numpy
    • pip install numpypython setup.py install
  • linux  安装 numpy
    • pip install numpypython seup.py install
    • sudo apt-get install python-numpy
  • linux  安装Scipy ,  Matplotlib
    • sudo apt-get install python-scipy
    • sudo apt-get install python-matplotlib
    • 测试
    • import numpy as np

      import matplotlib.pyplot as plt

      x = np.linspace(0, 10, 1000) #作图自变量

      y = np.sin(x) + 1 #因变量 y

      z = np.cos(x**2) +1 # 因变量 z

      plt.figure(figsize = (8,4)) #设置图像大小

      plt.plot(x,y,label = '$\sin x+ 1$', color = 'red', linewidth = 2) # 作图,设置标签,线条颜色,线条大小

      plt.plot(x, z, 'b--', label ='$\cos x^2 + 1 $')

      plt.xlabel('Time(s)')

      plt.ylabel('Volt')

      plt.title('A Simple Example')

      plt.ylim(0, 2.2)

      plt.legend()

      plt.show()