Python-数组

来源:互联网 发布:模架编程培训要多久 编辑:程序博客网 时间:2024/06/07 03:24

1. Python中的数组

形式

  • 用list和tuple等数据结构表示数组

    • 一维数组 list=[1,2,3,4]
    • 二维数组 list = [[1,2,3],[4,5,6],[7,8,9]]
  • array模块

    • 通过安装array模块,利用array函数创建数组。array.array(“B”,range(5))
    • 提供append,insert和read等方法

2.ndarray

ndarray是N维数组

  • Numpy中基本的数据结构
  • 所有元素是同一种类型
  • 别名为array
  • 利用节省内存和提高CPU计算时间

ndarray数组属性

  • 维度(dimensions)称为轴(axis),轴的个数称为(rank)
  • 基本属性
     - ndarray.ndim(秩)
     - ndarray.shape(维度)
     - ndarray.size(元素总个数)
     - ndarray.dtype(元素类型)
     - ndarray.itemsize(元素字节大小)

ndarray的创建方法:

arange array copy empty empty_like eye fromfile fromfunction identity linspace logspace mgrid ogrid ones ones_like r zeros zeros_like
>>>import numpy as np>>>aArray = np.array([1,2,3])>>>aArrayarray([1,2,3])>>>bArray = np.array([(1,2,3),(4,5,6)])>>>bArrayarray([[1,2,3],      [4,5,6]])>>>np.arange(1,5,0.5)array([1.,1.5,2.,2.5,3.,3.5,4.,4.5])>>>np.random.random((2,2))array([[0.7977704,0.1468679],[0.95838379,0.86106278]])>>>np.linspace(1,2,10,endpoint=False)array([1,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9])

ndarray的运算方法:

sum mean std var min max argmin argmax cumsum cumprod

ndarray的ufunc函数:
ufunc(universal function)是一种能对数组的每个元素进行操作的函数。NumPy内置的许多ufunc函数都是在C语言级别实现的,计算速度非常快

add all any arange apply_along_axis argmax argmin argsort average bincount ceil clip conj corrcoef cov cross cumprod cumsum diff dot exp floor

Series
- 基本特征
 - 类似一维数组的对象
 - 由数据和索引组成

from pandas import Series>>> aSer = pd.Series([1,2.0,'a'])>>>aSer0  11  22  adtype:int64
  • Series的name属性
    • 重要功能
        - Series对象本身及其索引均有一个name属性
        - Series的name属性与其他重要功能关系密切

Dataframe

  • 基本特征
     - 一个表格型的数据结构
     - 含有一组有序的列(类似于index)
     - 大致可看成共享一个index的Series集合