几个常用的Python库

来源:互联网 发布:如何抢注域名赚钱 编辑:程序博客网 时间:2024/06/05 22:45

NumPy

NumPy是Python科学计算的基础包,它提供了以下功能:

1)快速高效的多维数组对象ndarray;

2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数;

3)用于读写硬盘上基于数组的数据集的工具;

4)线性代数运算、傅里叶变换,以及随机数生成;​

5)用于将C、C++、Fortran代码集成到Python的工具。

对于数值型数据,NumPy数组在存储和处理数据时要比内置的Python数据结构高效得多。此外,由低级语言(比如C和Fortran)编写的库可以直接操作NumPy数组中的数据,无需进行任何数据复制工作。

pandas​

​pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。

用得最多的pandas对象是DataFrame,它是一个面向列的二维表结构,且含有行标和列标。

pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理功能。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。

pandas提供了大量适用于金融数据的高性能时间序列功能和工具。

matplotlib

matplotlib是最流行的用于绘制数据图表的Python库。它非常适合创建出版物上用的图表。它跟IPython结合得很好。​

SciPy

SciPy是一组专门解决科学计算中各种标准问题域的包的集合,主要包括:

1)scipy.integrate: 数值积分列程和微分方程求解器;

2)scipy.linalg: 扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能;

3)scipy.optimize:函数优化器(最小化器)以及根查找算法;

4)scipy.signal:信号处理工具;

5)scipy.sparse:稀疏矩阵和稀疏线性系统求解器;

IPython

IPython是Python科学计算标准工具集的组成部分,它将其它所有的东西联系到了一起。它为交互式和探索式计算提供了一个强健而高效的环境。它是一个增强的Python shell,目的是提高编写、测试、调试Python代码的速度。

它主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。

除标准的基于终端的IPython shell外,该项目还提供了:

1)一个类似于Mathematica的HTML笔记本;

2)一个基于Qt框架的GUI控制台,其中含有绘图、多行编辑以及语法亮亮显示等功能;

3)用于交互式并行和分布式计算的基础架构。