Python-数据统计入门

来源:互联网 发布:nc 打开端口 编辑:程序博客网 时间:2024/05/23 16:53

安装Pip

Linux:pip install -U pip
Windows:python -m pip install -U pip
Anaconda安装:
创建和启动:
conda -create –name py27 python=2.7
activate py27
列出安装:
conda list
安装package:conda install numpy
安装分析库:pip/conda
pip/conda install numpy /scipy/pandas/matplotlib

Numpy作用和有点:
提供常用的数值数组,矩阵等函数;
是基于向量的运算;比list效率高;
np.arange(10),生成一个list
xrange,调用迭代时才会产生,帮助我们节约空间;
并且可以对里面的数据进行操作,a=np.arange(10) a**2

Scipy:
是一种使用Numpy来做高等数学,信号处理,优化,统计的扩展包;
from scipy import linalg
A = =np.array([[1,2],[3,4]])
linalg.det(A) 做矩阵的行列式算

Pandas:
也是基于numpy;高级数据结构和精巧的工具(csv格式)
支持自动或者明确的数据对齐的带有标签轴的数据结构;
整合的时间序列功能;
以相同的数据结构来处理时间序列和非时间序列;
支持传递元数据的算术运算和缩减;
灵活的处理丢失数据;
在常用的基于数据的数据库中的合并和其他的关系操作;

matplotlib:绘图工具

seaborn: 绘图工具

nltk:文本处理
安装:pip install -U nltk
导入:import nltk
下载预料库:nltk.download()
文本提取,词汇的切分,词频分析,词袋模型,情感分析

igraph:社交网络分析
安装:pip install -U python-igraph
conda install -c marufr python-igraph=0.7.1.post6
图计算和社交网络分析;

scikit-learn:机器学习模型等等
安装:pip install -U scikit-learn
conda install scikit-learn

python2和python3的区别:
print()函数
整除3/2=1.5 (3)3/2=1(2)
3支持Unicode
xrange被集中在range函数中
取消了next()
通过input()解析用户输入:把用户的输入存储为str对象
返回可迭代对象,而不是列表
使用_ future _ 模块

原创粉丝点击