Python与数据分析2

来源:互联网 发布:个人dna录入全国数据库 编辑:程序博客网 时间:2024/06/05 15:23

1. pyinstaller

解析:pyinstaller -F -w XXX.py。

(1)-w:不启动cmd窗口。

(2)-F:打包成一个独立的exe文件。


2. Python多进程和多线程

解析:

(1)多进程:multiprocessing。

(2)多线程:threading,thread。


3. Python单元测试框架

解析:(1)unittest(2)nose


4. NearPy [1]

解析:Python framework for fast (approximated) nearest neighbour search in large, high-dimensional data sets 

using different locality-sensitive hashes.


5. __future__模块

解析:Python提供了__future__模块,把下一个新版本的特性导入到当前版本,于是就可以在当前版本中测试一些新

版本的特性。


6. python class和class(object)用法区别

解析:使用class(object)表示Python新式类,主要是为了统一类(class)和类型(type)。在Python 2.X版本中最好

使用class(object),而在Python 3.X中已经默认帮你加载上object了。


7. Python中的单下划线和双下划线

解析:"单下划线" 开始的成员变量叫做保护变量,意思是只有类对象和子类对象自己能访问到这些变量;"双下划线" 

开始的是私有成员,意思是只有类对象自己能访问,连子类对象也不能访问到这个数据。带有单下划线的特性(变量

和函数)不会被from module import *导入。


8. numpy.sin()

解析:np.sin(np.pi/2.)=1.0


9. assert

解析:assert语句用来声明某个条件是真的,当assert语句失败的时候,会引发AssertionError。


10. np.random.randn

解析:Return a sample (or samples) from the "standard normal" distribution.


11. numpy.random.rand

解析:Create array of the given shape and populate it with random samples from a uniform distribution over [0,1).


12. numpy.random.choice(a, size=None, replace=True, p=None)

解析:np.random.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0]):Generate a non-uniform random sample from 

np.arange(5) of size 3 without replacement array([2, 3, 0]).


13. shutil.rmtree

解析:递归删除目录内容。


14. from collections import namedtuple

解析:namedtuple用来创建一个自定义的tuple对象,并且规定了tuple元素的个数,可以用属性而不是索引来引用

tuple的某个元素。比如Point = namedtuple('Point', ['x', 'y'])。


15. from collections import deque

解析:deque是为高效实现插入和删除操作的双向列表,适合用于队列和栈。它除了实现list的append()和pop()外,还

支持appendleft()和popleft(),这样就可以非常高效地向头部添加或删除元素。  


16. from collections import defaultdict

解析:使用dict时,如果引用的Key不存在,就会抛出KeyError。如果希望key不存在时,返回一个默认值,就可以用

defaultdict。默认值是调用函数返回的,而函数在创建defaultdict对象时传入。比如xxx = defaultdict(lambda: 'N/A')。


17. from collections import OrderedDict

解析:使用dict时,Key是无序的。如果要保持Key的顺序,可以用OrderedDict,它的Key会按照插入的顺序排列,不

是Key本身排序。OrderedDict可以实现一个FIFO(先进先出)的dict,当容量超出限制时,先删除最早添加的Key。 


18. from collections import Counter

解析:Counter是一个简单的计数器,可以统计字符出现的个数。


19. Python中的配置类

解析:RawConfigParser类;ConfigParser类;SafeConfigParser类。


20. Cython

解析:Cython是一个快速生成Python扩展模块的工具,当Python的性能遇到瓶颈时,Cython直接将C的原生速度植入

Python程序。


参考文献:

[1] pixelogik/NearPy:https://github.com/pixelogik/NearPy 

1 0