加速你的Python代码

来源:互联网 发布:tcp动态端口 编辑:程序博客网 时间:2024/05/16 07:21

在我看来,python社区分为了三个流派,分别是python 2.x组织,3.x组织和PyPy组织。这个分类基本上可以归根于类库的兼容性和速度。这篇文章将聚焦于一些通用代码的优化技巧以及编译成C后性能的显著提升,当然我也会给出三大主要python流派运行时间。我的目的不是为了证明一个比另一个强,只是为了让你知道如何在不同的环境下使用这些具体例子作比较。

使用生成器

一个普遍被忽略的内存优化是生成器的使用。生成器让我们创建一个函数一次只返回一条记录,而不是一次返回所有的记录,如果你正在使用python2.x,这就是你为啥使用xrange替代range或者使用ifilter替代filter的原因。一个很好地例子就是创建一个很大的列表并将它们拼合在一起。

  1. import timeit  
  2. import random  
  3.    
  4. def generate(num):  
  5. while num:  
  6. yield random.randrange(10)  
  7. num -= 1 
  8.    
  9. def create_list(num):  
  10. numbers = []  
  11. while num:  
  12. numbers.append(random.randrange(10))  
  13. num -= 1 
  14. return numbers  
  15. print(timeit.timeit("sum(generate(999))", setup="from __main__ import generate", number=1000))  
  16. >>> 0.88098192215 #Python 2.7  
  17. >>> 1.416813850402832 #Python 3.2  
  18. print(timeit.timeit("sum(create_list(999))", setup="from __main__ import create_list", number=1000))  
  19. >>> 0.924163103104 #Python 2.7  
  20. >>> 1.5026731491088867 #Python 3.2 

这不仅是快了一点,也避免了你在内存中存储全部的列表!

Ctypes的介绍

对于关键性的性能代码python本身也提供给我们一个API来调用C方法,主要通过 ctypes来实现,你可以不写任何C代码来利用ctypes。默认情况下python提供了预编译的标准c库,我们再回到生成器的例子,看看使用ctypes实现花费多少时间。

  1. import timeit  
  2. from ctypes import cdll  
  3.    
  4. def generate_c(num):  
  5. #Load standard C library  
  6. libc = cdll.LoadLibrary("libc.so.6"#Linux  
  7. #libc = cdll.msvcrt #Windows  
  8. while num:  
  9. yield libc.rand() % 10 
  10. num -= 1 
  11.    
  12. print(timeit.timeit("sum(generate_c(999))", setup="from __main__ import generate_c", number=1000))  
  13. >>> 0.434374809265 #Python 2.7  
  14. >>> 0.7084300518035889 #Python 3.2 

仅仅换成了c的随机函数,运行时间减了大半!现在如果我告诉你我们还能做得更好,你信吗?

Cython的介绍

Cython 是python的一个超集,允许我们调用C函数以及声明变量来提高性能。尝试使用之前我们需要先安装Cython.

sudo pip install cythonCython 本质上是另一个不再开发的类似类库Pyrex的分支,它将我们的类Python代码编译成C库,我们可以在一个python文件中调用。对于你的python文件使用.pyx后缀替代.py后缀,让我们看一下使用Cython如何来运行我们的生成器代码。

  1. #cython_generator.pyx  
  2. import random  
  3.    
  4. def generate(num):  
  5. while num:  
  6. yield random.randrange(10)  
  7. num -= 1 

我们需要创建个setup.py以便我们能获取到Cython来编译我们的函数。

  1. from distutils.core import setup  
  2. from distutils.extension import Extension  
  3. from Cython.Distutils import build_ext  
  4.    
  5. setup(  
  6. cmdclass = {'build_ext': build_ext},  
  7. ext_modules = [Extension("generator", ["cython_generator.pyx"])]  
  8. )  

编译使用:

  1. python setup.py build_ext --inplace 

你应该可以看到两个文件cython_generator.c 文件 和 generator.so文件,我们使用下面方法测试我们的程序:

  1. import timeit  
  2. print(timeit.timeit("sum(generator.generate(999))", setup="import generator", number=1000))  
  3. >>> 0.835658073425 

还不赖,让我们看看是否还有可以改进的地方。我们可以先声明“num”为整形,接着我们可以导入标准的C库来负责我们的随机函数。

  1. #cython_generator.pyx  
  2. cdef extern from "stdlib.h":  
  3. int c_libc_rand "rand"()  
  4.    
  5. def generate(int num):  
  6. while num:  
  7. yield c_libc_rand() % 10 
  8. num -= 1 

如果我们再次编译运行我们会看到这一串惊人的数字。

  1. >>> 0.033586025238 

仅仅的几个改变带来了不赖的结果。然而,有时这个改变很乏味,因此让我们来看看如何使用规则的python来实现吧。

PyPy的介绍

PyPy 是一个Python2.7.3的即时编译器,通俗地说这意味着让你的代码运行的更快。Quora在生产环境中使用了PyPy。PyPy在它们的下载页面有一些安装说明,但是如果你使用的Ubuntu系统,你可以通过apt-get来安装。它的运行方式是立即可用的,因此没有疯狂的bash或者运行脚本,只需下载然后运行即可。让我们看看我们原始的生成器代码在PyPy下的性能如何。

  1. import timeit  
  2. import random  
  3.    
  4. def generate(num):  
  5. while num:  
  6. yield random.randrange(10)  
  7. num -= 1 
  8.    
  9. def create_list(num):  
  10. numbers = []  
  11. while num:  
  12. numbers.append(random.randrange(10))  
  13. num -= 1 
  14. return numbers  
  15. print(timeit.timeit("sum(generate(999))", setup="from __main__ import generate", number=1000))  
  16. >>> 0.115154981613 #PyPy 1.9  
  17. >>> 0.118431091309 #PyPy 2.0b1  
  18. print(timeit.timeit("sum(create_list(999))", setup="from __main__ import create_list", number=1000))  
  19. >>> 0.140175104141 #PyPy 1.9  
  20. >>> 0.140514850616 #PyPy 2.0b1 

哇!没有修改一行代码运行速度是纯python实现的8倍。

进一步测试

为什么还要进一步研究?PyPy是冠军!并不全对。虽然大多数程序可以运行在PyPy上,但是还是有一些库没有被完全支持。而且,为你的项目写C的扩展相比换一个编译器更加容易。让我们更加深入一些,看看ctypes如何让我们使用C来写库。我们来测试一下归并排序和计算斐波那契数列的速度。下面是我们要用到的C代码(functions.c):

  1. /* functions.c */  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4. #include <string.h>  
  5.  
  6. /* http://rosettacode.org/wiki/Sorting_algorithms/Merge_sort#C */  
  7. inline void  
  8. merge (int *left, int l_len, int *right, int r_len, int *out)  
  9. {  
  10.   int i, j, k;  
  11.   for (i = j = k = 0; i < l_len && j < r_len;)  
  12.     out[k++] = left[i] < right[j] ? left[i++] : right[j++];  
  13.   while (i < l_len)  
  14.     out[k++] = left[i++];  
  15.   while (j < r_len)  
  16.     out[k++] = right[j++];  
  17. }  
  18.  
  19. /* inner recursion of merge sort */  
  20. void  
  21. recur (int *buf, int *tmp, int len)  
  22. {  
  23.   int l = len / 2;  
  24.   if (len <= 1)  
  25.     return;  
  26. /* note that buf and tmp are swapped */  
  27.   recur (tmp, buf, l);  
  28.   recur (tmp + l, buf + l, len - l);  
  29.   merge (tmp, l, tmp + l, len - l, buf);  
  30. }  
  31.  
  32. /* preparation work before recursion */  
  33. void  
  34. merge_sort (int *buf, int len)  
  35. {  
  36. /* call alloc, copy and free only once */  
  37.   int *tmp = malloc (sizeof (int) * len);  
  38.   memcpy (tmp, buf, sizeof (int) * len);  
  39.   recur (buf, tmp, len);  
  40.   free (tmp);  
  41. }  
  42.  
  43. int  
  44. fibRec (int n)  
  45. {  
  46.   if (n < 2)  
  47.     return n;  
  48.   else 
  49.     return fibRec (n - 1) + fibRec (n - 2);  

在Linux平台,我们可以用下面的方法把它编译成一个共享库:

  1. gcc -Wall -fPIC -c functions.c  
  2. gcc -shared -o libfunctions.so functions.o 

使用ctypes, 通过加载"libfunctions.so"这个共享库,就像我们前边对标准C库所作的那样,就可以使用这个库了。这里我们将要比较Python实现和C实现。现在我们开始计算斐波那契数列:

  1. # functions.py  
  2.  
  3. from ctypes import *  
  4. import time  
  5.    
  6. libfunctions = cdll.LoadLibrary("./libfunctions.so")  
  7.    
  8. def fibRec(n):  
  9.     if n < 2:  
  10.         return n  
  11.     else:  
  12.         return fibRec(n-1) + fibRec(n-2)  
  13.    
  14. start = time.time()  
  15. fibRec(32)  
  16. finish = time.time()  
  17. print("Python: " + str(finish - start))  
  18.    
  19. # C Fibonacci  
  20. start = time.time()  
  21. x = libfunctions.fibRec(32)  
  22. finish = time.time()  
  23. print("C: " + str(finish - start)) 
  1. Python: 1.18783187866 #Python 2.7  
  2. Python: 1.272292137145996 #Python 3.2  
  3. Python: 0.563600063324 #PyPy 1.9  
  4. Python: 0.567229032516 #PyPy 2.0b1  
  5. C: 0.043830871582 #Python 2.7 + ctypes  
  6. C: 0.04574108123779297 #Python 3.2 + ctypes  
  7. C: 0.0481240749359 #PyPy 1.9 + ctypes  
  8. C: 0.046403169632 #PyPy 2.0b1 + ctypes 

正如我们预料的那样,C比Python和PyPy更快。我们也可以用同样的方式比较归并排序。

我们还没有深挖Cypes库,所以这些例子并没有反映python强大的一面,Cypes库只有少量的标准类型限制,比如int型,char数组,float型,字节(bytes)等等。默认情况下,没有整形数组,然而通过与c_int相乘(ctype为int类型)我们可以间接获得这样的数组。这也是代码第7行所要呈现的。我们创建了一个c_int数组,有关我们数字的数组并分解打包到c_int数组中

主要的是c语言不能这样做,而且你也不想。我们用指针来修改函数体。为了通过我们的c_numbers的数列,我们必须通过引用传递merge_sort功能。运行merge_sort后,我们利用c_numbers数组进行排序,我已经把下面的代码加到我的functions.py文件中了。

  1. #Python Merge Sort  
  2. from random import shuffle, sample  
  3.    
  4. #Generate 9999 random numbers between 0 and 100000  
  5. numbers = sample(range(100000), 9999)  
  6. shuffle(numbers)  
  7. c_numbers = (c_int * len(numbers))(*numbers)  
  8.    
  9. from heapq import merge  
  10. def merge_sort(m):  
  11. if len(m) <= 1:  
  12. return m  
  13. middle = len(m) // 2 
  14. left = m[:middle]  
  15. right = m[middle:]  
  16. left = merge_sort(left)  
  17. right = merge_sort(right)  
  18. return list(merge(left, right))  
  19.    
  20. start = time.time()  
  21. numbers = merge_sort(numbers)  
  22. finish = time.time()  
  23. print("Python: " + str(finish - start))  
  24.    
  25. #C Merge Sort  
  26. start = time.time()  
  27. libfunctions.merge_sort(byref(c_numbers), len(numbers))  
  28. finish = time.time()  
  29. print("C: " + str(finish - start)) 
  1. Python: 0.190635919571 #Python 2.7  
  2. Python: 0.11785483360290527 #Python 3.2  
  3. Python: 0.266992092133 #PyPy 1.9  
  4. Python: 0.265724897385 #PyPy 2.0b1  
  5. C: 0.00201296806335 #Python 2.7 + ctypes  
  6. C: 0.0019741058349609375 #Python 3.2 + ctypes  
  7. C: 0.0029308795929 #PyPy 1.9 + ctypes  
  8. C: 0.00287103652954 #PyPy 2.0b1 + ctypes 

这儿通过表格和图标来比较不同的结果。

Bar chart comparing the various program run times

 

原文链接:http://www.oschina.net/translate/speeding-up-your-python-code

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 学生遭套路贷反被仲裁怎么办 赏脸打错字尝脸怎么办 红掌的花变黑了怎么办 红掌花苞发黑了怎么办 水培植物腐根了怎么办 水培绿萝水发臭怎么办 水里养花根烂掉怎么办 桅子花叶子发黑怎么办 大株月季烂根怎么办 月季水浇多了烂根的怎么办 金桔盆栽烂根怎么办 盆栽的长寿果树烂根怎么办 家里的石榴烂根怎么办 山桔盆栽烂根怎么办 养的植物烂根怎么办 桅子花叶子长霉怎么办 紫薇花叶子干了怎么办 高层玻璃阳台往下看恐高怎么办 比熊放阳台叫怎么办 海员入职体检不合格怎么办 联币金融立案投资人怎么办 联币金融的投资怎么办 养老保险领了几个月就挂了怎么办 高铁餐吧乘务员东西卖不出去怎么办 铁路局如果查出有乙肝怎么办 在火车站丢了东西怎么办 在新乡火车站丢了东西怎么办 自己的行李忘到高铁安检怎么办 高铁二等座睡觉怎么办 空少岁数大了怎么办 美国留学生办欧洲签证怎么办 苏州小区不让装充电桩怎么办 饿了么运力不足怎么办 书法落款写偏了怎么办 辐射4运行不流畅怎么办 vgs币忘了映射怎么办 货车把我的货物运输中损坏怎么办 道路货物运输从业资格证过期怎么办 高铁喷雾被扣了怎么办 宝宝不好好吸奶怎么办 宝宝不用劲吸奶怎么办