python 速度优化

来源：互联网发布：轮回转世是真的吗知乎编辑：程序博客网时间：2024/06/07 15:53

在我看来，python社区分为了三个流派，分别是python 2.x组织，3.x组织和PyPy组织。这个分类基本上可以归根于类库的兼容性和速度。这篇文章将聚焦于一些通用代码的优化技巧以及编译成C后性能的显著提升，当然我也会给出三大主要python流派运行时间。我的目的不是为了证明一个比另一个强，只是为了让你知道如何在不同的环境下使用这些具体例子作比较。

缪斯的情人
翻译于 2年前

3人顶

顶翻译的不错哦!

使用生成器

一个普遍被忽略的内存优化是生成器的使用。生成器让我们创建一个函数一次只返回一条记录，而不是一次返回所有的记录，如果你正在使用python2.x，这就是你为啥使用xrange替代range或者使用ifilter替代filter的原因。一个很好地例子就是创建一个很大的列表并将它们拼合在一起。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
importtimeit
importrandom
  
defgenerate(num):
whilenum:
yieldrandom.randrange(10)
num -=1
  
defcreate_list(num):
numbers =[]
whilenum:
numbers.append(random.randrange(10))
num -=1
returnnumbers
print(timeit.timeit("sum(generate(999))", setup="from __main__ import generate", number=1000))
>>> 0.88098192215#Python 2.7
>>> 1.416813850402832#Python 3.2
print(timeit.timeit("sum(create_list(999))", setup="from __main__ import create_list", number=1000))
>>> 0.924163103104#Python 2.7
>>> 1.5026731491088867#Python 3.2

这不仅是快了一点，也避免了你在内存中存储全部的列表!

缪斯的情人
翻译于 2年前

3人顶

顶翻译的不错哦!

Ctypes的介绍

对于关键性的性能代码python本身也提供给我们一个API来调用C方法，主要通过 ctypes来实现，你可以不写任何C代码来利用ctypes。默认情况下python提供了预编译的标准c库，我们再回到生成器的例子，看看使用ctypes实现花费多少时间。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
importtimeit
fromctypes importcdll
  
defgenerate_c(num):
#Load standard C library
libc =cdll.LoadLibrary("libc.so.6") #Linux
#libc = cdll.msvcrt #Windows
whilenum:
yieldlibc.rand() %10
num -=1
  
print(timeit.timeit("sum(generate_c(999))", setup="from __main__ import generate_c", number=1000))
>>> 0.434374809265#Python 2.7
>>> 0.7084300518035889#Python 3.2

仅仅换成了c的随机函数，运行时间减了大半！现在如果我告诉你我们还能做得更好，你信吗?

缪斯的情人
翻译于 2年前

1人顶

顶翻译的不错哦!

Cython的介绍

Cython 是python的一个超集，允许我们调用C函数以及声明变量来提高性能。尝试使用之前我们需要先安装Cython.

sudo pip install cython

Cython 本质上是另一个不再开发的类似类库Pyrex的分支，它将我们的类Python代码编译成C库，我们可以在一个python文件中调用。对于你的python文件使用.pyx后缀替代.py后缀，让我们看一下使用Cython如何来运行我们的生成器代码。

?
1
2
3
4
5
6
7
#cython_generator.pyx
importrandom
  
defgenerate(num):
whilenum:
yieldrandom.randrange(10)
num -=1

我们需要创建个setup.py以便我们能获取到Cython来编译我们的函数。

?
1
2
3
4
5
6
7
8
fromdistutils.core importsetup
fromdistutils.extension importExtension
fromCython.Distutils importbuild_ext
  
setup(
cmdclass ={'build_ext': build_ext},
ext_modules =[Extension("generator", ["cython_generator.pyx"])]
)

编译使用:

python setup.py build_ext --inplace

你应该可以看到两个文件cython_generator.c 文件和 generator.so文件，我们使用下面方法测试我们的程序:

?
1
2
3
importtimeit
print(timeit.timeit("sum(generator.generate(999))", setup="import generator", number=1000))
>>> 0.835658073425

还不赖，让我们看看是否还有可以改进的地方。我们可以先声明“num”为整形，接着我们可以导入标准的C库来负责我们的随机函数。

?
1
2
3
4
5
6
7
8
#cython_generator.pyx
cdef extern from"stdlib.h":
intc_libc_rand "rand"()
  
defgenerate(intnum):
whilenum:
yieldc_libc_rand() %10
num -=1

如果我们再次编译运行我们会看到这一串惊人的数字。

>>> 0.033586025238

仅仅的几个改变带来了不赖的结果。然而，有时这个改变很乏味，因此让我们来看看如何使用规则的python来实现吧。

缪斯的情人
翻译于 2年前

1人顶

顶翻译的不错哦!

其它翻译版本(1)

PyPy的介绍

PyPy 是一个Python2.7.3的即时编译器，通俗地说这意味着让你的代码运行的更快。Quora在生产环境中使用了PyPy。PyPy在它们的下载页面有一些安装说明，但是如果你使用的Ubuntu系统，你可以通过apt-get来安装。它的运行方式是立即可用的，因此没有疯狂的bash或者运行脚本，只需下载然后运行即可。让我们看看我们原始的生成器代码在PyPy下的性能如何。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
importtimeit
importrandom
  
defgenerate(num):
whilenum:
yieldrandom.randrange(10)
num -=1
  
defcreate_list(num):
numbers =[]
whilenum:
numbers.append(random.randrange(10))
num -=1
returnnumbers
print(timeit.timeit("sum(generate(999))", setup="from __main__ import generate", number=1000))
>>> 0.115154981613#PyPy 1.9
>>> 0.118431091309#PyPy 2.0b1
print(timeit.timeit("sum(create_list(999))", setup="from __main__ import create_list", number=1000))
>>> 0.140175104141#PyPy 1.9
>>> 0.140514850616#PyPy 2.0b1

哇！没有修改一行代码运行速度是纯python实现的8倍。

缪斯的情人
翻译于 2年前

0人顶

顶翻译的不错哦!

进一步测试

为什么还要进一步研究？PyPy是冠军！并不全对。虽然大多数程序可以运行在PyPy上，但是还是有一些库没有被完全支持。而且，为你的项目写C的扩展相比换一个编译器更加容易。让我们更加深入一些，看看ctypes如何让我们使用C来写库。我们来测试一下归并排序和计算斐波那契数列的速度。下面是我们要用到的C代码（functions.c）：

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
/* functions.c */
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
 
/* http://rosettacode.org/wiki/Sorting_algorithms/Merge_sort#C */
inlinevoid
merge (int*left, intl_len, int*right, intr_len, int*out)
{
  inti, j, k;
  for(i = j = k = 0; i < l_len && j < r_len;)
    out[k++] = left[i] < right[j] ? left[i++] : right[j++];
  while(i < l_len)
    out[k++] = left[i++];
  while(j < r_len)
    out[k++] = right[j++];
}
 
/* inner recursion of merge sort */
void
recur (int*buf, int*tmp, intlen)
{
  intl = len / 2;
  if(len <= 1)
    return;
/* note that buf and tmp are swapped */
  recur (tmp, buf, l);
  recur (tmp + l, buf + l, len - l);
  merge (tmp, l, tmp + l, len - l, buf);
}
 
/* preparation work before recursion */
void
merge_sort (int*buf, intlen)
{
/* call alloc, copy and free only once */
  int*tmp = malloc(sizeof(int) * len);
  memcpy(tmp, buf, sizeof(int) * len);
  recur (buf, tmp, len);
  free(tmp);
}
 
int
fibRec (intn)
{
  if(n < 2)
    returnn;
  else
    returnfibRec (n - 1) + fibRec (n - 2);
}

在Linux平台，我们可以用下面的方法把它编译成一个共享库：

gcc -Wall -fPIC -c functions.cgcc -shared -o libfunctions.so functions.o

使用ctypes，通过加载"libfunctions.so"这个共享库，就像我们前边对标准C库所作的那样，就可以使用这个库了。这里我们将要比较Python实现和C实现。现在我们开始计算斐波那契数列：

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# functions.py
 
fromctypes import*
importtime
  
libfunctions =cdll.LoadLibrary("./libfunctions.so")
  
deffibRec(n):
    ifn < 2:
        returnn
    else:
        returnfibRec(n-1) +fibRec(n-2)
  
start =time.time()
fibRec(32)
finish =time.time()
print("Python: " + str(finish -start))
  
# C Fibonacci
start =time.time()
x =libfunctions.fibRec(32)
finish =time.time()
print("C: " + str(finish -start))

?
1
2
3
4
5
6
7
8
Python: 1.18783187866 #Python 2.7
Python: 1.272292137145996 #Python 3.2
Python: 0.563600063324 #PyPy 1.9
Python: 0.567229032516 #PyPy 2.0b1
C: 0.043830871582 #Python 2.7 + ctypes
C: 0.04574108123779297 #Python 3.2 + ctypes
C: 0.0481240749359 #PyPy 1.9 + ctypes
C: 0.046403169632 #PyPy 2.0b1 + ctypes

正如我们预料的那样，C比Python和PyPy更快。我们也可以用同样的方式比较归并排序。

crab2313
翻译于 2年前

0人顶

顶翻译的不错哦!

我们还没有深挖Cypes库，所以这些例子并没有反映python强大的一面，Cypes库只有少量的标准类型限制，比如int型，char数组，float型，字节（bytes）等等。默认情况下，没有整形数组，然而通过与c_int相乘（ctype为int类型）我们可以间接获得这样的数组。这也是代码第7行所要呈现的。我们创建了一个c_int数组，有关我们数字的数组并分解打包到c_int数组中

主要的是c语言不能这样做，而且你也不想。我们用指针来修改函数体。为了通过我们的c_numbers的数列，我们必须通过引用传递merge_sort功能。运行merge_sort后，我们利用c_numbers数组进行排序，我已经把下面的代码加到我的functions.py文件中了。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#Python Merge Sort
from random import shuffle, sample
  
#Generate 9999 random numbers between 0 and 100000
numbers = sample(range(100000), 9999)
shuffle(numbers)
c_numbers = (c_int * len(numbers))(*numbers)
  
from heapq import merge
defmerge_sort(m):
iflen(m) <= 1:
returnm
middle = len(m) // 2
left = m[:middle]
right = m[middle:]
left = merge_sort(left)
right = merge_sort(right)
returnlist(merge(left, right))
  
start = time.time()
numbers = merge_sort(numbers)
finish = time.time()
print("Python: " + str(finish - start))
  
#C Merge Sort
start = time.time()
libfunctions.merge_sort(byref(c_numbers), len(numbers))
finish = time.time()
print("C: " + str(finish - start))

?
1
2
3
4
5
6
7
8
Python: 0.190635919571 #Python 2.7
Python: 0.11785483360290527 #Python 3.2
Python: 0.266992092133 #PyPy 1.9
Python: 0.265724897385 #PyPy 2.0b1
C: 0.00201296806335 #Python 2.7 + ctypes
C: 0.0019741058349609375 #Python 3.2 + ctypes
C: 0.0029308795929 #PyPy 1.9 + ctypes
C: 0.00287103652954 #PyPy 2.0b1 + ctypes

这儿通过表格和图标来比较不同的结果。

Bar chart comparing the various program run times

Merge SortFibonacciPython 2.70.1911.187Python 2.7 + ctypes0.0020.044Python 3.20.1181.272Python 3.2 + ctypes0.0020.046PyPy 1.90.2670.564PyPy 1.9 + ctypes0.0030.048PyPy 2.0b10.2660.567PyPy 2.0b1 + ctypes0.0030.046

希望你利用C和PyPy优化你的python代码并以此为敲门砖找到一个好职位。像往常一样如果你有任何意见或问题，请随时把评论下载下面或者在我的网页上与我取得联系。感谢您的阅读！

0 0

python 速度优化

缪斯的情人翻译于 2年前

缪斯的情人翻译于 2年前

缪斯的情人翻译于 2年前

缪斯的情人翻译于 2年前

缪斯的情人翻译于 2年前

crab2313翻译于 2年前

缪斯的情人
翻译于 2年前

缪斯的情人
翻译于 2年前

缪斯的情人
翻译于 2年前

缪斯的情人
翻译于 2年前

缪斯的情人
翻译于 2年前

crab2313
翻译于 2年前