Python代码性能优化

来源：互联网发布：红蜘蛛软件一年多少钱编辑：程序博客网时间：2024/05/17 22:43

Python性能优化的一般步骤：

步骤1：找到性能瓶颈
步骤2：优化性能瓶颈
步骤3：goto 『步骤1』

找出瓶颈

不要相信直觉，使用专业工具

使用专业工具：

profile / cprofile

line_profiler

ipython: %prun

使用 timeit 模块来评判性能

import timeittimeit.Timer(…).timeit()ipython: %prun

例一：

def function1():     for item in range(1000000):                 pass

在python2中，range的实现方式是直接在内存中开辟一个静态的数组，而xrange则是通过迭代的方式动态的去生成，所以显而易见，在需要的数据量特别大的时候，range则会非常的耗费内存，所以其优化方式如下：

def function2():     for item in xrange(1000000):                 pass

简单来说，就是在需要range时，用xrange来代替，需要注意的是，在python3中，已经用xrange来代替range了，所以在python3里面，不存在这种性能问题。

例二：

def function1(l):    result = []    for i in l:        if i % 2 == 0:            result.append(i)    return result

列表迭代式相对与一般的for循环或while循环迭代方式拥有更好的性能，所以可以用列表迭代式进行代替，但是这样会大大降低代码的可读性，所以在性能和代码可读性方面要认真权衡。

def function2(l):    return [i for i in l if i % 2 == 0]

例三：

def add_two(i):    return i + 2def function1(l):    result = []    for item in l:        result.append(chr(add_two(item)))    return result

在python里，访问局部变量的速度要快于访问全剧变量，并且函数调用开销也是不容忽视的。因此，可以通过以下方式来进行优化：

def function2(l):    result = []    lchr = chr    for item in l:        result.append(lchr(item + 1))    return result

例四：

l = range(10000) def function1():     return 9000 in l

上边提到过，range的效率是相当低的，这是第一点，第二点是在判断一个数是否在一个列表中时，采用迭代的方式来判断，其时间复杂度是O(n)，而当采用set时，由于set的实现方式是基于哈希的方式进行存取的，故在找一个元素是否在一个列表里的时候，其时间复杂度为O(1)，效率提高了n倍，而且n越大，效率提高的就越明显。

s = set(range(10000)) def function2(item):     return item in s

例五：

def function1():    l = []    for i in xrange(10000):        l.insert(0, i)

这段代码的功能是往列表里面插入1-10000，且每次将新的元素插入到列表0号位置，但是由于列表的特性，每次插入到最左端的话，就需要将列表已存入的值整体右移，再将新的值插入0号位置。这样将使大量的时间耗费在移动元素上，造成效率低下，对于这种要求，我们可以使用deque来做双端队列。总结来说就是用正确的结构来做正确的事情。类似的结构还有：bisect / heapq / array / collections等。

from collections import deque def function2():     l = deque()     for i in xrange(10000):        l.appendleft(i)

本文固定链接：http://blog.dreamchasinger.cn/?p=603
欢迎访问我的自建博客：http://blog.dreamchasinger.cn

0 0