python技巧

来源：互联网发布：锐捷网络编辑：程序博客网时间：2024/06/05 03:28

本文整理自SO上的热门问答 hidden features of python ，早期有人做过类似的整理，但是内容比较旧而且比较粗糙，因此笔者在原文基础上加入自己的一些理解，另外那些高质量的评论也引入进来了。总之，这是一篇用心之作，希望你可以喜欢。

链式比较操作

>>> x = 5>>> 1 < x < 10True>>> 10 < x < 20 False>>> x < 10 < x*10 < 100True>>> 10 > x <= 9True>>> 5 == x > 4True

你可能认为它执行的过程先是： 1 < x ，返回 True ，然后再比较 True < 10 ,当然这么做也是返回 True ,比较表达式 True < 10 ,因为解释器会把 True 转换成1 ， False 转换成 0 。但这里的链式比较解释器在内部并不是这样干的，它会把这种链式的比较操作转换成： 1 < x and x < 10 ，不信你可以看看最后一个例子。这样的链式操作本可以值得所有编程语言拥有，但是很遗憾

枚举

>>> a = ['a', 'b', 'c', 'd', 'e']>>> for index, item in enumerate(a): print index, item...0 a1 b2 c3 d4 e>>>

用enumerate包装一个可迭代对象,可以同时使用迭代项和索引，如果你不这么干的话，下面有一种比较麻烦的方法：

for i in range(len(a)):    print i, a[i]

enumerate 还可以接收一个可选参数start，默认start等于0。 enumerate(list, start=1) ，这样index的起始值就是1

生成器对象

x=(n for n in foo if bar(n))  #foo是可迭代对象>>> type(x)<type 'generator'>

你可以把生成器对象赋值给x，意味着可以对x进行迭代操作：

for n in x:    pass

它的好处就是不需要存储中间结果，也许你会使用（列表推倒式）：

x = [n for n in foo if bar(n)]>>> type(x)<type 'list'>

它比生成器对象能带来更快的速度。相对地，生成器更能节省内存开销，它的值是按需生成，不需要像列表推倒式一样把整个结果保存在内存中，同时它不能重新迭代，列表推倒式则不然。

iter()可接收callable参数

iter()内建函数接收的参数分为两种，第一种是：

iter(collection)---> iterator

参数collection必须是可迭代对象或者是序列，第二种是：

iter（callable， sentinel) --> iterator

callable函数会一直被调用，直到它的返回结果等于sentinel，例如：

def seek_next_line(f):    #每次读一个字符，直到出现换行符就返回    for c in iter(lambda: f.read(1),'\n'):          pass

小心可变的默认参数

>>> def foo(x=[]):...     x.append(1)...     print x... >>> foo()[1]>>> foo()[1, 1]>>> foo()[1, 1, 1]

取而代之的是你应该使用一个标记值表示“没有指定”来替换可变值,如：

>>> def foo(x=None):...     if x is None:...         x = []...     x.append(1)...     print x>>> foo()[1]>>> foo()[1]

发送值到生成器函数在中

def mygen():    """Yield 5 until something else is passed back via send()"""    a = 5    while True:        f = (yield a) #yield a and possibly get f in return        if f is not None:             a = f  #store the new value

你可以：

>>> g = mygen()>>> g.next()5>>> g.next()5>>> g.send(7)  #we send this back to the generator7>>> g.next() #now it will yield 7 until we send something else7

如果你不喜欢使用空格缩进，那么可以使用C语言花括号{}定义函数：

>>> from __future__ import braces   #这里的braces 指的是：curly braces（花括号）  File "<stdin>", line 1SyntaxError: not a chance

当然这仅仅是一个玩笑，想用花括号定义函数？没门。感兴趣的还可以了解下：

from __future__ import barry_as_FLUFL

不过这是python3里面的特性， http://www.python.org/dev/peps/pep-0401/

切片操作中的步长参数

a = [1,2,3,4,5]>>> a[::2]  # iterate over the whole list in 2-increments[1,3,5]

还有一个特例： x[::-1] ，反转列表：

>>> a[::-1][5,4,3,2,1]

有关反转，还有两个函数reverse、reversed，reverse是list对象的方法，没有返回值，而reversed是内建方法，可接收的参数包括tuple、string、list、unicode，以及用户自定义的类型，返回一个迭代器。

>>> l = range(5)>>> l[0, 1, 2, 3, 4]>>> l.reverse()>>> l[4, 3, 2, 1, 0]>>> l2 = reversed(l)>>> l2<listreverseiterator object at 0x99faeec>

装饰器

装饰器使一个函数或方法包装在另一个函数里头，可以在被包装的函数添加一些额外的功能，比如日志，还可以对参数、返回结果进行修改。装饰器有点类似Java中的AOP。下面这个例子是打印被装饰的函数里面的参数的装饰器，

>>> def print_args(function):>>>     def wrapper(*args, **kwargs):>>>         print 'Arguments:', args, kwargs>>>         return function(*args, **kwargs)>>>     return wrapper>>> @print_args>>> def write(text):>>>     print text>>> write('foo')Arguments: ('foo',) {}foo

@是语法糖，它等价于：

>>> write = print_args(write)>>> write('foo')arguments: ('foo',) {}foo

for ... else语法

for i in foo:    if i == 0:        breakelse:    print("i was never 0")

else代码块只有在for循环正常结束后执行如果遇到break语句那么不会执行else语句块，等价于下面：

found = Falsefor i in foo:    if i == 0:        found = True        breakif not found:     print("i was never 0")

不过这种语法看起来怪怪地，让人感觉是else块是在for语句块没有执行的时候执行的，很容易让人去类比 if else 的语法，如果是把else换成finally或许更容易理解

python2.5有个 `missing` 方法

dict的子类如果定义了方法 __missing__(self, key) ，如果key不再dict中，那么d[key]就会调用 __missing__ 方法，而且d[key]的返回值就是 __missing__ 的返回值。

>>> class MyDict(dict):...  def __missing__(self, key):...   self[key] = rv = []...   return rv... >>> m = MyDict()>>> m["foo"].append(1)>>> m["foo"].append(2)>>> dict(m){'foo': [1, 2]}

在collections模块下有一个叫defaultdict的dict子类，它与missing非常类似，但是对于不存在的项不需要传递参数。

>>> from collections import defaultdict>>> m = defaultdict(list)>>> m["foo"].append(1)>>> m["foo"].append(2)>>> dict(m){'foo': [1, 2]}

变量值交换

>>> a = 10>>> b = 5>>> a, b(10, 5)>>> a, b = b, a>>> a, b(5, 10)

等号右边是一个创建元组的表达式，等号左边解压（没有引用的）元组分别赋给名称（变量）a和b。赋完值后因为没有被其他名字引用，因此被标记之后被垃圾收集器回收，而绑定到a和b的值已经被交换了。注意：多值赋值其实仅仅就是元组打包和序列解包的组合的过程

可读的正则表达式

在Python中你可以把正则表达式分割成多行写，还可以写注释

>>> pattern = """... ^                   # beginning of string... M{0,4}              # thousands - 0 to 4 M's... (CM|CD|D?C{0,3})    # hundreds - 900 (CM), 400 (CD), 0-300 (0 to 3 C's),...                     #            or 500-800 (D, followed by 0 to 3 C's)... (XC|XL|L?X{0,3})    # tens - 90 (XC), 40 (XL), 0-30 (0 to 3 X's),...                     #        or 50-80 (L, followed by 0 to 3 X's)... (IX|IV|V?I{0,3})    # ones - 9 (IX), 4 (IV), 0-3 (0 to 3 I's),...                     #        or 5-8 (V, followed by 0 to 3 I's)... $                   # end of string... """>>> re.search(pattern, 'M', re.VERBOSE)

函数参数解包(unpacking)

分别使用 * 和 ** 解包列表和字典,这是一种非常实用的快捷方式,因为list,tuple,dict作为容器被广泛使用

def draw_point(x, y):    # do some magicpoint_foo = (3, 4)point_bar = {'y': 3, 'x': 2}draw_point(*point_foo)draw_point(**point_bar)

动态地创建新类型

动态创建新类型虽不是实用功能,但了解一下也是有好处的

>>> NewType = type("NewType", (object,), {"x": "hello"})>>> n = NewType()>>> n.x"hello"

type的第一个参数就是类名,第二个参数是继承的父类,第三个参数是类的属性.它完全等同于:

>>> class NewType(object):>>>     x = "hello">>> n = NewType()>>> n.x"hello"

上下文管理器与with语句

上下文管理器(context manager)用于规定某个对象的使用范围,进入或退出该范围时,特殊的操作会被执行(比如关闭连接,释放内存等等),语法是: with... as ... ,该特性在python2.5引入的. 上下文管理器协议有两个方法组成contextmanager.__enter__() 和 contextmanager.__exit__() ,任何实现了这两个方法的对象都称之为上下文管理器对象,比如文件对象就默认实现了该协议.

with open('foo.txt', 'w') as f:    f.write('hello!')

字典的get()方法

字典的get()方法用来替换d['key'],后者如果是遇到key不存在会有异常,如果使用的d.get('key'),key不存在时它返回的是None,你可以指定两个参数如:d.get('key',0)来用0取代返回的None

sum[value] = sum.get(value, 0) + 1

还有一个类似的方法 setdefault(key, value) ,如果字典中存在key,那么就直接返回d[key],否则设置d[key]=value,并返回该值.

>>> d = {'key':123}>>> d.setdefault('key',456)123>>> d['key']123>>> d.setdefault('key2',456)456>>> d['key2']456

collections.Counter是dict的子类,用来统计可哈稀对象,

>>> cnt = Counter('helloworld')>>> cntCounter({'l': 3, 'o': 2, 'e': 1, 'd': 1, 'h': 1, 'r': 1, 'w': 1})>>> cnt['l']3>>> cnt['x'] = 10>>> cnt.get('y')

描述符(Descriptors)

描述符是python的核心特新之一,当你使用 . 访问成员时,(如:x.y),python首先在实例字典中查找该成员,如果没有发现再从类字典中查找,如果这个对象实现了描述符(实现了 __get__,__set__,__delete__ ),那么优先返回 __get__ 方法的返回值.

条件赋值

为什么python中没有类c语言的三目运算符,Guido van Rossum说过了,条件赋值更容易理解

x = 3 if (y == 1) else 2

这个表达式的意思就是:如果y等于那么就把3赋值给x,否则把2赋值给x, 条件中的括号是可选的,为了可读性可以考虑加上去.if else中的表达式可以是任何类型的,既可以函数,还可以类

(func1 if y == 1 else func2)(arg1, arg2)

如果y等于1,那么调用func1(arg1,arg2)否则调用func2(arg1,arg2)

x = (class1 if y == 1 else class2)(arg1, arg2)

class1,class2是两个类

异常else语句块

try:   try_this(whatever)except SomeException, exception:   #Handle exceptionelse:    # do somethingfinally:    #do something

else语句块会在没有异常的情况下执行,先于finally,它的好处就是你可以明确知道它会在没有异常的情况下执行,如果是把else语句块放在try语句块里面就达不到这种效果.

1 0