python 分割字符串

来源:互联网 发布:db2 删除表 关系 sql 编辑:程序博客网 时间:2024/06/02 05:49

      1. string 对象的split() 方法只适应于非常简单的字符串分割情形,它并不允许有多个分隔符或者是分隔符周围不确定的空格。当你需要更加灵活的切割字符串的时候,最好使用re.split() 方法:

>>> line = 'asdf fjdk; afed, fjek,asdf, foo'>>> import re>>> re.split(r'[;,\s]\s*', line)['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
    

     2.当你使用re.split() 函数时候,需要特别注意的是正则表达式中是否包含一个括号捕获分组。如果使用了捕获分组,那么被匹配的文本也将出现在结果列表中。比如,观察一下这段代码运行后的结果:

>>> fields = re.split(r'(;j,j\s)\s*', line)>>> fields['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']>>>

   3.如果你不想保留分割字符串到结果列表中去,但仍然需要使用到括号来分组正则表达式的话,确保你的分组是非捕获分组,形如(?:...) 。比如:

>>> re.split(r'(?:,j;j\s)\s*', line)['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']>>>

   4.获取分割字符在某些情况下也是有用的。比如,你可能想保留分割字符串,用来在后面重新构造一个新的输出字符串:

>>> values = fields[::2]  #切片,隔一个取一个元素的操作,[::-1] 视为翻转操作>>> delimiters = fields[1::2] + ['']>>> values['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']>>> delimiters[' ', ';', ',', ',', ',', '']>>> # Reform the line using the same delimiters>>> ''.join(v+d for v,d in zip(values, delimiters))'asdf fjdk;afed,fjek,asdf,foo'>>>





原创粉丝点击