python str函数及其对象

来源:互联网 发布:手机游戏程序员培训 编辑:程序博客网 时间:2024/05/16 09:37
str()一般是将数值转成字符串。
repr()是将一个对象转成字符串显示,注意只是显示用,有些对象转成字符串没有直接的意思。如list,dict使用str()是无效的,但使用repr可以,这是为了看它们都有哪些值,为了显示之用。 
The str() function is meant to return representations of values which are fairly human-readable, while repr() is meant to generate representations which can be read by
the interpreter (or will force a SyntaxError if there is not equivalent syntax). For objects which don't have a particular representation for human consumption, str() will
return the same value as repr(). Many values, such as numbers or structures like lists and dictionaries, have the same representation using either function. Strings and
floating point numbers, in particular, have two distinct representations. 

Some examples: 
>>> s = 'Hello, world.'
>>> str(s)
'Hello, world.'
>>> repr(s)
"'Hello, world.'"
>>> str(0.1)
'0.1'
>>> repr(0.1)
'0.10000000000000001'
>>> x = 10 * 3.25
>>> y = 200 * 200
>>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
>>> print s
The value of x is 32.5, and y is 40000...
>>> # The repr() of a string adds string quotes and backslashes:
... hello = 'hello, world\n'
>>> hellos = repr(hello)
>>> print hellos
'hello, world\n'
>>> # The argument to repr() may be any Python object:
... repr((x, y, ('spam', 'eggs')))
"(32.5, 40000, ('spam', 'eggs'))"
>>> # reverse quotes are convenient in interactive sessions:
... `x, y, ('spam', 'eggs')`

"(32.5, 40000, ('spam', 'eggs'))"

###########################################################

python str的一些方法

在python有各种各样的string操作函数。在历史上string类在python中经历了一段轮回的历史。在最开始的时候,python有一个专门的string的module,要使用string的方法要先import,但后来由于众多的python使用者的建议,从python2.0开始,string方法改为用S.method()的形式调用,只要S是一个字符串对象就可以这样使用,而不用import。同时为了保持向后兼容,现在的python中仍然保留了一个string的module,其中定义的方法与S.method()是相同的,这些方法都最后都指向了用S.method()调用的函数。要注意,S.method()能调用的方法比string的module中的多,比如isdigit()、istitle()等就只能用S.method()的方式调用。

对一个字符串对象,首先想到的操作可能就是计算它有多少个字符组成,很容易想到用S.len(),但这是错的,应该是len(S)。因为len()是内置函数,包括在__builtin__模块中。python不把len()包含在string类型中,乍看起来好像有点不可理解,其实一切有其合理的逻辑在里头。len()不仅可以计算字符串中的字符数,还可以计算list的成员数,tuple的成员数等等,因此单单把len()算在string里是不合适,因此一是可以把len()作为通用函数,用重载实现对不同类型的操作,还有就是可以在每种有len()运算的类型中都要包含一个len()函数。python选择的是第一种解决办法。类似的还有str(arg)函数,它把arg用string类型表示出来。

字符串中字符大小写的变换:

  • S.lower()   #小写
  • S.upper()   #大写
  • S.swapcase()   #大小写互换
  • S.capitalize()   #首字母大写
  • String.capwords(S)   
    #这是模块中的方法。它把S用split()函数分开,然后用capitalize()把首字母变成大写,最后用join()合并到一起
  • S.title()    #只有首字母大写,其余为小写,模块中没有这个方法


字符串在输出时的对齐:

  • S.ljust(width,[fillchar])   
    #输出width个字符,S左对齐,不足部分用fillchar填充,默认的为空格。
  • S.rjust(width,[fillchar])    #右对齐
  • S.center(width, [fillchar])    #中间对齐
  • S.zfill(width)   #把S变成width长,并在右对齐,不足部分用0补足

字符串中的搜索和替换:

  • S.find(substr, [start, [end]])   
    #返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1。start和end作用就相当于在S[start:end]中搜索
  • S.index(substr, [start, [end]])   
    #与find()相同,只是在S中没有substr时,会返回一个运行时错误
  • S.rfind(substr, [start, [end]])   
    #返回S中最后出现的substr的第一个字母的标号,如果S中没有substr则返回-1,也就是说从右边算起的第一次出现的substr的首字母标号
  • S.rindex(substr, [start, [end]])
  • S.count(substr, [start, [end]])    #计算substr在S中出现的次数
  • S.replace(oldstr, newstr, [count])    
    #把S中的oldstar替换为newstr,count为替换次数。这是替换的通用形式,还有一些函数进行特殊字符的替换
  • S.strip([chars])
    #把S中前后chars中有的字符全部去掉,可以理解为把S前后chars替换为None
  • S.lstrip([chars])
  • S.rstrip([chars])
  • S.expandtabs([tabsize])   
    #把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个

字符串的分割和组合:

  • S.split([sep, [maxsplit]]) 
    #以sep为分隔符,把S分成一个list。maxsplit表示分割的次数。默认的分割符为空白字符
  • S.rsplit([sep, [maxsplit]])
  • S.splitlines([keepends])
    #把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。
  • S.join(seq) #把seq代表的序列──字符串序列,用S连接起来


字符串的mapping,这一功能包含两个函数:

  • String.maketrans(from, to) 
    #返回一个256个字符组成的翻译表,其中from中的字符被一一对应地转换成to,所以from和to必须是等长的。
  • S.translate(table[,deletechars]) 
    #使用上面的函数产后的翻译表,把S进行翻译,并把deletechars中有的字符删掉。需要注意的是,如果S为unicode字符串,那么就不支持deletechars参数,可以使用把某个字符翻译为None的方式实现相同的功能。此外还可以使用codecs模块的功能来创建更加功能强大的翻译表。

字符串还有一对编码和解码的函数:

  • S.encode([encoding,[errors]])
    #其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过codecs.register_error注册的值。这一部分内容涉及codecs模块,不是特明白
  • S.decode([encoding,[errors]])

字符串的测试函数,这一类函数在string模块中没有,这些函数返回的都是bool值:

  • S.startwith(prefix[,start[,end]]) 
    #是否以prefix开头
  • S.endwith(suffix[,start[,end]]) 
    #以suffix结尾
  • S.isalnum() 
    #是否全是字母和数字,并至少有一个字符
  • S.isalpha() #是否全是字母,并至少有一个字符
  • S.isdigit() #是否全是数字,并至少有一个字符
  • S.isspace() #是否全是空白字符,并至少有一个字符
  • S.islower() #S中的字母是否全是小写
  • S.isupper() #S中的字母是否便是大写
  • S.istitle() #S是否是首字母大写的


字符串类型转换函数,这几个函数只在string模块中有:

  • string.atoi(s[,base]) 
    #base默认为10,如果为0,那么s就可以是012或0x23这种形式的字符串,如果是16那么s就只能是0x23或0X12这种形式的字符串
  • string.atol(s[,base]) #转成long
  • string.atof(s[,base]) #转成float


这里再强调一次,字符串对象是不可改变的,也就是说在python创建一个字符串后,你不能把这个字符中的某一部分改变。任何上面的函数改变了字符串后,都会返回一个新的字符串,原字串并没有变。其实这也是有变通的办法的,可以用S=list(S)这个函数把S变为由单个字符为成员的list,这样的话就可以使用S[3]='a'的方式改变值,然后再使用S=" ".join(S)还原成字符串