python3 小技巧记录(此文档会不定期更新)

来源:互联网 发布:ubuntu下如何挂载u盘 编辑:程序博客网 时间:2024/06/05 07:25


1. \x字符串转换成不要打印字符串

有一个可打印的字符串,需要将\x转换成一个字节内容,最终实现很简单,仅一行,如下:

src=“\x01abcd\x023456”
eval("'"+src+"'")


注意上文的引号,有三层,中间层为单引号,其他都是双引号,详细原因也未查明,也不想理解了,哎。


描述下整个搜索过程,首先是找到的是bytes,发现没有,然后是hexlify、binascii(只能全部是16进制内容,不带有\x前缀),最后还是stackoverflow中有类似的问题,其中有回复使用escape_string,但此函数在python3没有了,python3中要用bytes,encode再unicode_escape。最后发现eval,这个邪恶的eval,以此记录,供后续查询



2. 二进制字符串转成bytes

问题是,给定一个可打印字符串,\x表示二进制的一个字节,如何转换成bytes。

使用上文中的方法eval,可以转换\x内容为一个字节,但如果要转换成bytes,一定要指明encoding,但由于这个字符为二进制内容,无法知晓其encoding。最终解决方案如下:

bytes(list(map(ord, (eval("'"+s+"'")))))

由于输入字符串s每个单元均为单字节,故可以使用ord直接转换成0-255的整数,然后拼接成一个bytes


此问题的关键还是理解string和bytes,一个string是由多个单元组成的,一个单元可以是英文,也可以是中文,也可以是\x二进制,对于中文如果要转换成bytes必须指定encoding,即将其转换为字节流形式;对于\x则需要使用ord转换。



0 0