[Python模块学习]用imghdr模块识别图片格式

来源:互联网 发布:监控软件手机版 编辑:程序博客网 时间:2024/06/16 06:40

imghdr模块

功能描述:imghdr模块用于识别图片的格式。它通过检测文件的前几个字节,从而判断图片的格式。


唯一一个API

imghdr.what(file, h=None)

第一个参数file可以是用rb模式打开的file对象或者表示路径的字符串和PathLike对象。h参数是一段字节串。函数返回表示图片格式的字符串。

>>> import imghdr>>> imghdr.what('test.jpg')'jpeg'

具体的返回值和描述如下:

返回值描述检测方式 jpeg用JFIF或者Exif格式保存的JPEG图片第7到第10个字节是b’JFIF’或者b’Exif’ png可移植网络图形格式(Portable Network Graphic Format)以字节串b’\x89PNG\r\n\x1a\n’开头 gifGIF(Graphics Interchange Format)的87版本和89版本前6个字节为b’GIF87a’或者b’GIF89a’ tiffTIFF(Tag Image File Format)的两种字节顺序前两个字节为b’MM’或者b’II’ rgbSGI ImgLib以字节串b’\x01\xda’开头 pbmPortable Bitmap第1个字节为b’P’,第2个字节为b’1’或b’4’,第3个字节为b’\t’或b’\n’或b’\r’ pgmPortable Graymap Files第1个字节为b’P’,第2个字节为b’2’或b’5’,第3个字节为b’\t’或b’\n’或b’\r’ ppmPortable Pixmap Files第1个字节为b’P’,第2个字节为b’3’或b’6’,第3个字节为b’\t’或b’\n’或b’\r’ rastSun Raster以字节串b’\x59\xA6\x6A\x95’开头 xbmX Bitmap Files以字节串b’#define ‘开头 bmpBitmap,Windows标准图像文件格式以字节串b’BM’开头 webp谷歌的WebP格式,Python3.5加入以字节串b’RIFF’开头并且第9到第12个字节为b’WEBP’ exrOpenEXR,Python3.5加入以字节串b’\x76\x2f\x31\x01’开头

模块内部缺陷

当h参数不为空时,模块会忽略掉file参数,直接检测h参数,但此时file参数又是必须提供的,算是一个设计缺陷吧。博主个人感觉这个h参数根本没有存在的意义,没必要放在参数列表里面。

>>> import imghdr>>> imghdr.what('test.jpg', b'\x89PNG\r\n\x1a\n')'png'>>>

自定义检测流程

imghdr内部使用了test_jpeg、test_png、test_gif等函数检测文件的格式。模块内部维护了一个函数列表imghdr.tests,每次调用what函数的时候,会按列表里的顺序调用检测函数,当检测函数返回结果时退出循环。用户可以通过修改这个列表达到修改检测流程的目的。同时,也可以自行添加检测函数到列表里面。

下面这个例子,博主添加了一个函数放在检测流程的最后提示文件不是图片:

>>> import imghdr>>> def final(h, f):...  print("This file isn\'t a image!")...>>> imghdr.tests.append(final)>>> imghdr.what("imghdr.md")This file isn't a image!

自行添加检测函数需要接收两个参数h和f,h是用来检测的字节串,f是file对象。但是在模块内部自带的检测函数都是没用到这个f参数的…


命令行启动imghdr模块

博主读源码的时候发现了官方文档里面没提到的两个函数,提供了直接用命令行启动imghdr模块的方法。

只需要调用python -m imghdr [-r] file1 file2...就可以直接检测文件的类型。file可以是文件也可以是文件夹。该命令默认只检测文件夹下一层的文件类型,如果需要递归检测,则加上-r参数。

每个文件以”文件名: 文件类型/None”的形式打印一行输出结果。


总结:可能是因为使用的人少的原因,imghdr这个模块内部有挺多小问题,不过只要老老实实按照官方提供的文档使用是不会出事的。博主后面试着改一下这个模块然后pr上去。

0 0
原创粉丝点击