制作.bin数据集

来源:互联网 发布:如何正确看待体检数据 编辑:程序博客网 时间:2024/06/05 11:09

python版本

参考 : http://blog.csdn.net/qq_32166627/article/details/68946809

tip:

(1)im.thumbnail((200,100)) 按照元组中传入的参数大小对图片进行缩放。上述连接对图片的预处理:先裁剪成宽高1:1,再进行等比例缩放。(和直接从中心裁剪,直接reshape的区别在哪?)

(2)r,g,b = im.split()   在RGB模式下,每个图片由三个通道叠加而成,每个模式下为一个灰度图,合成后变为真彩图。python 的 PIL库提供的image.split()将rgb图片各通道的值分割,返回 r,g,b.(http://blog.csdn.net/bluehawksky/article/details/44219833)

在opencv中,split提取RGB分量,返回顺序是BGR,合并通道时用merge,传入BGR分量,返回用RGB合成的图片。(http://lib.csdn.net/article/opencv/23600)

(3) np.concatenate() 数组拼接。数组的拼接有3个方法。a:extend()适用于一位数组拼接,耗时,大量数据不适合使用。b:append()只能对数组和元素,数组和数组进行拼接,不能3个及以上各数组间的拼接,返回一维数组。拼接不改变原数组,例如 np.append(a,1),返回值是a和1拼接起来的结果,但是a本身没有改变,除非a.append(1)。c:concatenate() 能一次完成多个数组的拼接,效率高。第二参数可以指定拼接的方式。(http://blog.csdn.net/zyl1042635242/article/details/43162031)


cifar10数据集 python版本和bin版本的数据集格式,内容是不一样的。。。


.bin 参考代码:https://github.com/yhlleo/imageBinaryDataset

修改几个环境配置即可

opencv中 image.data属性返回数组,查看图片像素。每个像素4位,(RGBA)

该程序中包含 reshape 的功能。

原创粉丝点击