制作.bin数据集

来源：互联网发布：如何正确看待体检数据编辑：程序博客网时间：2024/06/05 11:09

python版本

参考： http://blog.csdn.net/qq_32166627/article/details/68946809

tip：

（1）im.thumbnail((200,100)) 按照元组中传入的参数大小对图片进行缩放。上述连接对图片的预处理：先裁剪成宽高1:1，再进行等比例缩放。（和直接从中心裁剪，直接reshape的区别在哪？）

（2）r,g,b = im.split() 在RGB模式下，每个图片由三个通道叠加而成，每个模式下为一个灰度图，合成后变为真彩图。python 的 PIL库提供的image.split()将rgb图片各通道的值分割，返回 r,g,b.（http://blog.csdn.net/bluehawksky/article/details/44219833）

在opencv中，split提取RGB分量，返回顺序是BGR，合并通道时用merge，传入BGR分量，返回用RGB合成的图片。（http://lib.csdn.net/article/opencv/23600）

（3） np.concatenate（）数组拼接。数组的拼接有3个方法。a:extend()适用于一位数组拼接，耗时，大量数据不适合使用。b:append()只能对数组和元素，数组和数组进行拼接，不能3个及以上各数组间的拼接，返回一维数组。拼接不改变原数组，例如 np.append(a,1)，返回值是a和1拼接起来的结果，但是a本身没有改变，除非a.append(1)。c:concatenate() 能一次完成多个数组的拼接，效率高。第二参数可以指定拼接的方式。（http://blog.csdn.net/zyl1042635242/article/details/43162031）

cifar10数据集 python版本和bin版本的数据集格式，内容是不一样的。。。

.bin 参考代码：https://github.com/yhlleo/imageBinaryDataset

修改几个环境配置即可

opencv中 image.data属性返回数组，查看图片像素。每个像素4位，（RGBA）

该程序中包含 reshape 的功能。

阅读全文

0 0