FCN语义分割——直接加载图像数据

来源：互联网发布：男士护肤知乎编辑：程序博客网时间：2024/06/01 07:22

前言

在之前的一篇博客中我们使用了在Github上的代码进行语义分割，在进行训练的时候Github上给出的是mat文件类型的图像数据，这就很不方便了。这里经过查阅相关资料之后发现不需要进行格式的转换也可以进行训练的。

修改过程

这里还是用之前的博客里面提到的voc-fcn8s。打开train.prototxt和val.prototxt之后可以看到这样的层定义

layer {  name: "data"  type: "Python"  top: "data"  top: "label"  python_param {    module: "voc_layers"    layer: "SBDDSegDataLayer"    param_str: "{\'sbdd_dir\': \'../data/sbdd/dataset\', \'seed\': 1337, \'split\': \'train\', \'mean\': (104.00699, 116.66877, 122.67892)}"  }}

里面的module指明了使用的python文件，也就是用来进行数据导入的。打开它我们可以看到在类SBDDSegDataLayer的成员函数load_label使用到了mat文件，如下

def load_label(self, idx):    """    Load label image as 1 x height x width integer array of label indices.    The leading singleton dimension is required by the loss.    """    import scipy.io    mat = scipy.io.loadmat('{}/cls/{}.mat'.format(self.sbdd_dir, idx))    label = mat['GTcls'][0]['Segmentation'][0].astype(np.uint8)    label = label[np.newaxis, ...]    return label

将其修改为

def load_label(self, idx):    """    Load label image as 1 x height x width integer array of label indices.    The leading singleton dimension is required by the loss.    """    im = Image.open('{}/cls/{}.png'.format(self.sbdd_dir, idx))    label = np.array(im, dtype=np.uint8)    label = label[np.newaxis, ...]    return label

就可以直接进行加载图像数据了。
ref: caffe下fcn数据集制作的简化

PS 之前应为没有注意好图像的通道问题导致了CUBLAS_STATUS_MAPING_ERROR的问题
eeor
这里是因为本人私自加了im= im.convert(‘L’)。导致参数不匹配，出现错误，将其删除之后正常运行。类似的出现这种错误的原因主要为输入参数范围不匹配等造成的。

阅读全文

0 0