TensorFlow 之基于Inception V3的多标签分类 retrain

来源:互联网 发布:淘宝关键词采集 编辑:程序博客网 时间:2024/04/27 14:12

本文参考http://blog.csdn.net/Numeria/article/details/73604339 
以及参考开源代码github链接: https://github.com/BartyzalRadek/Multi-label-Inception-net

一、准备训练数据

1.下载数据集 
本文采用南京大学开源的数据集(点击下载:http://lamda.nju.edu.cn/files/miml-image-data.rar) 
数据集中含有2000张图像,5个类,分别为 desert, mountains, sea, sunset , trees。 
下载后包含两个压缩文件包:original.rar 以及 processed.rar 
original.rar 中包含了2000张图像数据

示例如下: 
图像数据示例

processed.rar 中包含了图像对应的标签信息。 
解压后为matlab文件格式。 
本文需要的是标签矩阵 target.mat

示例如下: 
target.mat

2.转换标签文件 
本文需将 target.mat 转换为txt格式的标签文件。 
对于每一张图像 imagename.jpg, 对应生成一个 imagename.jpg.txt 的标签文件,文件中每一行为图像所含标签。

对于下图左边的图像,有标签 desert,mountains,则对应的标签文件内容如右边所示。

这里写图片描述

对于 target.mat 文件,转化的matlab脚本如下:

 load('miml data.mat');if ~exist('labeldir')     mkdir labeldir;endLabelDir='labeldir/';for i = 1:2000    stri = num2str(i);    label_file_name = [LabelDir stri '.jpg.txt'];    fid = fopen(label_file_name,'w');    for j = 1:5        if targets(j,i)==1            fprintf(fid,'%s\n',class_name{j});        end    end    fclose(fid);end
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

处理后的文件为:https://pan.baidu.com/s/1pLoeC6R

二、多标签分类

本文利用已训练好的权重,将最后一层替换为自定义的数据集的类别数,前面权值不变,只训练最后的一层。 
1.将包含所有图像的文件夹放入 Multi-label-Inception-net/images 目录下 
2.将labeldir目录拷贝到 Multi-label-Inception-net 目录下,改名为image_labels_dir(替换原同名目录) 
3.运行 python 脚本

python retrain.py \--bottleneck_dir=bottlenecks \--how_many_training_steps 500 \--model_dir=model_dir \--output_graph=retrained_graph.pb \--output_labels=retrained_labels.txt \--summaries_dir=retrain_logs \--image_dir=images
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

开始训练 
这里写图片描述

这里写图片描述

训练完成 
这里写图片描述

三、图像预测

利用脚本label_image.py 进行图像预测 
调用如下:

python label_image.py images/image/4.jpg
  • 1

得到输出结果:

这里写图片描述

版权声明:本文为博主原创文章,未经博主允许不得转载。
阅读全文
0 0