利用SynthText生成自然场景文本检测数据集

来源:互联网 发布:linux系统启动流程简述 编辑:程序博客网 时间:2024/05/21 17:17

一,运行demo

1, 下载SynthText 源码,链接地址如下: https://github.com/ankush-me/SynthText.git


    解压后,文件目录如下:


2,运行:

python gen.py --viz

这个文件会下载大概56M的文件,包括:

dset.h5:这是一个示例h5文件,其中包含一组5个图像及其深度和分割信息。

data/fonts:三个样本字体(我们可以添加更多的字体到这个文件夹,然后用他们的路径更新`fonts / fontlist.txt')。

data/newsgroup文本源(来自新闻组数据集)。

data/models/colors_new.cp:  从IIIT-5K字数据集学习本的颜色模型(前景/背景文本颜色模型)。

data/models:  其他cPickle文件;


这个脚本输出结果为: results/SynthText.h5


二,生成文本检测数据集


1 , 预处理的背景图像

下载本文中使用的8000个背景图像,以及它们的分割和深度模板,下载链接地址如下:

`http://zeus.robots.ox.ac.uk/textspot/static/db/ <filename>`,其中``文件名``是:

- “imnames.cp”[180K]:已过滤文件的名称,即,这些文件不包含文本;

- `bg_img.tar.gz` [8.9G]:压缩的图像文件(超过8000,所以只能使用imnames.cp中的过滤的文件)

- “depth.h5”[15G]:深度图

- `seg.h5` [6.9G]:分割图

2 ,生成dset.h5文件

将下载的图片文件bg_img.tar.gz,解压到bg_img文件夹, 新建一个Python文件,命名为makeDset.py,将makeDset.py与bg_img图片文件夹,depth.h5,seg.h5 放在同一个文件夹下。

makeDset.py代码如下:

# -*- coding: UTF-8 -*-     import numpy as npimport h5pyimport os, sys, tracebackimport os.path as ospimport matplotlib.image as mpimgImageListDir='imagesName.txt'ImagesDir='bg_img/'seg_db = h5py.File('seg.h5','r')depth_db = h5py.File('depth.h5','r')db = h5py.File('dset.h5','w')  input = open(ImageListDir, 'r')  #将图片、seg文件、depth文件写入.h5w文件imagesName = input.readlines()image=db.create_group("image")depth=db.create_group("depth")seg=db.create_group("seg")num=0for name in seg_db['mask']:    name=name.rstrip("\n")    try:        img = mpimg.imread(ImagesDir+name)        d=depth_db[name][:]        s=seg_db['mask'][name][:]    except:        continue    image[name]=img    s_max=np.amax(s)    label=range(1,s_max+1)    area=range(1,s_max+1)    for i in label:        area[i-1]=int(np.sum(s==i))    depth[name]=d    seg[name]=s    seg[name].attrs['area']=area    seg[name].attrs['label']=label    num=num+1    print num    print name + 'is ok!\n'db.close()seg_db.close()depth_db.close()

3,运行makeDset.py

python makeDset.py

makeDset.py,同级目录下生成dset.h5文件。

4 ,生成SynthText.h5 

将生成的dset.h5文件放到SynthText /data文件夹下;运行gen.py文件:

python gen.py --viz

脚本输出结果为: results/SynthText.h5 

阅读全文
0 0
原创粉丝点击