利用SynthText生成自然场景文本检测数据集

来源：互联网发布：linux系统启动流程简述编辑：程序博客网时间：2024/05/21 17:17

一，运行demo

1，下载SynthText 源码，链接地址如下： https://github.com/ankush-me/SynthText.git

解压后，文件目录如下：

2，运行：

python gen.py --viz

这个文件会下载大概56M的文件，包括：

dset.h5:这是一个示例h5文件，其中包含一组5个图像及其深度和分割信息。

data/fonts:三个样本字体（我们可以添加更多的字体到这个文件夹，然后用他们的路径更新`fonts / fontlist.txt'）。

data/newsgroup: 文本源（来自新闻组数据集）。

data/models/colors_new.cp: 从IIIT-5K字数据集学习本的颜色模型（前景/背景文本颜色模型）。

data/models: 其他cPickle文件；

这个脚本输出结果为： results/SynthText.h5

二，生成文本检测数据集

1 ，预处理的背景图像

下载本文中使用的8000个背景图像，以及它们的分割和深度模板，下载链接地址如下：

`http://zeus.robots.ox.ac.uk/textspot/static/db/ <filename>`，其中``文件名``是：

- “imnames.cp”[180K]：已过滤文件的名称，即，这些文件不包含文本；

- `bg_img.tar.gz` [8.9G]：压缩的图像文件（超过8000，所以只能使用imnames.cp中的过滤的文件）

- “depth.h5”[15G]：深度图

- `seg.h5` [6.9G]：分割图

2 ，生成dset.h5文件

将下载的图片文件bg_img.tar.gz，解压到bg_img文件夹，新建一个Python文件,命名为makeDset.py,将makeDset.py与bg_img图片文件夹，depth.h5，seg.h5 放在同一个文件夹下。

makeDset.py代码如下：

# -*- coding: UTF-8 -*-     import numpy as npimport h5pyimport os, sys, tracebackimport os.path as ospimport matplotlib.image as mpimgImageListDir='imagesName.txt'ImagesDir='bg_img/'seg_db = h5py.File('seg.h5','r')depth_db = h5py.File('depth.h5','r')db = h5py.File('dset.h5','w')  input = open(ImageListDir, 'r')  #将图片、seg文件、depth文件写入.h5w文件imagesName = input.readlines()image=db.create_group("image")depth=db.create_group("depth")seg=db.create_group("seg")num=0for name in seg_db['mask']:    name=name.rstrip("\n")    try:        img = mpimg.imread(ImagesDir+name)        d=depth_db[name][:]        s=seg_db['mask'][name][:]    except:        continue    image[name]=img    s_max=np.amax(s)    label=range(1,s_max+1)    area=range(1,s_max+1)    for i in label:        area[i-1]=int(np.sum(s==i))    depth[name]=d    seg[name]=s    seg[name].attrs['area']=area    seg[name].attrs['label']=label    num=num+1    print num    print name + 'is ok!\n'db.close()seg_db.close()depth_db.close()

3，运行makeDset.py

python makeDset.py

在makeDset.py，同级目录下生成dset.h5文件。

4 ，生成SynthText.h5

将生成的dset.h5文件放到SynthText /data文件夹下；运行gen.py文件：

python gen.py --viz

脚本输出结果为： results/SynthText.h5

阅读全文

0 0