利用SynthText生成自然场景文本检测数据集
来源:互联网 发布:linux系统启动流程简述 编辑:程序博客网 时间:2024/05/21 17:17
一,运行demo
1, 下载SynthText 源码,链接地址如下: https://github.com/ankush-me/SynthText.git
解压后,文件目录如下:
2,运行:
python gen.py --viz
这个文件会下载大概56M的文件,包括:
dset.h5:这是一个示例h5文件,其中包含一组5个图像及其深度和分割信息。
data/fonts:三个样本字体(我们可以添加更多的字体到这个文件夹,然后用他们的路径更新`fonts / fontlist.txt')。
data/newsgroup: 文本源(来自新闻组数据集)。
data/models/colors_new.cp: 从IIIT-5K字数据集学习本的颜色模型(前景/背景文本颜色模型)。
data/models: 其他cPickle文件;
这个脚本输出结果为: results/SynthText.h5
二,生成文本检测数据集
1 , 预处理的背景图像
下载本文中使用的8000个背景图像,以及它们的分割和深度模板,下载链接地址如下:
`http://zeus.robots.ox.ac.uk/textspot/static/db/ <filename>`,其中``文件名``是:- “imnames.cp”[180K]:已过滤文件的名称,即,这些文件不包含文本;
- `bg_img.tar.gz` [8.9G]:压缩的图像文件(超过8000,所以只能使用imnames.cp中的过滤的文件)
- “depth.h5”[15G]:深度图
- `seg.h5` [6.9G]:分割图
2 ,生成dset.h5文件
将下载的图片文件bg_img.tar.gz,解压到bg_img文件夹, 新建一个Python文件,命名为makeDset.py,将makeDset.py与bg_img图片文件夹,depth.h5,seg.h5 放在同一个文件夹下。
makeDset.py代码如下:
# -*- coding: UTF-8 -*- import numpy as npimport h5pyimport os, sys, tracebackimport os.path as ospimport matplotlib.image as mpimgImageListDir='imagesName.txt'ImagesDir='bg_img/'seg_db = h5py.File('seg.h5','r')depth_db = h5py.File('depth.h5','r')db = h5py.File('dset.h5','w') input = open(ImageListDir, 'r') #将图片、seg文件、depth文件写入.h5w文件imagesName = input.readlines()image=db.create_group("image")depth=db.create_group("depth")seg=db.create_group("seg")num=0for name in seg_db['mask']: name=name.rstrip("\n") try: img = mpimg.imread(ImagesDir+name) d=depth_db[name][:] s=seg_db['mask'][name][:] except: continue image[name]=img s_max=np.amax(s) label=range(1,s_max+1) area=range(1,s_max+1) for i in label: area[i-1]=int(np.sum(s==i)) depth[name]=d seg[name]=s seg[name].attrs['area']=area seg[name].attrs['label']=label num=num+1 print num print name + 'is ok!\n'db.close()seg_db.close()depth_db.close()
3,运行makeDset.py
python makeDset.py
在makeDset.py,同级目录下生成dset.h5文件。
4 ,生成SynthText.h5
将生成的dset.h5文件放到SynthText /data文件夹下;运行gen.py文件:
python gen.py --viz
脚本输出结果为: results/SynthText.h5
- 利用SynthText生成自然场景文本检测数据集
- 自然场景文字检测
- matlab生成xml (将SynthText数据转成XML)
- 自然场景文本识别:基于笔画宽度变换的文本检测
- 自然场景文本识别:基于笔画宽度变换的文本检测
- 应用笔画宽度变换(SWT)来检测自然场景中的文本
- 应用笔画宽度变换(SWT)来检测自然场景中的文本
- 应用笔划宽度变化(SWT)来检测自然场景中的文本
- 应用笔画宽度变换(SWT)来检测自然场景中的文本
- EAST 自然场景文本检测实践(EAST: An Efficient and Accurate Scene Text Detector)
- 自然场景文字检测和识别
- 自然场景文字检测和识别 综述
- 场景文本识别-常用数据集
- 【推荐】大规模的自然场景文字检测与识别数据库
- 【推荐】大规模的自然场景文字检测与识别数据库
- SSD: Signle Shot Detector 用于自然场景文字检测
- SSD: Signle Shot Detector 用于自然场景文字检测
- SSD: Signle Shot Detector 用于自然场景文字检测
- netty(十)源码分析之ByteBuf
- popen 使用方法
- leetcode 507. Perfect Number
- node.js学习笔记(一)
- Android手机 内存堆大小
- 利用SynthText生成自然场景文本检测数据集
- 【资源】深度学习 Top100:近 5 年被引用次数最高论文(下载)
- Mysql Mac 免安装教程
- java移位运算符详解
- Java使用JDBC连接数据库(一)
- springboot 文件上传
- IP地址分类
- linux 磁盘管理四部曲——(1)磁盘结构,认识分区
- IO多路复用