自动化工具制作PASCAL VOC 数据集
来源:互联网 发布:c语言注册登录系统 编辑:程序博客网 时间:2024/06/07 08:56
1. VOC的格式
VOC主要有三个重要的文件夹:Annotations、ImageSets和JPEGImages
JPEGImages 文件夹
该文件夹下存放着所有的训练集图片,格式都是.jpg
需要注意的是命名格式,虽然对命名没有特别要求,但是最好按照官方的命名方法,如000001.jpg
,000123.jpg
,然后在这个文件夹里就没有其他东西了。
Annotations 文件夹
该文件夹下存放的是每一个图片的标注信息,文件都是.xml
格式,文件名和图片名是一致的对于该xml
的格式,可以参考一下示例:
以上是使用标注工具标注的人脸,(在下面会提到,自己写的一个比较简陋的标注工具 ^^),该图片的名字是000001.jpg
然后会在Annotations
文件夹下面生成一个000001.xml
文件与之对应:
<annotation> <folder>VOCType</folder> <filename>000001.jpg</filename> <source> <database>VOC</database> </source> <size> <width>485</width> <height>324</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>face</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>287</xmin> <ymin>57</ymin> <xmax>351</xmax> <ymax>150</ymax> </bndbox> </object></annotation>
这是一个基本的格式,其中的object
标签保存的就是人脸的位置信息,对于一个图片里面有多个对象的话,在该xml中就有多个object
。然后Annotations
文件夹里面就是这样的一堆xml文件,其他没什么。
ImageSets 文件夹
在这个文件夹中还有一个Main
文件夹,其他的文件夹不太重要(对于我目前的需求来说),这个文件夹中主要有四个.txt
文件,分别是train.txt
、test.txt
、trainval.txt
、val.txt
test.txt
中保存的是测试所用的所有样本的名字,不过没有后缀(下同),一般测试的样本数量占总数据集的50%
train.txt
中保存的是训练所用的样本名,样本数量通常占trainval
的50%左右
val.txt
中保存的是验证所用的样本名,数量占trainval
的50%左右
trainval.txt
中保存的是训练验证样本,是上面两个的总和,一般数量占总数据集的50%
2.自动化标注工具
根据VOC的格式可以写一个标注工具。例如我使用Python和C++制作的一个工具:github
首先是rename.py
,该脚本用来生成三个基本文件夹并将图片重新命名为VOC格式保存在JPEGImages中
然后打开VS2013工程,运行后可以开始进行图片的标注
标注完成后可以执行txt.py
脚本,用来生成test.txt,train.txt,val.txt,trainval.txt
四个文件并保存在Main文件夹中。
相关内容请见github。
- 自动化工具制作PASCAL VOC 数据集
- PASCAL VOC 数据集
- fast-rcnn训练中制作成PASCAL VOC数据集的用到的labelImg工具
- PASCAL VOC数据集分析
- PASCAL VOC数据集分析
- PASCAL VOC数据集分析
- Pascal VOC 数据集介绍
- PASCAL VOC数据集分析
- PASCAL VOC数据集分析
- PASCAL VOC数据集分析
- PASCAL VOC 数据集格式
- PASCAL VOC数据集分析
- PASCAL VOC数据集介绍
- PASCAL VOC数据集介绍
- PASCAL VOC数据集分析
- VOC数据集制作
- 【计算机视觉】PASCAL VOC数据集分析
- 制作Pascal VOC数据集并在YOLO和Faster RCNN上测试(码字ing)
- CListCtrl控件中InsertItem和SetItemText函数
- C++:tinyxml的使用
- 产品经理日常使用工具
- python:使用itchat实现手机控制电脑
- C++:后缀表达式
- 自动化工具制作PASCAL VOC 数据集
- Python:使用Kivy将python程序打包为apk文件
- JWT简介json web token bear token
- opencv:图像的基本变换
- [置顶]Logger
- 压缩感知(Compressive Sensing)学习之(一)
- 【51nod 教程】编辑距离问题(动态规划)
- hdu 2594 kmp Simpsons’ Hidden Talents
- RocketMQ——Consumer篇:PUSH模式下消费消息(顺序和并发两种)