FSNS数据格式

来源:互联网 发布:c 语言编程软件 编辑:程序博客网 时间:2024/05/23 14:15

French Street Name Signs dataset(FSNS):法国街道路标数据集
组成:从谷歌法国街景图片上获取的一百多万张街道名字标志。每一张图片包含同一个街道名字标志牌的不同视角。每一张图片带着4个tiles,每一个tiles是150×150个像素,水平排列,所以每一张图片的大小是600×150。
当小于四个时,就使用预先获取的街道名字标志或者随机噪声补齐。
数据集分为train,validate,test三个子集,每个子集以multiple TFRecords文件的方式存储。

表4 展示了在tensorflow应用中,fsns数据图片存储在TFRecords文件中的格式
这里写图片描述

image/format表示图片的格式,是‘png’
image/encoded 表示图片的具体内容,占用一个string,以‘png’的格式编码
iamge/class表示图片真实的类别id,是37个int64数据,每一个int64对应一个字符编码,具体的映射方式在charset_szie=134.txt文件中。
image/unpadded_class 表示图片在没有被填充之前真实的id。
image/width:表示图片的像素的宽度
image/orig_width:表示图片在没有填充之前像素的宽度
image/height:表示图片的像素的高度,在tensorflow代码中,这一部分并没有写入代码,因为图片高度固定为150
image/test:占用一个string,是使用UTF-8编码的真实的字符形式的标记

处理FSNS数据库的代码:FSNS数据库读取与处理代码

原创粉丝点击