python解析 MS-Celeb-1M 数据库
来源:互联网 发布:网络商标到期 编辑:程序博客网 时间:2024/05/16 06:38
我在微软下载人脸识别数据库 MS-Celeb-1M, 下载完的格式是 .tsv格式。看了数据库官网的文件格式说明:
File format: text files, each line is an image record containing 7 columns, delimited by TAB.
Column1: Freebase MID
Column2: ImageSearchRank
Column3: ImageURL
Column4: PageURL
Column5: FaceID
Column6: FaceRectangle_Base64Encoded (four floats, relative coordinates of UpperLeft and BottomRight corner)
Column7: FaceData_Base64Encoded
我决定用Python件来解析这个.tsv文件,获取图片及相应的人脸信息。以下是解析代码:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
tsv文件和csv文件是类似的,tsv的数据用Tab键分隔,csv文件用逗号分隔。根据说明文件,把每一行的信息读取出来
- 1
- 1
人脸矩形框的位置信息是(左上点坐标,右下点坐标),用Base64编码的,格式为4个浮点数。
- 1
- 1
人脸信息是用Base64编码的,需要解码,然后保存为图像:
0 0
- python解析 MS-Celeb-1M 数据库
- python解析 MS-Celeb-1M 数据库
- 微软人脸数据库ms-celeb-1m清洗Python Coding #1
- 微软人脸数据库ms-celeb-1m清洗方案
- MacroSoft数据集MS-Celeb-1M
- MacroSoft数据集MS-Celeb-1M
- Python3解析MS-Celeb-1M人脸数据集中的FaceImageCroppedWithAlignment.tsv文件
- 人脸识别数据集之MS-Celeb-1M
- python 连接MS sql server2005数据库
- python程序:备份MS SQL数据库到压缩文件
- python+lxml解析大XML文件(100M+)
- python -m
- 时间单位m和ms弄错导致系统概率异常, 耗费1天多才解决问题!
- 【leetcode】394. Decode String【M】【45ms】
- MS数据库工具
- MS SQL 数据库设计
- MS---数据库概念回顾
- MS数据库可疑修复
- springIoC实例
- apache2 设置页面禁止iframe/禁止访问目录
- Windows+Linux双系统引导
- 解决Erroer:unified memory profiling failed.问题
- Week1-3Language Diversity and Ethnologue
- python解析 MS-Celeb-1M 数据库
- SpringBoot第二讲 利用Spring Data JPA实现数据库的访问(一)
- SVDD(Support Vector Domain Description) 支持向量数据域描述(1)
- Python学习杂记
- CardView开发中需要注意的地方
- zabbix触发器参数
- Android 不同类型item的listview
- java中关于Collection与Map
- 身份证号码有效性检测