文件格式之tsv

来源:互联网 发布:docker java jar 编辑:程序博客网 时间:2024/06/05 15:52

引言

最近做人脸识别,需要用到微软的 MS-Celeb-1M数据集,其格式是tsv格式的,如下:
这里写图片描述
求助百度百科tsv失败,求助wikipediatsv成功。
tsv 是Tab-separated values的缩写,是一种存储表格数据的简单文本格式。

示例

来自wikipedia的示例为:
这里写图片描述

python操作

可以当作利用\t分割的txt文本,
一个查看tsv文件中第一列不重复的数量的例子为

tsvName = r'E:\MsCelebV1-Faces\Top1M_MidList.Name.tsv'f = open(tsvName, 'r')nameList = []for line in f:    nameList.append(line.split('\t')[0])print(len(list(set(nameList))))
原创粉丝点击