RAP数据集整理

来源:互联网 发布:js短路逻辑 编辑:程序博客网 时间:2024/06/05 14:48
  1. RAP数据集详细属性(共92个)

‘性别’
‘年龄16’
‘年龄30’
‘年龄45’
‘体型微胖’
‘体型标准’
‘体型偏瘦’
‘角色顾客’
‘角色制服’
‘发型光头’
‘发型长发’
‘头肩黑色头发’
‘头肩戴帽’
‘头肩眼镜’
‘头肩围巾’
‘上衣衬衣’
‘上衣毛衣’
‘上衣马甲’
‘上衣T恤’
‘上衣棉服’
‘上衣夹克’
‘上衣西服’
‘上衣卫衣’
‘上衣短袖’
‘下衣长裤’
‘下衣裙子’
‘下衣短裙’
‘下衣连衣裙’
‘下衣牛仔裤’
‘下衣包腿裤’
‘鞋子类型皮鞋’
‘鞋子类型运动鞋’
‘鞋子类型靴子’
‘鞋子类型布鞋’
‘鞋子类型休闲鞋’
‘附属物双肩包’
‘附属物单肩包’
‘附属物手提包’
‘附属物箱子’
‘附属物塑料袋’
‘附属物纸袋’
‘附属物车’
‘附属物其他’
‘行为打手机’
‘行为交谈’
‘行为聚集’
‘行为抱东西’
‘行为推东西’
‘行为拉拽东西’
‘行为夹带东西’
‘行为拎东西’
‘正面’
‘背面’
‘面向左侧’
‘面向右侧’
‘左侧遮挡’
‘右侧遮挡’
‘上部遮挡’
‘下部遮挡’
‘遮挡类型环境物’
‘遮挡类型附属物’
‘遮挡类型目标’
‘遮挡类型其他’
‘上衣颜色黑’
‘上衣颜色白’
‘上衣颜色灰’
‘上衣颜色红’
‘上衣颜色绿’
‘上衣颜色蓝’
‘上衣颜色黄’
‘上衣颜色棕’
‘上衣颜色紫’
‘上衣颜色粉’
‘上衣颜色橙’
‘上衣颜色混色’
‘下衣颜色黑’
‘下衣颜色白’
‘下衣颜色灰’
‘下衣颜色红’
‘下衣颜色绿’
‘下衣颜色蓝’
‘下衣颜色黄’
‘下衣颜色混色’
‘鞋子颜色黑’
‘鞋子颜色白’
‘鞋子颜色灰’
‘鞋子颜色红’
‘鞋子颜色绿’
‘鞋子颜色蓝’
‘鞋子颜色黄’
‘鞋子颜色棕’
‘鞋子颜色混色’

2.RAP数据集属性粗分类:

性别:‘性别’

年龄:‘年龄16’‘年龄30’‘年龄45’

体型:‘体型微胖’‘体型标准’‘体型偏瘦’

角色:‘角色顾客’‘角色制服’

发型:‘发型光头’‘发型长发’

头部:‘头肩黑色头发’‘头肩戴帽’‘头肩眼镜’‘头肩围巾’

上半身:‘上衣衬衣’‘上衣毛衣’‘上衣马甲’‘上衣T恤’‘上衣棉服’‘上衣夹克’‘上衣西服’‘上衣卫衣’‘上衣短袖’

下半身:‘下衣长裤’‘下衣裙子’‘下衣短裙’‘下衣连衣裙’‘下衣牛仔裤’‘下衣包腿裤’

鞋子:‘鞋子类型皮鞋’‘鞋子类型运动鞋’‘鞋子类型靴子’‘鞋子类型布鞋’‘鞋子类型休闲鞋’

附属物:‘附属物双肩包’‘附属物单肩包’‘附属物手提包’‘附属物箱子’‘附属物塑料袋’‘附属物纸袋’‘附属物车’‘附属物其他’

行为:‘行为打手机’‘行为交谈’‘行为聚集’‘行为抱东西’‘行为推东西’‘行为拉拽东西’‘行为夹带东西’‘行为拎东西’

方位:‘正面’‘背面’‘面向左侧’‘面向右侧’

遮挡方位:‘左侧遮挡’‘右侧遮挡’‘上部遮挡’‘下部遮挡’

遮挡物类型:‘遮挡类型环境物’‘遮挡类型附属物’‘遮挡类型目标’‘遮挡类型其他’

上衣颜色:‘上衣颜色黑’‘上衣颜色白’‘上衣颜色灰’‘上衣颜色红’‘上衣颜色绿’‘上衣颜色蓝’‘上衣颜色黄’‘上衣颜色棕’‘上衣颜色紫’‘上衣颜色粉’‘上衣颜色橙’‘上衣颜色混色’

下衣颜色:‘下衣颜色黑’‘下衣颜色白’‘下衣颜色灰’‘下衣颜色红’‘下衣颜色绿’‘下衣颜色蓝’‘下衣颜色黄’‘下衣颜色混色’

鞋子颜色:‘鞋子颜色黑’‘鞋子颜色白’‘鞋子颜色灰’‘鞋子颜色红’‘鞋子颜色绿’‘鞋子颜色蓝’‘鞋子颜色黄’‘鞋子颜色棕’‘鞋子颜色混色’

  1. RAP数据集应用于图像分类

  2. 可行的分类

性别:男,女

年龄:小孩(年龄16)、成人(年龄30)、老人(年龄45)

体型:胖(体型微胖)、瘦(体型偏瘦)、正常(体型标准)

角色:顾客,工作人员

  1. 多属性融合分类尝试

假如输出的结果不仅希望可以得到人物的性别还需要知道任务的年龄段,可以考虑将性别跟年龄两种不同属性融合考虑。将此前的2分类跟3分类问题转换成6分类问题。

性别+年龄 转换成 6个分类(男小孩、男成人、男老人、女小孩、女成人、女老人)

这样,就可以在输出端同时获得人物的两个属性。以此类推还可以做更多此方面的尝试。诸如下图,可以对一张图片中的人识别出他的多重属性:
这里写图片描述

  1. 关于不同方位识别的分类(对于遮挡问题的处理)

在之前的周报中有考虑到对不同的方位进行识别。但是原始图片存在少量人物被遮挡的情况,诸如下图,左边的图是没有遮挡的,而右边的图是有遮挡的。

这里写图片描述
显然,遮挡会对实验结果造成很大的影响。这里仔细观察数据集的属性后,发现数据集有左侧遮挡、右侧遮挡、上部遮挡、下部遮挡这几个属性值,可以考虑通过这些属性值将存在遮挡的图片去掉。

去除遮挡图片的可行性:利用python的pandans库对数据集进行分析,提取左侧遮挡的所有图片标签,因为存在遮挡为1,不存在遮挡为0,对其进行求和,其求和的值即存在遮挡的图片数量。其中存在遮挡的只有1705张图片,考虑RAP数据集拥有接近50000张图片,因此将遮挡图片去掉的办法是可行的。(即去掉遮挡图片对数据量影响不大)