论文阅读实践
来源:互联网 发布:nba2konline作弊软件 编辑:程序博客网 时间:2024/05/29 10:12
基于CNN的年龄和性别分类
学习论文 Age and Gender Classification using Convolutional Neural Networks.
主要是针对年龄和性别分别建立分类问题,基于CaffeNet,年龄转化为 8 类别、性别为 2 分类问题,训练两个网络模型,实现原理较为直接简单.
项目路径
源码路径
年龄分类网络结构 - 对应caffemodel
性别分类网络结构 - 对应caffemodel
1. 年龄和性别分类的CNN网络
CNN的第一个应用是用于字符识别的 LeNet5 网络. 随着GPU发展,训练数据的快速增长,用于图像分类的深度CNN网络显著提高了准确率. 随后,CNN成功应用于更多领域,如人体姿态估计、人脸关键点检测、语音识别及动作分类等. 这里将CNN网络用于年龄和性别分类任务.
收集大型的、标签化的年龄和性别图像训练集有两种方式:
- 用户的个人注册信息,如出生日期和性别,往往是私人信息.
- 手工标注,繁琐且耗时.
现阶段,尚无该类型数据集. 针对小型图像数据集,机器学习方法易出现过拟合问题. 深度CNN网络方法由于其具有大量的模型参数,过拟合问题更加突出. 因此,过拟合问题需要慎重考虑.
网络结构说明
Figure2. CNN网络结构例示. 网络包括 3 个卷积层,每一个卷积层后接一个 ReLU 和 Pooling 层. 此外,前两层采用LRN(local response normalization)归一化. 第一个卷积层是 96 个 7×7 fliters, 第二个卷积层是 256 个5×5 fliters,第三个和最后一个卷积层均是 384 个 3×3 fliters. 网络最后是两个全连接层,均是 512 个输出单元. 如Figure3. 主要是基于CaffeNet.
分类问题:
年龄分类: 8 类
age = "0 - 2"
age = "4 - 6"
age = "8 - 13"
age = "15 - 20"
age = "25 - 32"
age = "38 - 43"
age = "48 - 53"
age = "60 -"
性别分类: 2 类
网络输入图片是从 256×256 中裁剪 227×227 大小,输出的全连接层后接 softmax layer,以估计各类的概率. 针对测试图片,概率最大的类即为预测结果.
2. 联合训练年龄和性别分类网络
根据对论文方法及其实现的学习,个人考虑,可以将年龄和性别分类问题转化为二标签多任务分类问题,即每张人脸图像均有两个标签——年龄和性别,训练数据格式为:
# train.txtfaceimg1.jpg 1 0faceimg2.jpg 0 1faceimg3.jpg 2 0...
具体操作可参考Caffe实践 - 基于VGG16 多标签分类的训练与部署.
- 论文阅读实践
- 阅读论文
- 阅读论文
- 论文阅读
- 论文阅读
- 论文阅读
- 科学论文2--Thoughts on high-performance computing的阅读与实践
- 论文阅读,写作,文献阅读
- 论文阅读笔记
- 论文的阅读
- 论文阅读报告
- 论文阅读笔记- Dremel
- 论文阅读笔记 - Pregel
- 论文阅读笔记1
- 论文阅读笔记2
- 论文阅读笔记3
- 论文阅读笔记4
- 如何阅读科研论文
- 游戏常用到的sdk及接口方法文档
- 处理sql server的死锁 [kill spid]
- Cheapest Palindrome POJ
- Generating Permutations UVA
- REM手机屏幕适配
- 论文阅读实践
- memcpy与memset
- Javaweb核心之session&cookie
- Irrlicht 源码学习笔记 【irrstring.h】
- vim的ex模式用法
- 《数学之美》—— 读后总结
- 一切从现在开始
- SVN更新后显示 A\R\U\C\G代表的含义
- Excel 3个简单技巧轻松避免格式不规范数据出错