深度学习深理解(八)- 结构化机器学习项目
来源:互联网 发布:软件迭代记录 编辑:程序博客网 时间:2024/06/11 12:36
总结一下今天的学习过程
昨天由于装双系统,耽误了一天,打断这周暂时学习结束吴恩达老师的前三部分的课程(因为后期两部分没有开课)
幸运的是,今天学习比较努力 哈哈哈,将计划两天的课程今天一天学习完了
机器学习的策略:
- 收集更多的数据
- 增加训练集的多样性
- 增加使用梯度下降法的训练时间
- 尝试其他优化算法:比如Adam算法等
- 扩大或者缩小神经网络的规模
- 尝试dropout或者L2正则化
- 修改神经网络的架构:如激活函数、隐藏单元的数目、层数等
正交化
- 在训练集上表现不错,损失函数最小:4,5
- 在开发集有很好的表现:1,6
- 在测试集上有很好的表现:由于过拟合了,需要更大的开发集
- 在开发集或者测试集上有很好的表现:改变开发集或者改变成本函数
设置一个单实数评估指标
- 查准率
- 查全率
- FI score:调和平均数
训练集、开发集、测试集的设置
- 开发集和测试集来自于统一分布
- 使用开发集+单实数评估指标来固定目标
- 训练集则会影响逼近的速度
- 规模:
- 早起:100~10000:7/3或者6/2/2
- 现在:100万:98/1/1
- 测试集的目的:评估投产系统的性能,足够大,能以高置信度评估系统整体性能
可避免的偏差、方差、误差
偏差:训练集与人类误差偏大
办法:
- 训练更大的网络
- 更长时间得网络
- 更好的优化算法
- 改成RNN、CNN
- 更好的神经网络架构
方差:训练集中抽取的开发集表现不好
办法:
- 正则化:L2正则化、Dropout正则化
- 数据增强
- 不同的神经网络架构
误差:开发集表现不好
办法:
- 收集更多的错误例子
- 手动检测,查看各个分类造成错误的比例
- 尝试了解训练集和开发测试集的具体差异
- 将训练集变得更像开发集、测试集
拟合程度:测试集表现不好
快速搭建一个深度学习系统
- 设立开发集合测试集还有评估指标
- 搭好一个机器学习系统模型,进行训练、迭代,查看算法表现、评估指标表现
- 进行偏差分析、方差分析、误差分析、确定下一步优化前进方向
- 将你要关注的数据分布作为开发集和测试集
迁移学习
神经网络可以从一个任务中习得知识、或者部分知识、并将这些知识应用到另一个独立的任务中
做法:将最后一层的输出以及相关权重w、b删除。重新生成一层或者几层输入输出,如果数据量大,就将前面的权重一起重新生成
作用:用更少的数据,将一些能力能做其他应用中做的更好、更快,比如:低层次的特征:边缘检测、曲线检测、阳性对象检测、结构信息、图形形状信息、图形识别、学到的点、线、面等
意义:
- 在A、B有同样的类型数据时,比如音频、图像等,想从任务A中学习并迁移一下知识到到任务B中
- A比B数据多
- A中的低层次特征可以帮助B的学习
多任务学习:并行的
同时开始学习,试图让单个神经网络同时做几件事情,然后希望是每个任务都能帮助其他所有任务
例如在无人驾驶领域
与softmax不同:softmax是将单个标签分配给单个样本
意义:
- 训练一组任务,可以共用低层次特征
- 每个任务的数据量很接近
- 你可以训练一个足够大的神经网络,同时做好所有工作
端到端的学习
优点:
真的只是让数据说话
所需手工设计的组件更少
缺点:
需要大量的数据
排除了可能有用的手工设计的组件
访谈:
CS231n课程等一些我现在只能听听看看而不知道涵义的名词
美好的一天,明天加油!
阅读全文
0 0
- 深度学习深理解(八)- 结构化机器学习项目
- 深度学习(6):结构化机器学习项目
- 吴恩达深度学习第三章-结构化机器学习
- 3,结构化机器学习项目
- 结构化机器学习项目Quiz1
- 结构化机器学习项目Quiz2
- 结构化机器学习项目小结
- Coursera 深度学习 deep learning.ai 吴恩达 第三课 结构化机器学习项目 第二周 测试题目 Autonomous driving
- 机器学习实验(八):用特征值衰减正则化方法进行深度学习实验_3
- 机器学习&深度学习
- 机器学习&深度学习
- 机器学习&&深度学习
- 理解:深度学习 vs 机器学习 vs 模式识别
- 简单理解:人工智能、数据挖掘、模式识别、机器学习、深度学习
- 机器学习、深度学习概念术语的理解
- 如何理解人工智能、机器学习和深度学习
- <<C语言深度剖析>>学习之八之文件结构
- Coursera 深度学习 deep learning.ai 吴恩达 第三课 结构化机器学习项目 第一周 测试题目 Bird recognition in the city of Peacetopia
- Linux下mysql 5.6.17安装图文教程详细版
- 用XML写View的用法(一)——shape的用法
- Java反射机制深入详解
- [题解]NOIP2014提高组の题解集合
- Git Cheat Sheet
- 深度学习深理解(八)- 结构化机器学习项目
- Tomcat管理平台
- QT4.8.6和VS2010环境搭建
- StringUtils常用方法
- 那些年把我们坑惨的指针
- 接口回调
- 栈和队列的相互实现
- 红色小圆点消息提示实现
- java通信技术---socket