深入理解机器学习:从原理到算法 学习笔记-第1周 01引论
来源:互联网 发布:安全狗解除屏蔽88端口 编辑:程序博客网 时间:2024/06/03 07:27
深入理解机器学习:从原理到算法 学习笔记-第1周 01引论
- 深入理解机器学习从原理到算法 学习笔记-第1周 01引论
- 1 什么是学习
- 2 什么时候需要机器学习
- 3 学习的四种分类
- 4 与其他领域的关系
我的主页 www.csxiaoyao.com
机器学习就是自动学习,是计算机程序将经验和训练数据转化为知识的过程
1.1 什么是学习
以老鼠怯饵效应为例,老鼠根据过往的经验预测所食的食物未来对自己的影响,这就是一种学习机制。再如垃圾邮件过滤机制也是如此,虽然垃圾邮件的判别可以通过已存在的邮件库进行搜索匹配,但是这种“通过记忆进行学习”的过程缺乏标记未见邮件的能力。一个成功的学习器应该能够从个别例子进行泛化,也就是所谓的“归纳推理”。
但是,归纳推理也可能会推导出错误的结论。例如“鸽子迷信”实验,实验者人为加强了食物送达和鸽子进食行为的联系,这就是所谓的形成迷信的学习机制。这两个例子的区别就在于先验知识的引入使学习机制产生偏差,也成为“归纳偏置”。
机器学习理论的核心目标就是发现定义明确、清晰的规则,防止程序得出无意义或无用的结论。
1.2 什么时候需要机器学习
当编程任务过于复杂时,人类对自身如何完成任务的内省机制还不够精细,机器学习能够帮助人“从经验中学习”,从而达到较为满意的结果;当出现超出人类能力的任务,例如庞大天文、医疗数据,人类很难直接从中发现隐含的、有价值的信息,机器学习为这些领域开辟了新的视野;编程自身有其刻板性,程式一成不变不利于适应环境,机器学习能够将程序自适应环境,与环境互动。
1.3 学习的四种分类
监督与无监督:以垃圾邮件检测为例,学习是一种利用经验获得技能的过程,监督学习的训练数据和测试数据不同,训练数据包含了显著信息(是/否为垃圾邮件),从而来预测测试数据中缺失的这部分显著信息;无监督学习的训练数据和测试数据并没有区别,其目标在于提取概括信息,例如“聚类”(相似数据归为一类)。还有一种情况,训练数据比测试数据明显包含更多信息,要求预测更多内容,例如判断棋牌类比赛过程中黑白棋谁更有利,也称作“强化学习”。
主动学习器与被动学习器:根据角色划分,主动学习器就是在通过提问或实验方式与环境交互;被动学习器,以垃圾邮件过滤为例,则是等待用户标记是否为垃圾邮件。
老师的帮助:正反面考虑问题
在线与批量:在线响应或是在对大量训练数据处理后得出结论。
这本书的重点是对被动的、有监督的、统计批量学习,同时对在线学习和无监督批量学习(聚类)做了简单的介绍。
1.4 与其他领域的关系
机器学习的任务是处理一些背景下的随机生成样本,得出与背景相符的结论,通过自动化技术发现被人类忽略的、有意义的模式或假设。
与统计学不同的是,算法作为机器学习的核心,更关注算法的实用性和计算效率,统计学更加关心算法的渐近性。机器学习常考虑“非参数”背景,对数据分布的性质假设尽可能少,学习算法自己找出最接近数据生成过程的模型。
- 深入理解机器学习:从原理到算法 学习笔记-第1周 01引论
- 深入理解机器学习:从原理到算法 学习笔记-第1周 02简易入门
- 《算法引论》学习笔记(1)
- 深入理解机器学习:从理论到算法-习题全解之第十六章:核方法
- 深入理解机器学习:从理论到算法-习题全解之第十八章:决策树
- 深入理解机器学习:从理论到算法-习题全解之第十九章:最近邻
- 深入理解机器学习:从理论到算法-习题全解之第二十章:神经元网络
- 机器学习算法笔记系列之深入理解主成分分析PCA-原理篇
- 机器学习算法笔记系列之深入理解主成分分析PCA-原理篇
- 深入理解机器学习:从理论到算法-习题全解之第十二章:凸学习问题
- 深入理解机器学习:从理论到算法-习题全解之第十三章:正则化和稳定性
- 深入理解机器学习:从理论到算法-习题全解之第十五章:支持向量机
- 深入理解机器学习:从理论到算法-习题全解之第十七章:多分类、排序与复杂预测
- 操作系统引论 学习笔记
- 操作系统引论 学习笔记
- 操作系统引论 学习笔记
- 搜索引擎学习笔记-引论
- 机器学习算法笔记系列之深入理解主成分分析PCA-Python实现篇
- redis的配置(安装、启动、本机与虚拟机的redis的连接)
- UBUNTU 16.04 LTS 使用体验(纪念LINUX-25周年)
- 安装记录:NAT123实现端口映射,SSH登陆内网主机
- Java中ResultSet转为List
- GIT学习笔记
- 深入理解机器学习:从原理到算法 学习笔记-第1周 01引论
- 深入理解机器学习:从原理到算法 学习笔记-第1周 02简易入门
- 格子刷油漆
- Markdown简要语法规则
- PHPMyadmin 配置文件详解
- Java多线程——生产者和消费者模式
- 【Tomcat】linux启动关闭tomcat服务
- 简单的监听键盘出现和消失的方法以及得到键盘高度
- KMP算法