PRML Notes-Chapter1 Introduction(1.1,1.3,1.4)
来源:互联网 发布:淘宝直播在哪里开通 编辑:程序博客网 时间:2024/06/17 05:17
PRML Notes-Chapter1 Introduction
题记:
RPML是ML领域的圣典,是从事算法这条路不可或缺的历练,它对内功的增强绝不是一点点,因此决定重新拿起圣典研读,并将自己的点滴思考做以记录,供后续温习和问题查找。由于笔者知识水平有限,文章中部分术语和概念可能不够严谨,望批评指正!
目录
- PRML Notes-Chapter1 Introduction
- 目录
- 1 基本知识
- 2 Reference
1.1 基本知识
ML(machine learning),对于机器学习的研究由来已久,具体的历史这里不详细介绍了。这里给出书中提到一些基本概念。
- 机器学习 ,从给定数据中模拟人类学习和获取信息,并能对新数据作出目标预测的过程称为机器学习,换句话说ML是从数据中获得决策(预测)函数。
ML分类,ML有多种不同的分类依据,从 数据类型 上分为有监督(Supervised Learning)和无监督(Unsupervised Learning);从学习过程上来讲可以分为主动学习(Active Learning)、迁移学习(transfer learning)、强化学习(reinforcement learning),这几个分支最近两年关注度也越来越高。
有监督, 如果数据含有输入x 也给定了输出目标 y 的学习过程,常见算法有分类(Classification,y 取值为有限离散值)、回归(Regression, y 取值为连续性变量),实际生活中的例子中图像分类(Image Classification),文本分类(Document Classification),包括一些打标签等任务均可看成是分类, 房价、产量预测,曲线拟合等均属于回归问题。
- 无监督,只有输入数据 x 没有输出目标的学习过程,包括Clustering,dimension reduction,density estimation
- 涉及内容,机器学习一门综合的学科,它融合概率论、决策论和信息论为为一体,因此本书在第一章对这几个部分的知识进行了简要而详细的介绍。
PRML开篇第一个内容是给出一个多项式拟合的例子(Polynomial Cure Fitting),这对于刚踏入ML领域的人来说是比较质朴的,能够真切的去体会ML的具体过程,同时后续的几节内容也会多次提及这个问题。
首先给定一个还有 N 个样本的训练集,输入x的值为
其中
这里书中提到一个线性模型的定义,模型对参数来说是线性的,则成为是线性模型,考虑的模型和参数直接的关系,而不考虑模型和变量
有了式子1.1,就可以利用训练集去寻找合适的参数
式子1.2中的系数是为了后续计算引入的,这个式子恒大于等于,只有当所有的样本都准确预测误差才0,通过分析式子1.2是存在最优解的。
下面的问题是如何确定超参数呢,也就是选择多少阶的方程合适呢,这个过程可以立即为模型选择(Model Selection),说实话这个事情并不太具体的规则,属于一个经验值。书中给了一个不同阶数的拟合结果图,
从曲线图可以看出,随着
- 模型太复杂
- 数据太少
应对过拟合问题常用的方式是在误差函数中加入正则化项,用来约束参数,使得参数不会那么大,
其中
在实际的ML任务中,输入往往是很多维度,比如在做文本分类或者点击率预估时特征有可能上万维,因此在对待实际ML任务时首先考虑哪些是相关因素,排除不必要的因素,这样使得输入维度不那么高,便于模型的训练和使用。
这篇post主要是参照第一章的第一、三、四节,第二节概率论、五节决策论、六节信息论都是以后学习的最基础的东西,所有要花点力气去理解夯实,因此单独成篇进行记录。
1.2 Reference
[1]: Christopher M. Bishop, Pattern Recognition and Machine Learning
- PRML Notes-Chapter1 Introduction(1.1,1.3,1.4)
- PRML Notes-Chapter1 Introduction(1.2 Probability Theory)
- PRML学习心得:Chapter1—Introduction
- CHAPTER1 INTRODUCTION -- Deep Learning Book Reading notes
- PRML 读书笔记 chapter1 Introduce
- PRML 读书笔记-Chapter1
- 【PRML Read notes】绪论(some concepts)
- Python Cookbook Notes Chapter1
- PRML Chapter 1. Introduction
- PRML笔记之INTRODUCTION
- PRML 1 INTRODUCTION
- PRML读书会第一章 Introduction
- Chapter1 Introduction to Databases
- ProgrammingHive笔记--Chapter1 Introduction
- PRML Notes- Chapter2 Probability Distribution(2.1,2.2)
- 机器学习学习笔记 PRML Chapter 1.1 Introduction
- PRML 阅读笔记(二)<1.3--1.4>
- PRML Notes- Chapter2 Probability Distribution
- 对面板数据模型中的一些理解
- CCF 历年真题之分蛋糕(_1703_1_Cake.java)参考答案
- POJ2987-Firing(最大权闭合图)
- 开始学习java。。
- Jenkins打包时 wget war包403报错
- PRML Notes-Chapter1 Introduction(1.1,1.3,1.4)
- python学习之 字符串前'r'的用法
- CodeForces
- Linux文件---标准IO概述
- Unity3d 场景搭建 基础 学习
- Android蓝牙2.0框架帮您高效交互2.0协议下位机
- == 和 equals 的区别
- c语言中的整形提升
- MyBatis学习(二)-增删改查基于XML