高中课本里的「机器学习」
来源:互联网 发布:网络发行单曲 编辑:程序博客网 时间:2024/04/28 15:57
本文来自作者 止斋少主 在 GitChat 上分享「机器学习入门第一课:从高中课本谈起」,「阅读原文」查看交流实录
「文末高能」
编辑 | 嘉仔
高中课本那些事
点连成线
上小学的时候,我们学过平面内,任意两点之间可以连成一条直线,且只能连成一条直线。
上初中的时候,我们学过y=kx+b已知两点求过这两点A、B直线方程。
这道题很简单,二元一次方程组秒杀。
尽可能多的点在一条直线上
上高中的时候,我们牛逼闪闪的高中老师,给我们出了一道牛逼闪闪的题,平面内一堆点,找出一条直线,使得尽可能的多的点在这条直线上。两点之间确定一条直线,这若干点,怎能搞,实在不会,老师教了我们一招绝技。
如何让尽可能多的点连在一条线上
这若干点,怎能搞,实在不会,老师教了我们一招绝技。
如果平面内有点可用如下表达式来刻画这些点与直线 y=kx+b 的接近程度:
使得上式达到最小值的直线 y=kx+b 就是老师让我们求解的直线,老师说这种方法叫最小二乘法。
最后可以求解出
高中老师没说过的那些事
点在面上
上初中的时候,我们学会了三点可以确定一个平面。
尽可能多的点在同一面上
上高中的时候,我们牛逼闪闪的高中老师,给我们出了一道牛逼闪闪的题,平面内一堆点,找出一条直线,使得尽可能的多的点在这条直线上。
两点之间确定一条直线,这若干点,怎能搞,实在不会,老师教了我们一招绝技。
如何让尽可能多的点连在一条线上
如果空间内有点,可用如下表达式来刻画这些点与平面z=ax+by+c(c为常数)的接近程度:使得上式达到最小值的平面z=ax+by+c,就是这道题的答案
数学到算法模型转化的步骤与工具
猜
用数学这把锋利的刀来求解未知问题,做到大胆猜想,往往就可以解决问题,从数学到算法模型转化过程中,猜的作用很大。
独立同分布
独立
独立,顾名思义就是事件和事件之间相互不产生影响和作用,比如火星是行星和我是算法工程师之间就是独立的事件,没有相互影响或者彼此之间的作用。
假设事件A1、A2......An的概率分别为P1、P2......Pn,这些独立事件同时发生的概率为:
同分布
同分布指的是事件之间,事件的分布是等同的,一致的。
独立同分布意味着事件独立且分布一致。
数据分布
在算法模型转化过程中,数据分布很重要,在某一派别中认为应该是假设数据分布(也就是猜出数据分布),然后进行算法模型转化。
每一种数据分布,都有一种对应的概率。
推
先假设数据的分布,然后根据数据分布对应的概率来推导出需要求解的公式。
似然函数
似然函数,这个东西名字上来看上去绕来绕去,简而言之,就是求解参数。例如高中求解的k、b,大学解得a、b、c。
工具
极大似然估计
极大似然估计,就是求似然函数的极大值点。
实操 线性回归模型
猜
平面内的点,一般满足正态分布,我们来猜这些点满足正态分布,而且是独立同分布的。
正态分布的数据满足,概率:
推
假设事件A1、A2......An的概率分别为P1、P2......Pn这些独立事件同时发生的概率为:
这些点在尽可能在同一平面上的概率:
看,这就是高中到大学的最小二乘法。
机器学习中的那些事 —— 以线性回归举例
任何问题都是有目的的
任何问题都是有目的的,线性回归 y=kx+b 就是目的,我们管这样的函数叫目标函数。
逼近正确就是让失败的情况最差
让失败的情况最差,当失败的情况无限接近最差的时候,就是逼近最正确的时候。最小二乘法就是让失败的情况逼近最差,也就是逼近正确。我们管最小二乘法这样函数叫损失函数,损失函数最小我们叫经验结构最小。
[help me with MathJax]
近期热文
《【钓鱼】与【反钓鱼】的技术剖析》
《快速了解 Java 9 平台模块系统》
《机器人的「语料」,如何获取?》
《一页纸,梳理你的商业模式 ,奇妙的「精益画布」》
《沉迷前端,无法自拔的人,如何规划职业生涯?》
GitChat 与 CSDN 联合推出
《GitChat 达人课:AI 工程师职业指南》
「阅读原文」看交流实录,你想知道的都在这里
- 高中课本里的「机器学习」
- 初中英语课本里的惊天秘密
- 美国课本里的“三个中国人”
- 朝鲜小学课本里的金日成
- 高中假期的英语学习
- 课本学习
- 高中学习方面的一点经验
- 在机器学习/深度学习里python的注意语法
- 【深度学习】亚马逊机器学习总监Alex Smola:深度学习触手可及,架构Gluon高中生就能用
- MLBase:Spark生态圈里的分布式机器学习系统
- MLBase:Spark生态圈里的分布式机器学习系统
- 机器学习里的kernel是指什么?
- MLBase:Spark生态圈里的分布式机器学习系统
- 【笔记】机器学习里的各种LOSS(L1,L2)
- 曾经的小学课本
- 小时候的语文课本
- 课本的T_SQL语言
- 我的高中生活
- 【设计模式】拦截过滤器模式(Intercepting Filter Pattern)
- IE11浏览器js加载数据不显示问题的解决
- 进程管理API之pid_nr/pid_vnr/pid_nr_ns
- React-Native之微信好友、朋友圈分享、支付
- AI经典书单 | 入门人工智能该读哪些书?
- 高中课本里的「机器学习」
- 【设计模式】责任链模式(Chain of Responsibility Pattern)
- 【免费】深入浅出解读 Spring 源码:IOC/AOP 篇 | Chat · 预告
- npm 不断积累
- Matlab DCT详解
- day 34 iptables nat表应用
- 【设计模式】建造者模式(Builder Pattern)
- 面向对象程序设计上机练习十一(运算符重载)
- docker容器入门必须掌握的命令(Ubuntu)