高中课本里的「机器学习」

来源:互联网 发布:网络发行单曲 编辑:程序博客网 时间:2024/04/28 15:57

本文来自作者 止斋少主 在 GitChat 上分享「机器学习入门第一课:从高中课本谈起」,阅读原文」查看交流实录

文末高能

编辑 | 嘉仔

高中课本那些事

点连成线

上小学的时候,我们学过平面内,任意两点之间可以连成一条直线,且只能连成一条直线。

上初中的时候,我们学过y=kx+b已知两点求过这两点A、B直线方程。

这道题很简单,二元一次方程组秒杀。

尽可能多的点在一条直线

上高中的时候,我们牛逼闪闪的高中老师,给我们出了一道牛逼闪闪的题,平面内一堆点,找出一条直线,使得尽可能的多的点在这条直线上。两点之间确定一条直线,这若干点,怎能搞,实在不会,老师教了我们一招绝技。

如何让尽可能多的点连在一条线上

这若干点,怎能搞,实在不会,老师教了我们一招绝技。

如果平面内有点可用如下表达式来刻画这些点与直线 y=kx+b 的接近程度:

使得上式达到最小值的直线 y=kx+b 就是老师让我们求解的直线,老师说这种方法叫最小二乘法。

最后可以求解出

高中老师没说过的那些事

点在面上

上初中的时候,我们学会了三点可以确定一个平面。

尽可能多的点在同一面上

上高中的时候,我们牛逼闪闪的高中老师,给我们出了一道牛逼闪闪的题,平面内一堆点,找出一条直线,使得尽可能的多的点在这条直线上。

两点之间确定一条直线,这若干点,怎能搞,实在不会,老师教了我们一招绝技。

如何让尽可能多的点连在一条线上

如果空间内有点,可用如下表达式来刻画这些点与平面z=ax+by+c(c为常数)的接近程度:使得上式达到最小值的平面z=ax+by+c,就是这道题的答案

数学到算法模型转化的步骤与工具

用数学这把锋利的刀来求解未知问题,做到大胆猜想,往往就可以解决问题,从数学到算法模型转化过程中,猜的作用很大。

独立同分布

  • 独立

    独立,顾名思义就是事件和事件之间相互不产生影响和作用,比如火星是行星和我是算法工程师之间就是独立的事件,没有相互影响或者彼此之间的作用。

    假设事件A1、A2......An的概率分别为P1、P2......Pn,这些独立事件同时发生的概率为:

  • 同分布

    同分布指的是事件之间,事件的分布是等同的,一致的。

    独立同分布意味着事件独立且分布一致。

数据分布

在算法模型转化过程中,数据分布很重要,在某一派别中认为应该是假设数据分布(也就是猜出数据分布),然后进行算法模型转化。

每一种数据分布,都有一种对应的概率。

先假设数据的分布,然后根据数据分布对应的概率来推导出需要求解的公式。

似然函数

似然函数,这个东西名字上来看上去绕来绕去,简而言之,就是求解参数。例如高中求解的k、b,大学解得a、b、c。

工具

极大似然估计

极大似然估计,就是求似然函数的极大值点。

实操 线性回归模型

平面内的点,一般满足正态分布,我们来猜这些点满足正态分布,而且是独立同分布的。

正态分布的数据满足,概率:


假设事件A1、A2......An的概率分别为P1、P2......Pn这些独立事件同时发生的概率为:

这些点在尽可能在同一平面上的概率:

看,这就是高中到大学的最小二乘法。

机器学习中的那些事 —— 以线性回归举例

任何问题都是有目的的

任何问题都是有目的的,线性回归 y=kx+b 就是目的,我们管这样的函数叫目标函数。

逼近正确就是让失败的情况最差

让失败的情况最差,当失败的情况无限接近最差的时候,就是逼近最正确的时候。最小二乘法就是让失败的情况逼近最差,也就是逼近正确。我们管最小二乘法这样函数叫损失函数,损失函数最小我们叫经验结构最小。

[help me with MathJax]

 近期热文

【钓鱼】与【反钓鱼】的技术剖析

快速了解 Java 9 平台模块系统

《机器人的「语料」,如何获取?》

一页纸,梳理你的商业模式 ,奇妙的「精益画布」

《沉迷前端,无法自拔的人,如何规划职业生涯?》

GitChat 与 CSDN 联合推出

《GitChat 达人课:AI 工程师职业指南》

「阅读原文」看交流实录,你想知道的都在这里

原创粉丝点击