高中课本里的「机器学习」

来源：互联网发布：网络发行单曲编辑：程序博客网时间：2024/04/28 15:57

引导关注

本文来自作者止斋少主在 GitChat 上分享「机器学习入门第一课：从高中课本谈起」，「阅读原文」查看交流实录

「文末高能」

编辑 | 嘉仔

高中课本那些事

点连成线

上小学的时候，我们学过平面内，任意两点之间可以连成一条直线，且只能连成一条直线。

上初中的时候，我们学过y=kx+b已知两点求过这两点A、B直线方程。

这道题很简单，二元一次方程组秒杀。

尽可能多的点在一条直线上

上高中的时候，我们牛逼闪闪的高中老师，给我们出了一道牛逼闪闪的题，平面内一堆点，找出一条直线，使得尽可能的多的点在这条直线上。两点之间确定一条直线，这若干点，怎能搞，实在不会，老师教了我们一招绝技。

如何让尽可能多的点连在一条线上

这若干点，怎能搞，实在不会，老师教了我们一招绝技。

如果平面内有点可用如下表达式来刻画这些点与直线 y=kx+b 的接近程度：

使得上式达到最小值的直线 y=kx+b 就是老师让我们求解的直线，老师说这种方法叫最小二乘法。

最后可以求解出

高中老师没说过的那些事

点在面上

上初中的时候，我们学会了三点可以确定一个平面。

尽可能多的点在同一面上

上高中的时候，我们牛逼闪闪的高中老师，给我们出了一道牛逼闪闪的题，平面内一堆点，找出一条直线，使得尽可能的多的点在这条直线上。

两点之间确定一条直线，这若干点，怎能搞，实在不会，老师教了我们一招绝技。

如何让尽可能多的点连在一条线上

如果空间内有点，可用如下表达式来刻画这些点与平面z=ax+by+c(c为常数)的接近程度:使得上式达到最小值的平面z=ax+by+c,就是这道题的答案

数学到算法模型转化的步骤与工具

猜

用数学这把锋利的刀来求解未知问题，做到大胆猜想，往往就可以解决问题，从数学到算法模型转化过程中，猜的作用很大。

独立同分布

独立
独立，顾名思义就是事件和事件之间相互不产生影响和作用，比如火星是行星和我是算法工程师之间就是独立的事件，没有相互影响或者彼此之间的作用。
假设事件A1、A2......An的概率分别为P1、P2......Pn,这些独立事件同时发生的概率为：

同分布
同分布指的是事件之间，事件的分布是等同的，一致的。
独立同分布意味着事件独立且分布一致。

数据分布

在算法模型转化过程中，数据分布很重要，在某一派别中认为应该是假设数据分布(也就是猜出数据分布)，然后进行算法模型转化。

每一种数据分布，都有一种对应的概率。

推

先假设数据的分布，然后根据数据分布对应的概率来推导出需要求解的公式。

似然函数

似然函数，这个东西名字上来看上去绕来绕去，简而言之，就是求解参数。例如高中求解的k、b，大学解得a、b、c。

工具

极大似然估计

极大似然估计，就是求似然函数的极大值点。

实操线性回归模型

猜

平面内的点，一般满足正态分布，我们来猜这些点满足正态分布，而且是独立同分布的。

正态分布的数据满足，概率：

推

假设事件A1、A2......An的概率分别为P1、P2......Pn这些独立事件同时发生的概率为：

这些点在尽可能在同一平面上的概率：

看，这就是高中到大学的最小二乘法。

机器学习中的那些事 —— 以线性回归举例

任何问题都是有目的的

任何问题都是有目的的，线性回归 y=kx+b 就是目的，我们管这样的函数叫目标函数。

逼近正确就是让失败的情况最差

让失败的情况最差，当失败的情况无限接近最差的时候，就是逼近最正确的时候。最小二乘法就是让失败的情况逼近最差，也就是逼近正确。我们管最小二乘法这样函数叫损失函数，损失函数最小我们叫经验结构最小。

[help me with MathJax]

近期热文

《【钓鱼】与【反钓鱼】的技术剖析》

《快速了解 Java 9 平台模块系统》

《机器人的「语料」，如何获取？》

《一页纸，梳理你的商业模式，奇妙的「精益画布」》

《沉迷前端，无法自拔的人，如何规划职业生涯？》

GitChat 与 CSDN 联合推出

《GitChat 达人课：AI 工程师职业指南》

「阅读原文」看交流实录，你想知道的都在这里

阅读全文

0 0

高中课本里的「机器学习」

高中课本那些事

点连成线

尽可能多的点在一条直线上

如何让尽可能多的点连在一条线上

高中老师没说过的那些事

点在面上

尽可能多的点在同一面上

如何让尽可能多的点连在一条线上

数学到算法模型转化的步骤与工具

猜

工具

实操 线性回归模型

猜

机器学习中的那些事 —— 以线性回归举例

任何问题都是有目的的

逼近正确就是让失败的情况最差

实操线性回归模型