机器学习中的必修数学(一)

来源:互联网 发布:山东大学知新楼 编辑:程序博客网 时间:2024/04/28 05:23
  1. 机器学习的领域
    这里写图片描述
  2. 基本的机器学习算法的分类
    这里写图片描述
  3. 得分函数
    如图,经过一系列的计算,最后得到的概率就叫得分函数
    这里写图片描述
  4. 损失函数
    得分函数与真实数据比较之后的误差叫做损失函数
    这里写图片描述
  5. 机器学习中的算法简介
    无监督学习(连续型):SVD、PCA、K-means
    无监督学习(离散型):Apriori、FP-Growth、Hidden Markov Model
    监督学习(连续型):Regression(Linear、Polynomial)、Decsion Trees、Random Forests
    监督学习(离散型):Classification(KNN、Trees、Logistic Regression、Native-Bayes、SVM)
    这里写图片描述
  6. Scikit-learn Algorithm Cheat sheet
    这里写图片描述
  7. 两边夹定理/夹逼定理
    这里写图片描述
  8. 导数
    导数是曲线的斜率,二阶导数是斜率变化快慢的反映

这里写图片描述
9. 方向导数
这里写图片描述
10. 梯度
这里写图片描述
11. 凸函数
这里写图片描述

这里写图片描述
这里写图片描述
12. 琴生不等式
如果是凸函数

这里写图片描述
13. 常见的概率分布
这里写图片描述

这里写图片描述
这里写图片描述
14. 概率
这里写图片描述
15. 常见函数的导数
这里写图片描述
16. 泰勒公式
这里写图片描述
17. 概率与统计的关注点
这里写图片描述
18. 概率统计与机器学习的关系
这里写图片描述
19. 方差
这里写图片描述
20. 协方差
协方差矩阵的特征分解-SVD
协方差是用来评价两个随机变量的线性关系
方差同时除以X的标准差和Y的标准差得出来的是相关系数

这里写图片描述
21. 期望
这里写图片描述
22. SVD的几何意义
原始数据,比如每一行都是一个文本,每列都是一个单词,实际上,我们对于每一个文本都可以用里面所有的单词出现的次数的一个向量作为表示,向量的每一行都对应的一个文本,变成一个矩阵,但是有一个问题,假设词语的个数有60个亿,那么有60亿的词语就有60亿的列,因为太大,所以放不下,因此需要使用方法截短,怎么挑出来?就是一个降维的问题
23. 矩阵乘法在计算中的优势
内积:向量和矩阵相乘
这里写图片描述