2.机器学习基础

来源:互联网 发布:linux原生游戏 编辑:程序博客网 时间:2024/06/06 13:14

1.模型评估

  • 构建数据模型,机器学习从数据开始

2. 中位数、众数、平均数

3. 数据的差异性

  • 值域,值的分布区域
  • IQR:统计学‘去尾’,去掉最低,总个数的1/4,最高,总个数的1/4。第一个四分数,Q1,第3个四分数,Q3,中位数就是Q2。IQR=Q3-Q1。IQR的不足,完全不同的数据集具有相同的IQR。
  • 异常值:小于Q1-1.5IQR;大于Q3+1.5IQR
  • 方差:平均平方偏差,方差越小数据越稳定
  • 标准偏差σ,方差开平方。作用:正态分布中,2σ–整体数的68%,4σ对应整体的95%,估计样本的数量。样本偏差s,不同的是分母是n-1贝塞尔校正,用样本估计整个数据时需要校正。

4.机器学习算法

  • 监督学习

    包含:贝叶斯算法、决策树、支持向量机、神经网络、k-近邻(基于实例学习)、集成算法B&B

  • 非监督学习

    包含:待续

  • 强化学习

    包含:待续

  • 深度学习

    包含:待续

原创粉丝点击