1.欢迎学习机器学习(machine learning)

来源:互联网 发布:软件开发项目管理 pdf 编辑:程序博客网 时间:2024/06/07 19:27

1.什么是机器学习

1.应用:图片、语音识别,垃圾邮件检测,诈骗检测,股票市场,教计算机下棋,自动驾驶汽车
2.人和机器的不同,人可以从过去的经验中进行学习,而机器只能执行编写好的代码

定 义:教会计算机利用过去的经验来完成指定的任务。过去的经验,记录的数据,训练集

2.常见的机器学习算法

  • 决策树

    比如根据对用户下载的app分析数据,然后对不同的用户,推荐不同的app

  • 朴素贝叶斯

    垃圾邮件分类器,通过对垃圾邮件内容分析,归纳出几个代表垃圾邮件的特征词语,使用朴素贝叶斯概率算法,选出最可能是垃圾邮件的数据

  • 线性回归

    根据房屋的面积来预测房价是多少。划出一条直线,曲线来拟合
    利用梯度下降:在山上,不停的望,寻找最低点,下降

  • 对数几率回归

    逻辑回归,大学录取,查看学生的在校成绩,入学考试两方面考虑。划出一条直线,让错误划分的点最少—代表错误数目的对数损失函数,不停的调整线的角度,找出所有错误点带来误差之和,选出最小误差的那条
    利用梯度下降:在山上,不停的望,寻找最低点,下降

  • 支持向量机svm

    在一个面上,用一条直线,划分2类点,让靠近这条的线的点,到这条线的距离最大化,也用到梯度下降。
    和逻辑回归相比,更加注意直线分类两侧的点

  • 核函数方法支持向量机,改善模型

    在一个面上,无法用一条直线,划分2类点,可能需要曲线划分。还有种方法就是核函数,将平面上的点映射到三维空间,用平面进行划分

  • 神经网络,改善模型

    在对数几率回归的基础上,分类变复杂,一条直线分不开,需要多条直线划分。输入层,输入入学分数、在校成绩,—>中间层,隐含层,运算,最后输出结果,录取还是不录取
    经常应用到:语音识别,下棋,自动驾驶
    和支持向量机分类相比,使用多条直线,来划分区域

  • K均值聚类

    在3个不同地方的人群里,放置3个披萨店,怎样收到效益最大,用户最多。随机选择3个点地方,不停的迭代,让披萨店放到人群中,并把店附近的人聚类

  • 层次聚类

    还是放置披萨店,如果2个房子很近,怎么办?把相近的房子聚合在一起。当不知道存在多少聚类的情况下,但知道聚类之间的距离,把房子聚合在一起,然后放置披萨店。

原创粉丝点击