机器学习笔记 介绍篇

来源:互联网 发布:软件机器人 编辑:程序博客网 时间:2024/06/05 20:16

1 概论

机器学习起源于人工智能
数据挖掘是机器学习的一个应用

主要的学习算法分为:有监督(教会计算机学习)和无监督的(让计算机自己学习)

2 有监督学习

应用:预测房价
监督问题指从已有的数据集中预测出未知的数据对应的结果。
预测一个连续值的输出。

监督问题分为两种:分类和回归
其中分类指预测离散值,如是恶性肿瘤或是良性肿瘤
其中回归是指预测连续值,如房价的具体数值。

实际的问题中数据存在多种维度,支持向量机中存在一种简单方法,来处理无限多特征。

监督学习中每个数据都对应一个正确答案。

3 无监督学习

数据集中并没有标记,所以数据看起来都一样。

无监督学习中的聚类算法会将不同区域内的数据分为不同的类。
常见应用是谷歌新闻会将新闻分为不同的专辑。搜索不同的新闻并将它们聚集在一起。

另外的应用是实现不同距离的麦克风的音频分离。
也就是著名的鸡尾酒算法。
只用一行代码实现

4 编程语言

编程环境为Octave 还可用matlab
Octave与Matlab类似但是Octave更小。
使用Octave会使学习机器学习更快。
先用Octave写一个算法原型 验证可行性 再转移到C++和Java

原创粉丝点击