机器学习笔记(一)——机器学习基础

来源:互联网 发布:suse linux 开启端口 编辑:程序博客网 时间:2024/05/22 01:51

1. 何谓机器学习

机器学习就是把无序的数据转换成有用的信息。

机器学习的主要任务是分类,另一项任务是回归。

 

监督学习:之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。(分类、回归)

无监督学习:数据没有类别信息,也不会给定目标值。(聚类、密度估计)

 

监督学习:

  k-邻近算法、线性回归、朴素贝叶斯算法、局部加权线性回归、支持向量机、Ridge回归、决策树、Lasso最小回归系数估计

 

无监督学习:

  K-均值、最大期望算法、DBSCANParzcn窗设计

 

2. 如何选择合适的算法

考虑两个问题:一、使用机器学习算法的目的,想要算法完成何种任务;二、需要分析或收集的数据是什么。

 

3. 开发机器学习应用程序的步骤

(1)收集数据

(2)准备输入数据

(3)分析输入数据

(4)训练算法

(5)测试算法

(6)使用算法

 

4. Python

一、安装Python(安装在Windows系统中)

下载地址:https://www.python.org/downloads/windows/

选择版本:Python2.7.9, win32 版本


二、安装NumPySciPy

下载地址:http://www.scipy.org/scipylib/download.html

点击红色框框位置,进入下载页面,选择对应的版本下载安装(numpy-1.9.2-win32-superpack-python2.7.exe、scipy-0.15.1-win32-superpack-python2.7.exe)

    


三、安装Matplotlib

下载地址:http://matplotlib.org/downloads.html

安装版本:matplotlib-1.4.3.win32-py2.7.exe

import matplotlib会出现下面的错误:

     

matplotlib需要依靠 six、dateutil 和 pyparsing 模块, 退出python模式,返回cmd命令模式, 分别输入命令:

pip install six

easy_install python_dateutil

easy_install pyparsing

安装这三个模块。

安装好six、dateutil 和 dateutil之后可以成功import matplotlib了。


四、Ubuntu中安装NumpySciPy和Matplotlib

Ubuntu已经自带Python2.7,所以现在只需安装Numpy、SciPy和Matplotlib,安装也很简单,依次输入下面三个命令即可安装:

sudo apt-get install python-scipy
sudo apt-get install python-numpy
sudo apt-get install python-matplotlib


0 0