[机器学习实战] 机器学习基础

来源:互联网 发布:麒麟臂进阶数据 编辑:程序博客网 时间:2024/05/16 12:48
1. 机器学习的主要任务:(分类、回归)有监督学习、(聚类、密度估计)无监督学习


2. 如何选择合适算法:使用机器学习的目的;需要分析的数据是什么;——分类、回归、聚类还是密度估计,确定算法类型;特征选择,离散型还是连续型,是否有缺失,出现频率;

3. 开发机器学习应用程序的步骤
(1)收集数据
(2)准备输入数据:规范格式
(3)分析输入数据:查找异常值
(4)训练算法
(5)测试算法
(6)实用算法

4. NumPy基础
    (1) from numpy import *
    (2) randArray = random.rand(4, 4)
    (3) randMat = mat(randArray)
    (4) invRandMat = randMat.I
    (5) eye(4, 4)

5. NumPy  SciPy  MatplotLib安装方法
(1) 安装相应版本的numpy
(2) 安装相应版本的scipy
(3) 安装相应版本的matplotlib
(4) 修复msvcp71.dll丢失的问题(可选)
      msvcp71.dll下载文件修复方法:
      ① 解压下载的文件。
      ② 复制文件“msvcp71.dll”到系统目录下。
      ③ 系统目录一般为:C:\WINNT\System32 64位系统为C:\Windows\SysWOW64
      ④ 最后点击开始菜单-->运行-->输入regsvr32 msvcp71.dll后,回车即可解决错误提示!
(5) 将six.py加入$HOME\Pythonx.x\Lib目录

-------------------------------------
解决ImportError: matplotlib requires dateutil的问题
(6) 执行ez_setup.py
(7) 添加环境变量,path中添加$HOME\Pythonx.x\Scripts
(8) 在命令行执行easy_install python-dateutil

-------------------------------------
解决ImportError: matplotlib requires pyparsing的问题
(9) 在命令行执行easy_install pyparsing

阅读全文
0 0