Python ML环境搭建与学习资料推荐

来源:互联网 发布:关口知宏 对中国评价 编辑:程序博客网 时间:2024/06/05 13:24

python

  1. 下载anconda
  2. 更新pip源
    参考文章一: Python类库三两事 - 一次解决:http://blog.csdn.net/FontThrone/article/details/76560698
    参考文章二:Anaconda多环境多版本python配置指导http://blog.csdn.net/fontthrone/article/details/76560293

IDE

  1. 下载pycharm专业版
  2. Pycharm建议激活方法使用(license server),注册码亦可,但是现在能用的注册码不好找

配置环境

1.创建新环境,并激活conda create -n MLEnv python=3.6.2

创建新环境

2.激活环境activate MLenv

激活环境

3.检查基础类库

# 建议的使用的命令,顺序如下conda install pandasconda install scipyconda install matplotlib

直接使用pip 进行安装和更新scipy往往会安装失败,这是因为系统环境中缺乏其他基本组件造成的,conda安装(install)或者更新(upgrade)则会把需要的组件全都安装上,但是conda的版本更新往往滞后于pip.
4. 其他基本类库

# 其实机器学习需要的基本类库,除了第三部中给出的科学计算与可视化的基础类库外,就不在需要什么了pip(conda) install scikit-learn# 图像处理的基本库pip(conda) install scikit-image# 自然语言处理的基本库pip install jiebapip(conda) install nltk# nltk下载之后需要下载其他东西

4.NLTK的问题
看图:
NLTK下载

如图,nltk在下载完毕之后,还需要下载其他资料和模型,才能发挥出真正完整的功能,如图所示,下载的地址在外网,而且大小有3.17g之巨,所以下载贼慢,我第一次下载下载了十几个小时,途中还经常断线,需要手动再重新下载某个单元组件,不然整个模块就会停止下载,好在第一次下载之后所有环境的NLTK都使用这一个文件夹里的内容,那么港道理,我直接把文件发给大家,大家应该也可以直接使用(事实上确实可以,我在其他电脑上搭建环境就是直接copy过去的)
百度云地址

学习资料

书籍

  1. 入门书籍个人比较推荐麦好的《机器学习实践指南第二版》,这本书的结构和花书很像,有基础,有各个部分介绍,但是还有代码,比较适合入门机器学习.读完这本书机器学习的整体把握包括数学基础,应用领域都可以有比较好的认识.但是本书中的很多代码虽然实现了功能,但是代码的专业程度似乎比不上《机器学习实战》,假如你想要自己实现机器学习算法的代码的话,后者可能是更好的选择.
  2. 理论方面首推西瓜书,也就是周志华教授的《机器学习》,二推李航教授的《统计学习方法》
  3. 在之前的几本书之后,你可能还需要一本书对数据科学的工程有更好地理解,这个时候建议《python机器学习及实践-从零开始通往kaggle之路》,当然也可以直接从这本书入门.或者《数据科学入门》也可能是一个不错的选择.
  4. 视频:人工智能研究网的教程还不错http://www.studyai.com/course/index/
  5. python科学计算与可视化的基础也很重要,尤其是科学计算,各个组件的官方文档已经非常适合入门,你完全可以通过官方文档入门,给出个国内的中文教学链接:http://old.sebug.net/paper/books/scipydoc/index.html
  6. scikitlearn是工程的利器一定要学会使用,可以直接通过官方文档或者源码注释学习,非常好用,也可以直接用 7 中的推荐,非常好
  7. 如果你想比较快速的入门机器学习工程,或者想进一步提升建议阅读《Python大战机器学习:数据科学家的一个小目标》,这本书很很适合初中期的学习