Python大牛之路所需技术和工具

来源:互联网 发布:手机淘宝如何联系卖家 编辑:程序博客网 时间:2024/05/16 10:39

开发环境

工具

  • vim / SublimeText2 / PyCharm
    用着顺手就好,我是由vim转PyChram的。集成开发环境自动补全、单步调试等功能好很多,有利于提高工作效率。
  • iTerm: Mac下必备,谁用谁知道
  • Terminator: Ubuntu下必备。
  • tmux:分屏工具,可以复用session很赞。

本地环境

  • pip/easy_install 包管理
  • viertualenv + virtualenvwrapper 库/版本管理, 环境隔离
  • ipython/ipdb
  • pydev

项目开发

管理工具

  • git
    大部分互联网公司都是基于gitlab搭建内网的git服务。

Web框架

  • Tornado:异步, 高性能, 最新版本4.0。
  • Flask:轻量! 可以灵活组合各类组件进行开发(第三方组件很丰富), 简单高效, 便于快速开发和维护。
  • Django:有些重, 配置和约定众多, 可以快速开发一些”管理”性质的后台。
    Python Web框架也是超多,目前主流的就是这三个了。目前工作中采用的Tornado,性能卓越。

ORM

  • SQLAlchemy:标配。
  • pymongo:访问mongodb。
  • peewe:一个更轻量的ORM,简单了解,没在生产环境用过。

数据库

  • 关系型数据库:mysql

No SQL:

  • redis 缓存/持久化/特殊需求(计数-排行榜-时间线等)
  • memcached 集群, 多用于有时限性质的缓存
  • mongodb
    目前业务中这三个都有用到,感觉redis有逐渐取代memcached的趋势。

分布式存储

  • HDFS:hadopp生态
  • Hive:分析log
  • Hbase: 列数据库,可以存储海量数据,上10亿条不在话下,跟关系型数据库区别较大。

消息队列

  • RabbitMQ: python中pika操作。
  • celery: 据同事反馈,找Python开发的时候,10个有9个用过celery(芹菜)。于是,简单看了下celery使用文档,感觉RabbitMQ已经满足现在的业务需求,没有在生产环境中使用。

项目部署

服务器

  • nginx , 主要用于负载均衡,,反向代理,使用极为广泛。
  • uWSGI,用来部署Django项目。
  • gunicorn a Python WSGI HTTP Server for UNIX, 用来运行Flask项目

运维管理

  • saltstack:别名,盐栈。自动化运维工具。
  • puppet:这货是Ruby开发的,百度和小米都在大规模使用。
  • fabric: 用于自动化部署。
  • Supervisor A Process Control System, 配置管理各种程序, 进程监控, 自动重启等。

三方库

  • requests HTTP for humans, 非常好用, 强烈推荐
  • beautifulsoup 配合urllib2或者requests库进项简单的抓取分析工作
  • scrapy 很牛的抓取框架, 适合规模较大,需求复杂的的抓取任务
  • cachetools: 本地缓存

其他

前端基础

  • html, css, javascript, jquery,bootstrap,angularjs,react, vue.js。作为一个后端工程师,了解一些基本的前端知识也是必要的。目前工作中用到bootstrap+angularjs来开发后台管理系统。

软件工程

  • 设计模式:Python虽然不像Java里没完没了的设计模式,基本的设计模式也会用到。组合,单例模式、装饰器模式、工厂模式这几个常用。
  • RESTful 接口。
  • MVC
  • 测试:单元测试,性能测试。
    有比较才有差距,多看别人代码,借鉴提高。

云计算

  • 大数据:Hadoop生态。
  • 虚拟化:Docker, KVM, OpenStack。
  • 公有云:AWS,阿里云,Azure,金山云。
  • 私有云:百度的私有云建设的很不错,分布式存储、虚拟化业界领先。
阅读全文
0 0