pandas教程------读取csv数据(12/4)

来源:互联网 发布:python工作流引擎 编辑:程序博客网 时间:2024/04/30 08:03

很多数据是从网上下载而来,数据的格式可能是csv,那么pandas可以很容易的从csv格式的文件中读取数据,下面我们来看看具体的过程:

  1. 引入pandas

  2. 使用pandas下的read_csv方法,读取csv文件,参数是文件的路径,这是一个相对路径,是相对于当前工作目录的,那么如何知道当前的工作目录呢?

  3. 使用os.getcwd()方法获取当前工作目录

  4. 读取前三后数据,查看一下是否读取正确,显然都是乱码,这是什么问题呢?

  5. 我们需要设定参数encoding,也就是编码方式,如果你不设定编码方式,默认是utf8,现在csv文件是gbk编码的,所以需要使用encoding='gbk'

  6. 我用的编辑器是eric4,注意,eric4默认是不支持中文的,如果你想要显示中文,前提是设置正确的编码,在preferences中

  7. 设置成utf8即可

  8. 回到pandas,我们可以有更多选项来设置打开数据时的操作: