pandas入门——数据的读取

来源:互联网 发布:linux常用命令mkdir 编辑:程序博客网 时间:2024/06/16 15:34

pandas入门

pandas是专门用来处理复杂数据的python库,我们可以使用pandas来很方便的处理数据,这使我们的效率有很大的提升。

  • pandas导入
    在使用pandas之前需要保证已经安装了pandas,可以在pandas官网上下载该库并安装。
    安装完成后使用import来导入就可以使用了。

  • 打开csv文件

df = pandas.read_csv(filepath_or_buffer="D:\\NBA.csv", encoding="gbk")

filepath_or_buffer是指文件的路径,encoding是指文件的编码格式

  • 读取头部
df.head()type(df.head())

如果不指定读取的行数,一般默认读取前五行数据,使用type函数可以看到返回值的数据类型是数据框:class ‘pandas.core.frame.DataFrame’

  • 读取文件的时候指定头部
    在有些我们需要处理的文件中并不存在头部,这时我们需要去为其添加头部
df = pandas.read_csv(filepath_or_buffer="D:\\NBA.csv", encoding="gbk", header=None,                     names=['1', '2', '3', '4', '5', '6', '7', '8'])
原创粉丝点击