2015-03-09数据加载、存储与文件格式(1)
来源:互联网 发布:管家婆数据库 编辑:程序博客网 时间:2024/06/01 19:47
读写文本格式的数据
--read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号
--read_table 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符("\t")
--read_fwf 读取定宽列格式数据(也就是说,没有分隔符)
--read_clipboard 读取剪贴板中的数据,可以看做read_table的剪贴板版。在将网页转换为表格时很有用
import pandas as pd
from pandas import Series,DataFrame
cd L:\czz
!type ch06\ex1.csv
df=pd.read_csv('L:\czz\ch06\ex1.csv')
pd.read_table('L:\czz\ch06\ex1.csv',sep=',')
自定义列名
!type ch06\ex2.csv
pd.read_csv('ch06\ex2.csv',header=None)
pd.read_csv('ch06\ex2.csv',names=['a','b','c','d','message'])
把列当做索引
names=['a','b','c','d','message']
pd.read_csv('ch06\ex2.csv',names=names,index_col='message')
将多个列作为一个层次化索引
!type ch06\csv_mindex.csv
parsed=pd.read_csv('ch06\csv_mindex.csv',index_col=['key1','key2'])
用正则表达式作为分隔符
list(open('ch06\ex3.txt'))
result=pd.read_table('ch06\ex3.txt',sep='\s+') ??
跳过文件的指定行
!type ch06\ex4.csv
pd.read_csv('ch06\ex4.csv',skiprows=[0,2,3])
缺失值处理
!type ch06\ex5.csv
result=pd.read_csv('ch06\ex5.csv')
pd.isnull(result)
result=pd.read_csv('ch06\ex5.csv',na_values=['NULL'])
指定一组字符串用于表示缺失值
result=pd.read_csv('ch06\ex5.csv',na_values=['NULL','foo'])
为各列指定不同的NA标记值
sentinels={'message':['foo','NA'],'something':['two']}
--read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号
--read_table 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符("\t")
--read_fwf 读取定宽列格式数据(也就是说,没有分隔符)
--read_clipboard 读取剪贴板中的数据,可以看做read_table的剪贴板版。在将网页转换为表格时很有用
import pandas as pd
from pandas import Series,DataFrame
cd L:\czz
!type ch06\ex1.csv
df=pd.read_csv('L:\czz\ch06\ex1.csv')
pd.read_table('L:\czz\ch06\ex1.csv',sep=',')
自定义列名
!type ch06\ex2.csv
pd.read_csv('ch06\ex2.csv',header=None)
pd.read_csv('ch06\ex2.csv',names=['a','b','c','d','message'])
把列当做索引
names=['a','b','c','d','message']
pd.read_csv('ch06\ex2.csv',names=names,index_col='message')
将多个列作为一个层次化索引
!type ch06\csv_mindex.csv
parsed=pd.read_csv('ch06\csv_mindex.csv',index_col=['key1','key2'])
用正则表达式作为分隔符
list(open('ch06\ex3.txt'))
result=pd.read_table('ch06\ex3.txt',sep='\s+') ??
跳过文件的指定行
!type ch06\ex4.csv
pd.read_csv('ch06\ex4.csv',skiprows=[0,2,3])
缺失值处理
!type ch06\ex5.csv
result=pd.read_csv('ch06\ex5.csv')
pd.isnull(result)
result=pd.read_csv('ch06\ex5.csv',na_values=['NULL'])
指定一组字符串用于表示缺失值
result=pd.read_csv('ch06\ex5.csv',na_values=['NULL','foo'])
为各列指定不同的NA标记值
sentinels={'message':['foo','NA'],'something':['two']}
pd.read_csv('ch06\ex5.csv',na_values=sentinels)
----------------------------------------
----------------------------------------
0 0
- 2015-03-09数据加载、存储与文件格式(1)
- 2015-03-09数据加载、存储与文件格式(2)
- 2015-03-10数据加载、存储与文件格式(3)
- 数据加载、存储与文件格式
- Python中数据加载、存储与文件格式
- Python数据加载、存储与文件格式
- 利用Python进行数据分析--数据加载、存储与文件格式
- 利用Python数据分析:数据加载、存储与文件格式(一)
- 数据加载存储和文件格式
- 利用python进行数据分析-数据加载、存储与文件格式1
- python/pandas/numpy(十二)数据加载、存储与文件格式
- 利用python进行数据分析-数据加载、存储与文件格式2
- 数据加载、存储与文件格式 利用Python进行数据分析 第6章
- 《利用Python进行数据分析》笔记---第6章数据加载、存储与文件格式
- 《利用Python进行数据分析》第6章 数据加载、存储与文件格式
- 【Python数据分析与展示】(七)数据加载存储和文件格式
- 利用python进入数据分析之数据加载、存储、文件格式
- python3数据加载,存储与文件1
- 服务器上生成和获取xml
- 15.ios之Quartz2D
- hdu1470Closest Common Ancestors LCA
- 1180 对称矩阵
- MySql的dql和dml操作的封装,成为固定的工具类
- 2015-03-09数据加载、存储与文件格式(1)
- online_judge_1206
- Comparable与Comparator的差异
- 初识Linux下C语言编程
- Jquery easyUI dialog的close和destroy
- 已知两个1~30之间的数字,甲知道两数之和,乙知道两数之积。 。。。。。
- Eclipse Java注释模板设置详解
- 【POJ 3468】A Simple Problem with Integers
- 多进程还是多线程?