使用numpy很容易在python中将数据读入内存

来源：互联网发布：linux登陆oracle命令编辑：程序博客网时间：2024/05/17 01:38
使用numpy很容易在python中将数据读入内存:
# -*- coding: utf-8 -*-#~ #----------------------------------------------------------------------#~ module:wlab#~  Filename:wloadsave.py#~  Function :#~  def str2num(LineString,comment='#'):#~  def file2list(Filename,comment='#',SkipHeadLine=0):#~  def str2list(String,comment='#',SkipHeadLine=0):#~  def dlmread(Filename,comment='#',dtype=numpy.float64,SkipHeadLine=0):#~  def dlmwrite(Filename, X, fmt='%16.8e',delimiter=' ', newline='\n',header=''):#~  功能:#~  读取字符串和文件中的数值数据(浮点数)#~  提供类似matlab中的dlmread和dlmwrite函数#~  提供字符串转换为数值数组的函数str2num,str2list#~  Data: 2013-08-08,星期四#~  Author:吴徐平#~  Email:wxp07@qq.com#~ #----------------------------------------------------------------------import numpyimport scipy#~ #----------------------------------------------------------------------def str2num(LineString,comment='#'):    """    #~ >>>NumArray=str2num(LineString,comment='#')    #~ 将字符串中的所有非Double类型的字符全部替换成空格    #~ 以'#'开头注释直至行尾,都被清空    #~ 返回一维numpy.array数组    """    from StringIO import StringIO    import re,numpy    NumArray=numpy.empty([0],numpy.float64)    NumStr=LineString.strip()    #~ ignore comment string    for cmt in comment:        CmtRe=cmt+'.*$'        NumStr=re.sub(CmtRe, " ", NumStr.strip(), count=0, flags=re.IGNORECASE)    #~ delete all non-number characters,replaced by blankspace.    NumStr=re.sub('[^0-9.e+-]', " ", NumStr, count=0, flags=re.IGNORECASE)    #~ Remove incorrect combining-characters for double type.    NumStr=re.sub('[.e+-](?=\s)', " ", NumStr.strip(), count=0, flags=re.IGNORECASE)    NumStr=re.sub('[.e+-](?=\s)', " ", NumStr.strip(), count=0, flags=re.IGNORECASE)    NumStr=re.sub('[e+-]$', " ", NumStr.strip(), count=0, flags=re.IGNORECASE)    NumStr=re.sub('[e+-]$', " ", NumStr.strip(), count=0, flags=re.IGNORECASE)    if len(NumStr.strip())>0:        StrIOds=StringIO(NumStr.strip())        NumArray= numpy.genfromtxt(StrIOds)    return NumArray#~ #----------------------------------------------------------------------def file2list(Filename,comment='#',SkipHeadLine=0):    """    #~  >>>NumList=file2list(Filename,comment='#',SkipHeadLine=0)    #~  使用换行符分割字符串    #~  将字符串中的所有非Double类型的字符全部替换成空格    #~  以'#'开头注释直至行尾,都被清空    #~  忽略文件头所有的行数：SkipHeadLine    #~  将每一行转换成numpy.array数组    #~  返回numpy.array数组的列表    #~  注意:每一行的数组中的元素个数可以不一样    """    from StringIO import StringIO    import re,numpy    file=open(Filename, 'r')    String = file.read()    file.close()    NumList=[]    StringList=String.split('\n')#使用换行符分割字符串    LineNum=0    for Line in StringList:        LineNum=LineNum+1        if (LineNum>SkipHeadLine):            NumArray=str2num(Line,comment)            if len(NumArray)>0:                NumList.append(NumArray)    return  NumList#~ #----------------------------------------------------------------------def str2list(String,comment='#',SkipHeadLine=0):    """    #~  >>>NumList=str2list(String,comment='#',SkipHeadLine=0):    #~  使用换行符分割字符串    #~  将字符串中的所有非Double类型的字符全部替换成空格    #~  以'#'开头注释直至行尾,都被清空    #~  忽略文件头所有的行数：SkipHeadLine    #~  将每一行转换成numpy.array数组    #~  返回numpy.array数组的列表    #~  注意:每一行的数组中的元素个数可以不一样    """    from StringIO import StringIO    import re,numpy    NumList=[]    StringList=String.split('\n')#使用换行符分割字符串    LineNum=0    for Line in StringList:        LineNum=LineNum+1        if (LineNum>SkipHeadLine):            NumArray=str2num(Line,comment)            if len(NumArray)>0:                NumList.append(NumArray)    return  NumList#~ #----------------------------------------------------------------------def dlmread(Filename,comment='#',dtype=numpy.float64,SkipHeadLine=0):    """    #~  Load Data From Txt-File.    #~  >>>NumpyArray= dlmread(Filename,comment='#',dtype=numpy.float64,SkipHeadLine=0)    #~  分隔符默认是:";",",",空格类 (包括\t)等等    #~  以#等开头的被认为是注释,不会被读取    #~  忽略文件头所有的行数：SkipHeadLine    #~  Return Value:二维数值数组(numpy.ndarray)    #~  对文本中数据的排列格式要求最低,且容许出现注释字符,智能化程度最高,但速度较慢    #~  示例：    #~  直接读取文件，默认以#等开头的被认为是注释,不会被读取    #~ >>> x=dlmread(Filename)    #~  以#！等开头的被认为是注释,不会被读取    #~ >>> x=dlmread(Filename,comment='#!')    #~  直接读取文件，指定读取类型    """    import numpy    NumList=file2list(Filename,comment='#',SkipHeadLine=SkipHeadLine)    #~ 判断NumList是否为空    if (len(NumList)>0):        dlsize=[]#每一行数组的大小        for dL in NumList:            dlsize.append(dL.size)         #~ 判断dlsize的列数        MinColumnSize=min(dlsize)#数组的最大列数        MaxColumnSize=max(dlsize)#数组的最小列数        #~ 数组创建和赋值        NumpyArray=numpy.empty([len(NumList),MinColumnSize],dtype=dtype)        row=range(0,len(NumList))        colum=range(0,MinColumnSize)        for i in row:            for j in colum:                NumpyArray[i][j]=NumList[i][j]    else:        NumpyArray=[]    return NumpyArray#~ #----------------------------------------------------------------------def dlmwrite(Filename, X, fmt='%16.8e',delimiter=' ', newline='\n',header=''):    """    #~ Save Data To Txt-File.    #~ >>> dlmwrite(Filename, X, fmt='%16.8e',delimiter=' ', newline='\n',header=''):    """    import numpy    numpy.savetxt(Filename, X, fmt=fmt, delimiter=delimiter, newline=newline,header=header)    return#~ #----------------------------------------------------------------------def tests():    x=numpy.random.randn(3,4)    print(x)    Filename='x.txt'    header='look at this file'    dlmwrite(Filename,x,header=header)    y=dlmread(Filename)    print(y)    return  'wlab tests finished!'#~ #主程序测试if __name__ == '__main__':    x=numpy.random.randn(3,4)    print(x)    Filename='x.txt'    header='look at this file'    dlmwrite(Filename,x,header=header)    y=dlmread(Filename)    print(y)
上面的dlmread和dlmwrite函数使用起来很方便的.