Python 从 mat 文件读写 到 h5py 文件包

来源:互联网 发布:电脑程序编程培训 编辑:程序博客网 时间:2024/05/16 14:21

【摘要】

python在读写matlab文件时常用到scipy.io文件,但,针对大文件(有网友睁着直径为8848米的小眼睛说的大小的分界点在2GB)以及存储版本在“matlab-v7.3”以上的文件就拙计了,这里分享一种刚刚学到处理方式,用h5py模块,详细介绍以及Python源码详见本文。

【正文】

1、如果你的matlab的版本比较旧,保存的.mat 格式为‘-v7.3’以前的版本,可以采用:scipy.io即可。假如有一个name_box.mat,其中,box: {1x29992 cell}和name: {1x29992 cell}。我们想要读取其中的box的内容,源码如下:

import scipy.io as sioboxes = sio.loadmat(’name_box.mat‘)['box'].ravel()

这样boxes就是一个list,可以采用boxes[i]显示每个array的内容了,boxes.shape[0]为cell的个数

2、如果你的matlab的版本比较新,保存的.mat格式为‘-v7.3’的版本,由于scipy.io不支持,所以要采用hdf5,arr.mat是一个m*n的矩阵文件,代码准备先对arr读入,再对 TrainSet_rotate.h5文件实现写入操作,源码如下:

import h5pyimport numpy as npfile = h5py.File('F:\\wfpdm\\20150702_2105\\arr.mat','r')arr = file['arr'][:]# h5py 用于文件读写 详细用例data = np.array( [222,333,444] )label = np.array( [0,1,0] )img_num = np.array( [0,1,2] )# 创建HDF5文件file = h5py.File('TrainSet_rotate.h5','w')# 写入file.create_dataset('train_set_x', data = data)file.create_dataset('train_set_y', data = label)file.create_dataset('train_set_num',data = img_num)file.close()# 读方式打开文件file=h5py.File('TrainSet_rotate.h5','r')# 尽管后面有 '[:]', 但是矩阵怎么进去的就是怎么出来的,不会被拉长(matlab后遗症)train_set_data = file['train_set_x'][:]train_set_y = file['train_set_y'][:]train_set_img_num = file['train_set_num'][:]file.close()

在浏览网页时发现有文章提到,采用 h5py.File 方法读入后会造成矩阵和传入之前的文件比较,存在转置,笔者亲测,这个绝对不会,特在文末阐明。


0 0
原创粉丝点击