使用Weka进行数据挖掘(Weka教程九)模型序列化/持久化存储和加载
来源:互联网 发布:java可视化开发平台 编辑:程序博客网 时间:2024/06/01 14:45
有很多时候,你在构建了一个模型并完成调优后,你很可能会想把这个模型存入到磁盘中,免得下次再重新训练。尤其是神经网络、SVM等模型训练时间非常长,重新训练非常浪费时间。那么怎么持久化模型呢?
其实既然模型也是一个JAVA对象,那我就按照JAVA的序列化和反序列化方法保存模型对象即可。
- Java中的序列化和反序列化
①java.io.ObjectOutputStream
代表对象输出流,它的writeObject(Object obj)方法可对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出流中。
②java.io.ObjectInputStream
代表对象输入流,它的readObject()方法从一个源输入流中读取字节序列,再把它们反序列化为一个对象,并将其返回。
需要注意的是,只有实现了Serializable和Externalizable接口的类的对象才能被序列化。Externalizable接口继承自 Serializable接口,实现Externalizable接口的类完全由自身来控制序列化的行为,而仅实现Serializable接口的类可采用默认的序列化方式 。
对象序列化包括如下步骤:
1) 创建一个对象输出流,它可以包装一个其他类型的目标输出流,如文件输出流;
2) 通过对象输出流的writeObject()方法写对象
对象反序列化的步骤如下:
1) 创建一个对象输入流,它可以包装一个其他类型的源输入流,如文件输入流;
2) 通过对象输入流的readObject()方法读取对象。
- 实现Weka模型的序列化
直接贴出代码,以J48为例
public static void persistModel(J48 model, String ModelPath) { ObjectOutputStream oos = null; try { oos = new ObjectOutputStream( new FileOutputStream(ModelPath)); oos.writeObject(model); oos.flush(); oos.close(); } catch (IOException e) { e.printStackTrace(); } }
- Weka模型的重新加载
重新加载模型只需要进行反序列化即可:
public static J48 reloadPersistModel(String ModelPath) { ObjectInputStream ois = null; try { ois = new ObjectInputStream( new FileInputStream(new File(ModelPath))); J48 model = (J48) ois.readObject(); return model; } catch (Exception e) { e.printStackTrace(); } return null; }
需要注意的是,要将序列化后的对象向下转型才可以获取子类特有方法。
- 使用Weka进行数据挖掘(Weka教程九)模型序列化/持久化存储和加载
- 使用Weka进行数据挖掘(Weka教程七)Weka分类/预测模型构建与评价
- 使用Weka进行数据挖掘(Weka教程三)Weka数据之Instances和Instance
- 使用Weka进行数据挖掘(Weka教程五)Weka数据预处理之Filter使用
- 使用Weka进行数据挖掘(Weka教程四)Weka数据Instance之Attribute
- 使用Weka进行数据挖掘(Weka教程六)Weka采样Filter/Resample/SMOTE
- 使用Weka进行数据挖掘(Weka教程八)Weka分类评价Evaluation输出分析
- 使用Weka进行数据挖掘(Weka教程一)Weka初识之在你的代码中使用Weka
- Weka介绍--使用Weka进行数据挖掘
- 使用Weka进行数据挖掘(Weka教程二)Weka数据之ARFF与多文件格式转换
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- 使用Weka进行数据挖掘
- NSURLSessionUploadTask 上传图片
- gc overhead limit exceeded eclipse解决方案
- Oracle查询性能优化
- iOS-判断沙盒中是否已经存在文件
- Mac添加环境变量
- 使用Weka进行数据挖掘(Weka教程九)模型序列化/持久化存储和加载
- python Requests
- WIFI基本知识整理
- Android设计模式-适配器模式
- 给UITableView 添加索引
- Mac下配置Git-TF来连接TFS2012
- java项目中添加日志
- yarn的工作流程
- 创建请求集