机器学习基础(四)——持久化分类器
来源:互联网 发布:唐筛报告怎么看 知乎 编辑:程序博客网 时间:2024/06/15 16:35
我们以决策树分类器为例。
构造决策树是很耗时的任务,即使处理很小的数据集,如果数据集很大,将会耗费更多的计算时间。然而用创建好的决策树解决(新样本)的分类问题,则可很快完成。因此,为了节省计算时间,最好能够在每次执行对新样本的分类问题时调用已经构造好的决策树,也即我们需使用训练集离线训练(offline training)决策树。为了解决这个问题,我们可以使用 Python 的 pickle 模块序列化对象。
序列化对象可以在磁盘上保存对象,并在任何需要的时候读取出来,任何对象都可执行序列化操作,字典对象自然也不例外。
import pickledef dumpTree(tree, filename): with open(filename, 'wb') as fp: pickle.dump(tree, fp) def loadTree(filname): with open(filename, 'rb') as fp: return pickle.load(fp, encoding='latin1')
通过上述代码,我们可将分类器存储在硬盘上,而不用每次对数据分类时重新学习一遍(一次训练,多次测试,是不是也有些 amortization,耗时分担的意味),这也是决策树的优点之一。
注:并给所有的分类器模型都可持久化,比如 KNN(K近邻算法),KNN 算法它是基于新样本到训练数据的距离进行的分类,存在一种直接的交互和依赖。
0 0
- 机器学习基础(四)——持久化分类器
- activeMq 持久化分类
- 机器学习笔记(一)——机器学习基础
- redis持久化分析
- 基础——机器学习
- 机器学习之python基础(四)
- 机器学习基础(林軒田)笔记之四
- 机器学习(四)——SVM(2)
- 机器学习课程练习(四)——softmax
- 机器学习笔记(四)——朴素贝叶斯
- 机器学习实战(四)——logisticRegression逻辑回归
- 机器学习练习(四)——多元逻辑回归
- 机器学习练习(四)——异常检测
- 机器学习——Python(四)
- Css基础学习(四)—文本
- EMF学习笔记(四)——使用EMF编程——持久化(续)
- Python 《机器学习实战》学习笔记(一)——机器学习基础
- 机器学习实战——第一章:机器学习基础
- 小试循环(奇数和)
- ubuntu查看网关
- c++作业2
- 【代码笔记】iOS-获得富文本设置以后的文字高度
- 2016年,C语言该怎样写
- 机器学习基础(四)——持久化分类器
- Android Studio开发调试Installation failed since the device possibly has stale dexed jars
- String的split()方法探索和大揭秘
- 界面初始化时获取控件高度
- 求n的阶乘
- 委派任务
- Android自定义View的使用
- python 错误: ImportError: cannot import name xxx
- JavaScript学习