增量学习

来源:互联网 发布:办公软件快捷方式 编辑:程序博客网 时间:2024/06/07 03:10

是什么?

增量式算法:就是每当新增数据时,并不需要重建所有的知识库,而是在原有知识库的基础上,仅做由于新增数据所引起的更新,这更加符合人的思维原理。

为什么?

对于传统的批量学习技术来说,如何从日益增加的新数据中得到有用信息是一个难题。随着数据规模的不断增加,对时间和空间的需求也会迅速增加,最终会导致学习的速度赶不上数据更新的速度。机器学习是一个解决此问题的有效方法。然而传统的机器学习是批量学习方式,需要在进行学习之前,准备好所有的数据。为了能满足在线学习的需求,需要抛弃以前的学习结果,重新训练和学习,这对时间和空间的需求都很高,因此,迫切需要研究增量学习方法,可以渐进的进行知识更新,且能修正和加强以前的知识,使得更新后的知识能适应新增加的数据。
1. 数据库中的数据是动态变化的
2. 数据量(训练样本)的变化引起重复学习
3. 应避免在海量数据的情况下重复学习
4. ˜只需修改因数据变化而涉及的规则
5. 增量学习算法是数据挖掘算法走向实用化的关键问题之一
增量式算法的重要性体现在2个方面:
1)在实际的数据库中,数据量往往是逐渐增 加的,因此,在面临新的数据时,学习方法应能对训练好的系统进行某些改动,以对新数据中蕴涵的知识进行学习。
2) 对一个训练好的系统进行修改的时间代价通常低于重新训练一个系统所需的代价。

怎么样

1)可以从新数据中学习新知识;  2)以前已经处理过的数据不需要重复处理;3)每次只有一个训练观测样本被看到和学习;4)学习新知识的同时能保存以前学习到的大部分知识;5)—旦学习完成后训练观测样本被丢弃;6)学习系统没有关于整个训练样本的先验知识;
原创粉丝点击