谈谈深度学习和机器学习

来源:互联网 发布:人员管理系统 java 编辑:程序博客网 时间:2024/06/11 02:40

  严格意义上讲,深度学习属于机器学习,所以这里的机器学习严格意义上说,应该叫传统意义的机器学习:基于概率统计的机器学习。

  在我读研的时候,已经判断机器学习会在后几年火热起来,但是,由于AlphaGo的“搅局”,这一时间点提前了,着实让我有些狼狈的追赶,但是好歹也算是找到了机器学习的工作,虽然其中有一些弯路,还算如愿吧。
  这一轮人工智能的热潮呢,如果不是深度学习,机器学习不会如此火热。青出于蓝,是不是胜于蓝,这个可以再说,但是毕竟有其独特的地方,值得说道说道。而且,就我的感觉,他们的差别还是不小的,而目前,深度学习的潜力还没有完全释放出来。
  那他们的区别在哪里呢?
  
1. 要不要特征选择?

  传统的机器学习,有个说法特别有名:特征工程决定了我们的极限,机器学习算法不过是逼近这个极限。机器学习在工业界里,可以说大部分时间都在数据预处理,做特征工程,算法花费的精力其实并不多。

一旦解决了数据表达和特征选择,很多人工智能任务也就解决了90%。

  而,做过特征选择的人都知道,这个事可不是这么简单的。

  深度学习作为机器学习的组成部分,它的独特地方在于可以自动的从简单的特征中提取更加复杂的特征。如果详细说来,传统机器学习,首先人工特征提取,然后权重学习,最后预测结果。深度学习首先基础特征提权,然后多层复杂特征提取,然后权重学习,最后预测。接单总结两个小点:(1)、自动;(2)、获得复杂特征。
  
2. 属于哪个门派?

  我在看佩德罗的《终极算法》时,看到里面对机器学习分为5个学派。我们今天讨论的深度学习属于联结学派,灵感来源于神经科学和物理学;传统机器学习属于贝叶斯学派,理论根基在于统计学。从这里延伸,我们就可以发现,这属于两个不同的流派,差别堪比符号学派与机器学习的区别吧。
  
3. 谁更吃计算资源和数据量?

  在90年代末期,传统的机器学习算法也有了突破性的进展,代表性的算法是支持向量机,手写体识别的错误率降低到0.8%。之所以会这样,主要有两个原因:(1)、当年的计算资源比较稀缺,训练深层神经网络比较困难;(2)、数据量比较小,无法满足需求。

1 0