一篇深度学习的概述[0]

来源：互联网发布：大数据在小城市的应用编辑：程序博客网时间：2024/05/16 15:55

本系列翻译自Yhan LeCun,Yoshua Bengio, Geoffrey Hinton三人合作在nature上发表的一篇review的部分，点此获取英语原文，这三人是深度学习领域顶尖的人物，他们的合作的review，自然有精妙之处，其中Yhan LeCun还有自己的个人网站，上面有他的很多论文，很多都是开创性的文章，从最近的往前读，一定会获益匪浅。

深度学习

Yhan LeCun,Yoshua Bengio, Geoffrey Hinton

摘要：深度学习使得一些拥有多处理层的计算模型通过不同程度的抽象而学到测，以及药物研发，基因学等诸多领域的最新技术水平。深度学习通过利用反向传播算法能够识别大数据中的复杂结构，反向传播算法是调整模型内部层与层连接参数的一种方法。卷积神经网络在处理图像，视频，言语，声音方面都取得了突破，循环神经网络则在时序数据处理，比如本文，语音等方面大放异彩。

引言：
机器学习在现代社会的许多方面都产生了深远影响：从网页搜索到社交网站的内容过滤，再到电商网站的推荐，目前仍在照相机，智能手机等消费品中不断扩大应用场景。机器学习系统通常被用来识别图像中的对象，将语音转换成文字，新闻匹配，用户兴趣挖掘，排序搜索结果。这些应用对深度学习这一技术手段的利用日趋向上。
传统机器学习技术在处理原始数据上有所局限。数十年来，构造一个模式识别或者是机器学习系统都需要非常精细的策划以及大量不同领域的专业知识来设计设计一个特征提取器，将原始数据（比如图片的像素值）转化合适的内部表示或特征向量，从而让学习部分，一般为分类器，输出能够模式检测或分类的结果。
特征学习是一系列用来使机器被输入原始数据后，能够自动地发现用来检测或者分类的特征的方法。深度学习技术就是特征学习模型与多层的特征结合，通过将一些简单，非线性模型组合。这些模型能够将某一层的特征（从原始数据开始）转化为更高一层的，更加抽象的特征。积累了足够多的转化以后，就会学得一个非常复杂的函数。对于分类任务而言，原始数据的特征抽象对模型辨别或者抑制不相关的变化十分重要。例如，一张图片，原始数据就是其像素值矩阵，模型第一层所学到的一般都是是否存在某种特定方向边缘及所处图像的位置。第二层则通过检测特定边缘的组合，忽略边缘的细微位置差异来识别纹路，第三层则可能通过拼接纹路事其组成类似我们熟悉对象的某一部分，而接下来的网络层则会将这些部分连接从而识别物体。深度学习最重要的方面是它每一层特征选择都不是由人类设计，而是自己从数据中通过各种学习算法获得。
深度学习在解决那些多年以来一直阻碍人工智能发展的问题上有很大优势。他因为能够很好的从高维数据中发现复杂精细的结构，从而被应用到科学，商业，政府的许多领域。除了打破图像识别，语音识别的许多记录，它在预测潜在药物分子活性，分析粒子加速器数据，模拟大脑回路，预测基因变异对基因表达或疾病的影响上也打败了其他机器学习技术。或许，更为惊喜的是，深度学习在大量不同的自然语言理解任务上都卓越非凡的结果，尤其是话题分类，情感分析，问题回答和翻译方面。
我们认为深度学习将会在不久的将来取得更多的成功。因为它对人为干预的要求非常少，这让它在数据量，及计算复杂度都在增加的情况下非常有优势。现在正在被研究的新型学习算法或架构方式只会加快它的处理速度。

0 0