28303 篇 arXiv 论文看深度学习 6 大趋势

来源：互联网发布：淘宝男士机械手表编辑：程序博客网时间：2024/05/16 07:33

本文由 Andrej Karpathy撰写，他前不久加入了特斯拉，担任AI 负责人。本文是他在 OpenAI 担任研究员期间所写，陈述了他通过分析机器学习论文数据库arxiv-sanity里面的28303篇论文里面的高频关键词所发现的有趣的结论。

你是否用过谷歌趋势（Google Trends）（https://trends.google.com/trends/?cat=）呢？它的功能很酷：只需要输入关键词，就可以看到该词的搜索量随时间变化的情况。这个产品在一定程度上启发了我，恰巧我有在过去五年中发表在（arxiv）机器学习论文数据库（http://arxiv-sanity.com/）上的28303篇论文，所以我想，为什么不研究一下该领域发展变化的情况呢？研究结果相当有趣，所以我决定跟大家分享一下。

（注：机器学习是一个包罗万象的领域，本文中相当长的篇幅是对深度学习领域的研究，这也是我最为熟悉的领域）

arXiv 的奇点

让我们先来看看提交到arxiv-sanity的所有分类（cs.AI, cs.LG, cs.CV, cs.CL, cs.NE, stat.ML）下的论文总数随时间变化的趋势，如下图所示：

没错，峰值位于2017年3月，这个月这些领域有近2000篇论文提交。这一峰值很可能是某些会议的截稿日期（例如NIPS/ICML）造成的。由于并不是所有人都会将他们的论文上传至arxiv，而且上传比例也在随时间变化而变化，所提交的论文数量并不能完全体现机器学习这一领域的研究规模。不过可以看到，有大量的论文为人所注意、浏览或者阅读。

接下来，我们用这一数字作为分母，看看多少文章包含我们感兴趣的关键词。

深度学习框架

首先，我们关心的是深度学习框架的使用情况。如果在文中任何地方有提到深度学习框架，包括参考书目，都会被记录在案。下图是在2017年3月提交的论文中提到深度学习框架的情况：

可见2017年3月提交的论文中有约10%提到了TensorFlow。当然不是每篇文章都会写出他们所用的框架，不过如果我们假定提及与否和框架类型无关（即说明框架的文章有相对确定的使用比例）的话，可以推断出该社区大约有40%的用户正在使用TensorFlow（如果算上带TensorFlow后端的Keras框架，数量会更多）。下图是一些常用框架随时间变化的趋势图：

我们可以看到，Theano在很长时间占据主流，后来不再流行；2014年Caffe的发展势头强劲，不过在最近几个月内被TensorFlow取代；Torch（和最近的PyTorch）同样在缓慢稳步发展。它们未来发展的状况会是怎样呢？这是一个有趣的话题，个人认为Caffe和Theano会继续下降，TensorFlow的发展速度则会因为PyTorch的竞争而放缓。

ConvNet 模型

常用的ConvNet模型的使用情况又是怎样呢？我们可以在下图看到，ResNets模型异军突起，该模型出现在去年3月发表的9%的论文中。

另外，我很好奇在InceptionNet出现之前有谁在讨论inception呢？

优化算法

优化算法方面，Adam一枝独秀，在所有论文中的出现率高达23%！其真正的使用率很难统计，估计会比23%更高，因为很多论文并没有写出他们所使用的优化算法，况且很多关于神经网络的研究并不使用任何此类算法。然而也有可能要下调5%，因为这个词也非常可能是指代作者的名字，而Adam优化算法在2014年12月才被提出。