MxNet系列——model_zoo——index

来源:互联网 发布:手机怎么开淘宝直通车 编辑:程序博客网 时间:2024/05/01 23:53

MXNet的模型园地

MXNet 突出了学术论文中报告的最先进模型的快速实现。我们的模型园地(Modle Zoo)包含了完整的模型,Python脚本,预训练的权重和如何进行微调的说明文档。

如何贡献一个预训练的模型 (应包含什么)

提交一个包含下列内容的 Pull 请求:
* Gist 日志
* .json 格式的模型定义文件
* 模型参数文件
* Readme 文件 (细节见下面)

Readme 文件应该包含:
* 模型的位置和访问命令 (wget)。
* 确认你训练的模型满足原始论文中发表的精度。
* 关于如何使用该模型的逐步说明。
* 引用模型参考的任何其它文档或 arxiv 论文。

卷积神经网络

卷积神经网络对于很多图像和视频处理问题来说,是最先进的架构。一些可用的数据库有:

  • ImageNet: 100万张图像构成的语料库,分成1000类。
  • CIFAR10: 来自10个类别的60,000 张自然图像 (尺寸:32 x 32)。
  • PASCAL_VOC: ImageNet的一个带目标边界框的子集。
  • UCF101: 来自101个行为类别的13,320 个视频。
  • Mini-Places2: Subset of the Places2数据集的子集。包含来自100个场景的 100,000 张图像
  • ImageNet 11k
  • Places2:Places365-Standard 包含来自365个场景类别的160万张训练图像,它被用来训练卷积神经网络:Places365。验证集中,每一类有50张图像;测试集中,每一类有900张图像。和Places365-Standard的训练集相比, Places365-Challenge的训练集包括620万额外张图像, Places365 challenge 2016 总共大概有800万张训练图像。验证集和测试集与 Places365-Standard 相同。
Model Definition Dataset Model Weights Research Basis Contributors CaffeNet ImageNet Krizhevsky, 2012 @.. Network in Network (NiN) CIFAR-10 Lin et al.., 2014 SqueezeNet ImageNet Iandola et al.., 2016 VGG16 ImageNet Simonyan et al.., 2015 VGG19 ImageNet Simonyan et al.., 2015 Inception v3 w/BatchNorm ImageNet Szegedy et al.., 2015 ResidualNet152 ImageNet He et al.., 2015 Fast-RCNN PASCAL VOC Girshick, 2015 Faster-RCNN PASCAL VOC Ren et al..,2016 Single Shot Detection (SSD) PASCAL VOC Liu et al.., 2016

递归神经网络 (包括LSTMs)

MXNet 支持循环神经网络(recurrent neural networks, RNNs),也支持长短时记忆网络( Long short-term memory, LSTM)和 GRU网络(Gated Recurrent Units)。一些可用的数据集有:

  • Penn Treebank (PTB): 文本语料库,大约有100万个单词。词汇量限制在10,000个单词。任务是预测下一个【downstream】单词/字符。
  • Shakespeare: 来自莎士比亚作品的复杂文本。
  • IMDB reviews: 25,000个视频评论,标签为好/坏。
  • Facebook bAbI: 20个问答任务的数据集,每一个有1,000个训练样本。
  • Flickr8k, COCO: 带标题/句子的图像。Flickr8k包括 8,092个图像,大约40,000个标注(使用AmazonTurkers标注)。 COCO包含328,000个图像,每一个有5个句子。COCO也包含使用分割算法标记的物体信息。
Model Definition Dataset Model Weights Research Basis Contributors LSTM - Image Captioning Flickr8k, MS COCO [Vinyals et al.., 2015](https://arxiv.org/pdf/ 1411.4555v2.pdf) @… LSTM - Q&A System bAbl Weston et al.., 2015 LSTM - Sentiment Analysis IMDB Li et al.., 2015

生成对抗网络(Generative Adversarial Networks)

Model Definition Dataset Model Weights Research Basis Contributors DCGANs ImageNet Radford et al..,2016 @… Text to Image Synthesis MS COCO Reed et al.., 2016 Deep Jazz Deepjazz.io

其它网络模型

MXNet 支持多种模型,不限于经典的CNN和LSTM。包括深度增强学习,线性模型等。下面是一些可用的的数据集和资源:

  • Google News: 一个包括300万单词的的文本语料库(为word2vec构建)。
  • MovieLens 20M Dataset: 来自2.7万个电影和13.8万个用户的 2000万个评分和46.5万个标签。 Includes tag genome data with 12 million relevance scores across 1,100 tags.
  • Atari Video Game Emulator: Stella是一个多平台的 Atari 2600 VCS 仿真器 (GPL)。
Model Definition Dataset Model Weights Research Basis Contributors Word2Vec Google News Mikolov et al.., 2013 @… Matrix Factorization MovieLens 20M Huang et al.., 2013 Deep Q-Network Atari video games Minh et al.., 2015 Asynchronous advantage actor-critic (A3C) Atari video games Minh et al.., 2016
0 0
原创粉丝点击