机器学习&深度学习资料(Chapter 15 )

来源:互联网 发布:最短路径算法 最优 编辑:程序博客网 时间:2024/06/03 19:32
                                                                                                     

介绍:Pandas十分钟速览,ipn.

  • 《Data doesn't grow in tables: harvesting journalistic insight from documents》

介绍:面向数据新闻的文本挖掘.

  • 《Time-lapse Mining from Internet Photos》

介绍:用网络图片合成延时视频(SIGGRAPH 2015).

  • 《The Curse of Dimensionality in classification》

介绍:分类系统的维数灾难.

  • 《Deep Learning vs Big Data: Who owns what?》

介绍:深度学习vs.大数据——从数据到知识:版权的思考,[翻译版](http://www.csdn.net/article/2015-05-19/2824707

  • 《A Primer on Predictive Models》

介绍:预测模型入门.

  • 《Demistifying LSTM Neural Networks》

介绍:深入浅出LSTM.

  • 《ICLR 2015》

介绍:2015年ICLR会议视频与讲义.

  • 《On Visualizing Data Well》

介绍:Ben Jones的数据可视化建议.

  • 《Decoding Dimensionality Reduction, PCA and SVD》

介绍:解读数据降维/PCA/SVD.

  • 《Supervised learning superstitions cheat sheet》

介绍:IPN:监督学习方法示例/对比参考表,覆盖logistic回归, 决策树, SVM, KNN, Naive Bayes等方法.

  • 《DopeLearning: A Computational Approach to Rap Lyrics Generation》

介绍:基于RankSVM和DNN自动(重组)生成Rap歌词.

  • 《An Introduction to Random Indexing》

介绍:随机索引RI词空间模型专题.

  • 《VDiscover》

介绍:基于机器学习的漏洞检测工具VDiscover.

  • 《Minerva》

介绍:深度学习系统minerva。拥有python编程接口。多GPU几乎达到线性加速。在4块GPU上能在4天内将GoogLeNet训练到68.7%的top-1以及89.0%的top-5准确率。和同为dmlc项目的cxxnet相比,采用动态数据流引擎,提供更多灵活性。未来将和cxxnet一起整合为mxnet项目,互取优势.

  • 《CVPR 2015 paper》

介绍:2015年国际计算机视觉与模式识别会议paper.

  • 《What are the advantages of different classification algorithms?》

介绍:Netflix工程总监眼中的分类算法:深度学习优先级最低,中文版.

  • 《Results for Microsoft COCO Image Captioning Challenge》

介绍:Codalab图像标注竞赛排行+各家论文,Reddit上flukeskywalker整理了各家技术相关论文.

  • 《Caffe con Troll: Shallow Ideas to Speed Up Deep Learning》

介绍:基于Caffe的加速深度学习系统CcT.

  • 《Low precision storage for deep learning》

介绍:深度学习(模型)低精度(训练与)存储.

  • 《Model-Based Machine Learning (Early Access)》

介绍:新书预览:模型机器学习.

  • 《Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems》

介绍:免费电子书多臂老虎机,此外推荐Introduction to Bandits: Algorithms and Theory.

  • 《Kaggle R Tutorial on Machine Learing》

介绍:基于Kaggle's Titanic Competition的交互式R机器学习教程,介绍《Interactive R Tutorial: Machine Learning for the Titanic Competition》.

  • 《Deep Learning(深度学习)学习笔记整理系列》

介绍:Deep Learning(深度学习)学习笔记整理系列.

  • 《Introduction to Neural Machine Translation with GPUs 》

介绍:神经(感知)机器翻译介绍.

  • 《Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning》

介绍:Andrew Ng关于深度学习/自学习/无监督特征学习的报告,国内云.

  • 《Recurrent Neural Network Training with Dark Knowledge Transfer》

介绍:论文:通过潜在知识迁移训练RNN.

  • 《Show Me The Money》

介绍:面向金融数据的情感分析工具.

  • 《pyLDAvis》

介绍:(Python)主题模型交互可视化库pyLDAvis.

  • 《Logistic Regression and Gradient Descent》

介绍:Logistic回归与优化实例教程.

  • 《贾扬清微信讲座记录》

介绍:贾扬清(谷歌大脑科学家、caffe缔造者)微信讲座记录.

  • 《sketch》

介绍:Theano/Blocks实现RNN手写字符串生成sketch.

  • 《Web Scale Document Clustering: Clustering 733 Million Web Pages》

介绍:基于TopSig的海量(7亿+)网页聚类.

  • 《NAACL 2015 Proceedings on ACL Anthology》

介绍:NAACL 2015 论文papers.

  • 《Stock Forecasting With Machine Learning - Seven Possible Errors》

介绍:机器学习预测股市的七个问题.

  • 《Are there any good resources for learning about neural networks?》

介绍:神经网络学习资料推荐.

  • 《A Critical Review of Recurrent Neural Networks for Sequence Learning》

介绍:面向序列学习的RNN综述.

  • 《Handling and Processing Strings in R》

介绍:R文本处理手册.

  • 《Must-watch videos about Python》

介绍:“必看”的Python视频集锦.

  • 《The Google Stack》

介绍:Google(基础结构)栈.

  • 《Randomized Algorithms for Matrices and Data》

介绍:矩阵和数据的随机算法(UC Berkeley 2013).

  • 《Intermediate R》

介绍:DataCamp中级R语言教程.

  • 《Topology Without Tears》

介绍:免费电子书:轻松掌握拓扑学,中文版.

  • 《Information Theory, Pattern Recognition, and Neural Networks》

介绍:Book,video.

  • 《Scikit-learn》

介绍:Scikit-learn 是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。而且也设计出了Python numerical和scientific libraries Numpy and Scipy

  • 《Pylearn2》

介绍:Pylearn是一个让机器学习研究简单化的基于Theano的库程序。

  • 《NuPIC》

介绍:NuPIC是一个以HTM学习算法为工具的机器智能平台。HTM是皮层的精确计算方法。HTM的核心是基于时间的持续学习算法和储存和撤销的时空模式。NuPIC适合于各种各样的问题,尤其是检测异常和预测的流数据来源。

  • 《Nilearn》

介绍:Nilearn 是一个能够快速统计学习神经影像数据的Python模块。它利用Python语言中的scikit-learn 工具箱和一些进行预测建模,分类,解码,连通性分析的应用程序来进行多元的统计。

  • 《PyBrain》

介绍:Pybrain是基于Python语言强化学习,人工智能,神经网络库的简称。 它的目标是提供灵活、容易使用并且强大的机器学习算法和进行各种各样的预定义的环境中测试来比较你的算法。

  • 《Pattern》

介绍:Pattern 是Python语言下的一个网络挖掘模块。它为数据挖掘,自然语言处理,网络分析和机器学习提供工具。它支持向量空间模型、聚类、支持向量机和感知机并且用KNN分类法进行分类。

  • 《Fuel》

介绍:Fuel为你的机器学习模型提供数据。他有一个共享如MNIST, CIFAR-10 (图片数据集), Google’s One Billion Words (文字)这类数据集的接口。你使用他来通过很多种的方式来替代自己的数据。

  • 《Bob》

介绍:Bob是一个免费的信号处理和机器学习的工具。它的工具箱是用Python和C++语言共同编写的,它的设计目的是变得更加高效并且减少开发时间,它是由处理图像工具,音频和视频处理、机器学习和模式识别的大量软件包构成的。

  • 《Skdata》

介绍:Skdata是机器学习和统计的数据集的库程序。这个模块对于玩具问题,流行的计算机视觉和自然语言的数据集提供标准的Python语言的使用。

  • 《MILK》

介绍:MILK是Python语言下的机器学习工具包。它主要是在很多可得到的分类比如SVMS,K-NN,随机森林,决策树中使用监督分类法。 它还执行特征选择。 这些分类器在许多方面相结合,可以形成不同的例如无监督学习、密切关系金传播和由MILK支持的K-means聚类等分类系统。

  • 《IEPY》

介绍:IEPY是一个专注于关系抽取的开源性信息抽取工具。它主要针对的是需要对大型数据集进行信息提取的用户和想要尝试新的算法的科学家。

  • 《Quepy》

介绍:Quepy是通过改变自然语言问题从而在数据库查询语言中进行查询的一个Python框架。他可以简单的被定义为在自然语言和数据库查询中不同类型的问题。所以,你不用编码就可以建立你自己的一个用自然语言进入你的数据库的系统。现在Quepy提供对于Sparql和MQL查询语言的支持。并且计划将它延伸到其他的数据库查询语言。

  • 《Hebel》

介绍:Hebel是在Python语言中对于神经网络的深度学习的一个库程序,它使用的是通过PyCUDA来进行GPU和CUDA的加速。它是最重要的神经网络模型的类型的工具而且能提供一些不同的活动函数的激活功能,例如动力,涅斯捷罗夫动力,信号丢失和停止法。

  • 《mlxtend》

介绍:它是一个由有用的工具和日常数据科学任务的扩展组成的一个库程序。

  • 《nolearn》

介绍:这个程序包容纳了大量能对你完成机器学习任务有帮助的实用程序模块。其中大量的模块和scikit-learn一起工作,其它的通常更有用。

  • 《Ramp》

介绍:Ramp是一个在Python语言下制定机器学习中加快原型设计的解决方案的库程序。他是一个轻型的pandas-based机器学习中可插入的框架,它现存的Python语言下的机器学习和统计工具(比如scikit-learn,rpy2等)Ramp提供了一个简单的声明性语法探索功能从而能够快速有效地实施算法和转换。

  • 《Feature Forge》

介绍:这一系列工具通过与scikit-learn兼容的API,来创建和测试机器学习功能。这个库程序提供了一组工具,它会让你在许多机器学习程序使用中很受用。当你使用scikit-learn这个工具时,你会感觉到受到了很大的帮助。(虽然这只能在你有不同的算法时起作用。)

  • 《REP》

介绍:REP是以一种和谐、可再生的方式为指挥数据移动驱动所提供的一种环境。它有一个统一的分类器包装来提供各种各样的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一个群体以平行的方式训练分类器。同时它也提供了一个交互式的情节。

  • 《Python 学习机器样品》

介绍:用亚马逊的机器学习建造的简单软件收集。

  • 《Python-ELM》

介绍:这是一个在Python语言下基于scikit-learn的极端学习机器的实现。

  • 《Dimension Reduction》

介绍:电子书降维方法,此外还推荐Dimensionality Reduction A Short Tutorial、Matlab Toolbox for Dimensionality Reduction、Unsupervised Kernel Dimension Reduction

  • 《Datasets Used For Benchmarking Deep Learning Algorithms》

介绍:deeplearning.net整理的深度学习数据集列表.

  • 《Golang Natural Language Processing》

介绍:Go语言编写的自然语言处理工具.

  • 《Rehabilitation of Count-based Models for Word Vector Representations》

介绍:词频模型对词向量的反击,参考Improving Distributional Similarity with Lessons Learned from Word Embeddings 。

  • 《Three Aspects of Predictive Modeling》

介绍:预测模型的三个方面.

  • 《CS224d: Deep Learning for Natural Language Processing》

介绍:斯坦福大学深度学习与自然语言处理课程,部分课程笔记词向量、引言

  • 《Google Computer Vision research at CVPR 2015》

介绍:CVPR2015上Google的CV研究列表.

  • 《Using Deep Learning to Find Basketball Highlights》

介绍:利用(Metamind)深度学习自动发现篮球赛精彩片段.

  • 《Learning Deep Features for Discriminative Localization》

介绍:对本土化特征学习的分析




查看原文:http://www.zoues.com/2016/10/26/%e6%9c%ba%e5%99%a8%e5%ad%a6%e4%b9%a0%e6%b7%b1%e5%ba%a6%e5%ad%a6%e4%b9%a0%e8%b5%84%e6%96%99chapter-15
0 0
原创粉丝点击