机器学习当前资料集

来源:互联网 发布:java file getpath 编辑:程序博客网 时间:2024/06/11 00:34

转自http://blog.csdn.net/u014035838/article/details/41251975

的学习资料集

Deep Learning(深度学习)

ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一

ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二

Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。

deeplearning.net主页,里面包含的信息量非常多,有software, reading list, research lab, dataset, demo等,强烈推荐,自己去发现好资料。

Deep learning的toolbox,matlab实现的,对应源码来学习一些常见的DL模型很有帮助,这个库我主要是用来学习算法实现过程的。

2013年龙星计划深度学习教程,邓力大牛主讲,虽然老师准备得不充分,不过还是很有收获的。

Hinton大牛在coursera上开的神经网络课程,DL部分有不少,非常赞,没有废话,课件每句话都包含了很多信息,有一定DL基础后去听收获更大。

Larochelle关于DL的课件,逻辑清晰,覆盖面广,包含了rbm系列,autoencoder系列,sparse coding系列,还有crf,cnn,rnn等。虽然网页是法文,但是课件是英文。

CMU大学2013年的deep learning课程,有不少reading paper可以参考。

达慕思大学Lorenzo Torresani的2013Deep learning课程reading list.

Deep Learning Methods for Vision(余凯等在cvpr2012上组织一个workshop,关于DL在视觉上的应用)。

斯坦福Ng团队成员链接主页,可以进入团队成员的主页,比较熟悉的有Richard Socher, Honglak Lee, Quoc Le等。

多伦多ML团队成员链接主页,可以进入团队成员主页,包括DL鼻祖hinton,还有Ruslan Salakhutdinov , Alex Krizhevsky等。

蒙特利尔大学机器学习团队成员链接主页,包括大牛Bengio,还有Ian Goodfellow 等。

纽约大学的机器学习团队成员链接主页,包括大牛Lecun,还有Rob Fergus等。

豆瓣上的脑与deep learning读书会,有讲义和部分视频,主要介绍了一些于deep learning相关的生物神经网络。

Large Scale ML的课程,由Lecun和Langford讲的,能不推荐么。

Yann Lecun的2014年Deep Learning课程主页,强烈推荐。

一些常见的DL code列表,csdn博主zouxy09的博文,Deep Learning源代码收集-持续更新…

Deep Learning for NLP (without Magic),由DL界5大高手之一的Richard Socher小组搞的,他主要是NLP的。

2012 Graduate Summer School: Deep Learning, Feature Learning,高手云集,深度学习盛宴,几乎所有的DL大牛都有参加。

matlab下的maxPooling速度优化,调用C++实现的。

2014年ACL机器学习领域主席Kevin Duh的深度学习入门讲座视频。

 

Machine Learning(机器学习):

介绍图模型的一个ppt,非常的赞,ppt作者总结得很给力,里面还包括了HMM,MEM, CRF等其它图模型。反正看完挺有收获的。

机器学习一个视频教程,youtube上的,翻吧,内容很全面,偏概率统计模型,每一小集只有几分钟。 

龙星计划2012机器学习,由余凯和张潼主讲。

demonstrate 的 blog :关于PGM(概率图模型)系列,主要按照Daphne Koller的经典PGM教程介绍的,大家依次google之。

FreeMind的博客,主要关于机器学习的。

Tom Mitchell大牛的机器学习课程,他的machine learning教科书非常出名。

CS109,Data Science,用python介绍机器学习算法的课程。

 

Computer Vision(计算机视觉):

MIT2013年秋季课程:Advances in Computer Vision,有练习题,有些有code.

IPAM一个计算机视觉的短期课程,有不少牛人参加。

 

OpenCV相关:

http://opencv.org/

2012年7月4日随着opencv2.4.2版本的发布,opencv更改了其最新的官方网站地址。

http://www.opencvchina.com/

好像12年才有这个论坛的,比较新。里面有针对《learning opencv》这本书的视频讲解,不过视频教学还没出完,正在更新中。对刚入门学习opencv的人来说很不错。

http://www.opencv.org.cn/forum/

opencv中文论坛,对于初次接触opencv的学者来说比较不错,入门资料多,opencv的各种英文文档也翻译成中文了。不足是感觉这个论坛上发帖提问很少人回答,也就是说讨论不够激烈。

http://opencv.jp/

opencv的日文网站,里面有不少例子代码,看不懂日文可以用网站自带的翻译,能看个大概。

http://code.opencv.org/projects/opencv

opencv版本bug修补,版本更新,以及各种相关大型活动安排,还包含了opencv最近几个月内的活动路线,即未来将增加的功能等,可以掌握各种关于opencv进展情况的最新进展。

http://tech.groups.yahoo.com/group/OpenCV/

opencv雅虎邮件列表,据说是最好的opencv论坛,信息更新最新的地方。不过个人认为要查找相关主题的内容,在邮件列表中非常不方便。

http://www.cmlab.csie.ntu.edu.tw/~jsyeh/wiki/doku.php

台湾大学暑假集训网站,内有链接到与opencv集训相关的网页。感觉这种教育形式还蛮不错的。

http://sourceforge.net/projects/opencvlibrary/

opencv版本发布地方。

http://code.opencv.org/projects/opencv/wiki/ChangeLog#241    http://opencv.willowgarage.com/wiki/OpenCV%20Change%20Logs

opencv版本内容更改日志网页,前面那个网页更新最快。

http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/tutorials.html

opencv中文教程网页,分几个模块讲解,有代码有过程。内容是网友翻译opencv自带的doc文件里的。

https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html

网友总结的常用带有cvpr领域常见算法code链接的网址,感觉非常的不错。

http://fossies.org/dox/OpenCV-2.4.2/

该网站可以查看opencv中一些函数的变量接口,还会列出函数之间的结构图。

http://opencv.itseez.com/

opencv的函数、类等查找网页,有导航,查起来感觉不错。

 

优化:

http://submodularity.org/

submodual优化。

 

数学:

http://www.youku.com/playlist_show/id_19465801.html

《计算机中的数学》系列视频,8位老师10讲内容,生动介绍微积分和线性代数基本概念在计算机学科中的各种有趣应用!

 

Linux学习资料:

http://itercast.com/library/1

linux入门的基础视频教程,对于新手可选择看第一部分,视频来源于LinuxCast.net网站,还不错。

 

OpenNI+Kinect相关:

http://1.yuhuazou.sinaapp.com/

网友晨宇思远的博客,主攻cvpr,ai等。

http://blog.csdn.net/chenli2010/article/details/6887646

kinect和openni学习资料汇总。

http://blog.csdn.net/moc062066/article/category/871261

OpenCV 计算机视觉 kinect的博客:

http://kheresy.wordpress.com/index_of_openni_and_kinect/comment-page-5/

网友Heresy的博客,里面有不少kinect的文章,写的比较详细。

http://www.cnkinect.com/

体感游戏中文网,有不少新的kinect资讯。

http://www.kinectutorial.com/

Kinect体感开发网。

http://code.google.com/p/openni-hand-tracker

openni_hand_tracking google code项目。

http://blog.candescent.ch/

网友的kinect博客,里面有很多手势识别方面的文章介绍,还有源码,不过貌似是基于c#的。

https://sites.google.com/site/colordepthfusion/

一些关于深度信息和颜色信息融合(fusion)的文章。

http://projects.ict.usc.edu/mxr/faast/

kinect新的库,可以结合OpenNI使用。

https://sites.google.com/a/chalearn.org/gesturechallenge/

kinect手势识别网站。

http://www.ros.org/wiki/mit-ros-pkg

mit的kinect项目,有code。主要是与手势识别相关。

http://www.thoughtden.co.uk/blog/2012/08/kinecting-people-our-top-6-kinect-projects/

kinect 2012年度最具创新的6个项目,有视频,确实够创新的!

http://www.cnblogs.com/yangyangcv/archive/2011/01/07/1930349.html

kinect多点触控的一篇博文。

http://sourceforge.net/projects/kinect-mex/

http://www.mathworks.com/matlabcentral/fileexchange/30242-kinect-matlab

有关matlab for kinect的一些接口。

http://news.9ria.com/2012/1212/25609.html

AIR和Kinect的结合,有一些手指跟踪的code。

http://eeeweba.ntu.edu.sg/computervision/people/home/renzhou/index.htm

研究kinect手势识别的,任洲。刚毕业不久。

 

其他网友cvpr领域的链接总结:

http://www.cnblogs.com/kshenf/

网友整理常用牛人链接总结,非常多。不过个人没有没有每个网站都去试过。所以本文也是我自己总结自己曾经用过的或体会过的。

 

OpenGL有关:

http://nehe.gamedev.net/

NeHe的OpenGL教程英文版。

http://www.owlei.com/DancingWind/

NeHe的OpenGL教程对应的中文版,由网友周玮翻译的。

http://www.qiliang.net/old/nehe_qt/

NeHe的OpengGL对应的Qt版中文教程。

http://blog.csdn.net/qp120291570

网友"左脑设计,右脑编程"的Qt_OpenGL博客,写得还不错。

http://guiliblearning.blogspot.com/

这个博客对opengl的机制有所剖析,貌似要翻墙才能进去。

 

cvpr综合网站论坛博客等:

http://www.cvchina.net/

中国计算机视觉论坛

http://www.cvchina.info/

这个博客很不错,每次看完都能让人兴奋,因为有很多关于cv领域的科技新闻,还时不时有视频显示。另外这个博客里面的资源也整理得相当不错。中文的。

http://www.bfcat.com/

一位网友的个人计算机视觉博客,有很多关于计算机视觉前沿的东西介绍,与上面的博客一样,看了也能让人兴奋。

http://blog.csdn.net/v_JULY_v/

牛人博客,主攻数据结构,机器学习数据挖掘算法等。

http://blog.youtueye.com/

该网友上面有一些计算机视觉方向的博客,博客中附有一些实验的测试代码.

http://blog.sciencenet.cn/u/jingyanwang

多看pami才扯谈的博客,其中有不少pami文章的中文介绍。

http://chentingpc.me/

做网络和自然语言处理的,有不少机器学习方面的介绍。

 

ML常用博客资料等:

http://freemind.pluskid.org/

由 pluskid 所维护的 blog,主要记录一些机器学习、程序设计以及各种技术和非技术的相关内容,写得很不错。

http://datasciencemasters.org/

里面包含学ML/DM所需要的一些知识链接,且有些给出了视频教程,网页资料,电子书,开源code等,推荐!

http://cs.nju.edu.cn/zhouzh/index.htm

周志华主页,不用介绍了,机器学习大牛,更可贵的是他的很多文章都有源码公布。

http://www.eecs.berkeley.edu/~jpaisley/Papers.htm

John Paisley的个人主页,主要研究机器学习领域,有些文章有代码提供。

http://foreveralbum.yo2.cn/

里面有一些常见机器学习算法的详细推导过程。

http://blog.csdn.net/abcjennifer

浙江大学CS硕士在读,关注计算机视觉,机器学习,算法研究,博弈, 人工智能, 移动互联网等学科和产业。该博客中有很多机器学习算法方面的介绍。

http://www.wytk2008.net/

无垠天空的机器学习博客。

http://www.chalearn.org/index.html

机器学习挑战赛。

http://licstar.net/

licstar的技术博客,偏自然语言处理方向。

 

国内科研团队和牛人网页:

http://vision.ia.ac.cn/zh/index_cn.html

中科院自动化所机器视觉课题小组,有相关数据库、论文、课件等下载。

http://www.cbsr.ia.ac.cn/users/szli/

李子青教授个人主页,中科院自动化所cvpr领域牛叉人!

http://www4.comp.polyu.edu.hk/~cslzhang/

香港理工大学教授lei zhang个人主页,也是cvpr领域一大牛人啊,cvpr,iccv各种发表。更重要的是他所以牛叉论文的code全部公开,非常难得!

http://liama.ia.ac.cn/wiki/start

中法信息、自动化与应用联合实验室,里面很多内容不仅限而cvpr,还有ai领域一些其他的研究。

http://www.cogsci.xmu.edu.cn/cvl/english/

厦门大学特聘教授,cv领域一位牛人。研究方向主要为目标检测,目标跟踪,运动估计,三维重建,鲁棒统计学,光流计算等。

http://idm.pku.edu.cn/index.aspx

北京大学数字视频编码技术国家实验室。 

http://www.csie.ntu.edu.tw/~cjlin/libsvm/

libsvm项目网址,台湾大学的,很火!

http://www.jdl.ac.cn/user/sgshan/index.htm

山世光,人脸识别研究比较牛。在中国科学院智能信息处理重点实验室

 

国外科研团队和牛人网页:

https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html

常见计算机视觉资源整理索引,国外学者整理,全是出名的算法,并且带有代码的,这个非常有帮助,其链接都是相关领域很火的代码。

http://www.cs.cmu.edu/afs/cs/project/cil/ftp/html/txtv-groups.html

国外学者整理的各高校研究所团队网站

http://research.microsoft.com/en-us/groups/vision/

微软视觉研究小组,不解释,大家懂的,牛!

http://lear.inrialpes.fr/index.php

法国国家信息与自动化研究所,有对应牛人的链接,论文项目网页链接,且一些code对应链接等。

http://www.cs.ubc.ca/~pcarbo/objrecls/

Learning to recognize objects with little supervision该篇论文的项目网页,有对应的code下载,另附有详细说明。

http://www.eecs.berkeley.edu/~lbourdev/poselets/

poselets相关研究界面,关于poselets的第一手资料。

http://www.cse.oulu.fi/CMV/Research

芬兰奥卢大学计算机科学与工程学院网页,里面有很多cv领域相关的研究,比如说人脸,脸部表情,人体行为识别,跟踪,人机交互等cv基本都涉及有。

http://www.cs.cmu.edu/~cil/vision.html

卡耐基梅隆大学计算机视觉主页,内容非常多。可惜的是该网站内容只更新到了2004年。

http://vision.stanford.edu/index.html

斯坦福大学计算机视觉主页,里面有非常非常多的牛人,比如说大家熟悉的lifeifei.

http://www.wavelet.org/index.php

关于wavelet研究的网页。

http://civs.ucla.edu/

加州大学洛杉矶分校统计学院,关于统计学习方面各种资料,且有相应的网上公开课。

http://www.cs.cmu.edu/~efros/

卡耐基梅隆大学Alexei(Alyosha)Efros教授个人网站,计算机图形学高手。

http://web.mit.edu/torralba/www//

mit牛人Associate教授个人网址,主要研究计算机视觉人体视觉感知,目标识别和场景理解等。

http://people.csail.mit.edu/billf/

mit牛人William T. Freeman教授,主要研究计算机视觉和图像学

http://www.research.ibm.com/peoplevision/

IBM人体视觉研究中心,里面除了有其研究小组的最新成果外,还有很多测试数据(特别是视频)供下载。

http://www.vlfeat.org/

vlfeat主页,vlfeat也是一个开源组织,主要定位在一些最流行的视觉算法开源上,C编写,其很多算法效果比opencv要好,不过数量不全,但是非常有用。

http://www.robots.ox.ac.uk/~az/

Andrew Zisserman的个人主页,这人大家应该熟悉,《计算机视觉中的多视几何》这本神书的作者之一。

http://www.cs.utexas.edu/~grauman/

KristenGrauman教授的个人主页,是个大美女,且是2011年“马尔奖”获得者,”马尔奖“大家都懂的,计算机视觉领域的最高奖项,目前无一个国内学者获得过。她的主要研究方法是视觉识别。

http://groups.csail.mit.edu/vision/welcome/

mit视觉实验室主页。

http://code.google.com/p/sixthsense/

曾经在网络上非常出名一个视频,一个作者研究的第六感装置,现在这个就是其开源的主页。

http://vision.ucsd.edu/~pdollar/research.html#BehaviorRecognitionAnimalBehavior

Piotr Dollar的个人主要,主要研究方向是人体行为识别。

http://www.mmp.rwth-aachen.de/

移动多媒体处理,将移动设备,计算机图像学,视觉,图像处理等结合的领域。

http://www.di.ens.fr/~laptev/index.html

Ivan Laptev牛人主页,主要研究人体行为识别。有很多数据库可以下载。

http://blogs.oregonstate.edu/hess/

Rob Hess的个人主要,里面有源码下载,比如说粒子滤波,他写的粒子滤波在网上很火。

http://morethantechnical.googlecode.com/svn/trunk/

cvpr领域一些小型的开源代码。

http://iica.de/pd/index.py

做行人检测的一个团队,内部有一些行人检测的代码下载。

http://www.cs.utexas.edu/~grauman/research/pubs.html

UT-Austin计算机视觉小组,包含的视觉研究方向比较广,且有的文章有源码,你只需要填一个邮箱地址,系统会自动发跟源码相关的信息过来。

http://www.robots.ox.ac.uk/~vgg/index.html

visual geometry group

 

图像:

http://blog.sina.com.cn/s/blog_4cccd8d301012pw5.html

交互式图像分割代码。

http://vision.csd.uwo.ca/code/

graphcut优化代码。

 

语音:

http://danielpovey.com/kaldi-lectures.html

语音处理中的kaldi学习。

 

算法分析与设计(计算机领域的基础算法):

http://www.51nod.com/focus.html

该网站主要是讨论一些算法题。里面的李陶冶是个大牛,回答了很多算法题。

 

一些综合topic列表:

http://www.cs.cornell.edu/courses/CS7670/2011fa/

计算机视觉中的些topic(Special Topics in Computer Vision),截止到2011年为止,其引用的文章都是非常顶级的topic。

 

书籍相关网页:

http://www.imageprocessingplace.com/index.htm

冈萨雷斯的《数字图像处理》一书网站,包含课程材料,matlab图像处理工具包,课件ppt等相关素材。

Consumer Depth Cameras for Computer Vision

很优秀的一本书,不过很贵,买不起啊!做深度信息的使用这本书还不错,google图中可以预览一部分。

Making.Things.See

针对Kinect写的,主要关注深度信息,较为基础。书籍中有不少例子,貌似是java写的。

 

国内一些AI相关的研讨会:

http://www.iipl.fudan.edu.cn/MLA13/index.htm

中国机器学习及应用研讨会(这个是2013年的)

 

期刊会议论文下载:

http://cvpapers.com/

几个顶级会议论文公开下载界面,比如说ICCV,CVPR,ECCV,ACCV,ICPR,SIGGRAPH等。

http://www.cvpr2012.org/

cvpr2012的官方地址,里面有各种资料和信息,其他年份的地址类似推理更改即可。

http://www.sciencedirect.com/science/journal/02628856

ICV期刊下载

http://www.computer.org/portal/web/tpami

TPAMI期刊,AI领域中可以算得上是最顶级的期刊了,里面有不少cvpr方面的内容。

http://www.springerlink.com/content/100272/

IJCV的网址。

http://books.nips.cc/

NIPS官网,有论文下载列表。

http://graphlab.org/lsrs2013/program/

LSRS (会议)地址,大规模推荐系统,其它年份依次类推。

 

会议期刊相关信息:

http://conferences.visionbib.com/Iris-Conferences.html

该网页列出了图像处理,计算机视觉领域相关几乎所有比较出名的会议时间表。

http://conferences.visionbib.com/Browse-conf.php

上面网页的一个子网页,列出了最近的CV领域提交paper的deadline。

 

cvpr相关数据库下载:

http://research.microsoft.com/en-us/um/people/jckrumm/WallFlower/TestImages.htm

微软研究院牛人Wallflower Paper的论文中用到的目标检测等测试图片

http://archive.ics.uci.edu/ml/

UCI数据库列表下载,最常用的机器学习数据库列表。

http://www.cs.rochester.edu/~rmessing/uradl/

人体行为识别通过关键点的跟踪视频数据库,Rochester university的

http://www.research.ibm.com/peoplevision/performanceevaluation.html

IBM人体视觉研究中心,有视频监控等非常多的测试视频。

http://www.cvpapers.com/datasets.html

该网站上列出了常见的cvpr研究的数据库。

http://www.cs.washington.edu/rgbd-dataset/index.html

RGB-D Object Dataset.做目标识别的。

 

AI相关娱乐网页:

http://en.akinator.com/

该网站很好玩,可以测试你心里想出的一个人名(当然前提是这个人必须有一定的知名度),然后该网站会提出一系列的问题,你可以选择yes or no,or I don’t know等等,最后系统会显示你心中所想的那个人。

http://www.doggelganger.co.nz/

人与狗的匹配游戏,摄像头采集人脸,呵呵…

 

Android相关:

https://code.google.com/p/android-ui-utils/

该网站上有一些android图标,菜单等跟界面有关的设计工具,可以用来做一些简单的UI设计.

 

工具和code下载:

http://lear.inrialpes.fr/people/dorko/downloads.html

6种常见的图像特征点检测子,linux下环境运行。不过只提供了二进制文件,不提供源码。

http://www.cs.ubc.ca/~pcarbo/objrecls/index.html#code

ssmcmc的matlab代码,是Learning to recognize objects with little supervision这一系列文章用的源码,属于目标识别方面的研究。

http://www.robots.ox.ac.uk/~timork/

仿射无关尺度特征点检测算子源码,还有些其它算子的源码或二进制文件。

http://www.vision.ee.ethz.ch/~bleibe/code/ism.html

隐式形状模型(ISM)项目主页,作者Bastian Leibe提供了linux下运行的二进制文件。

http://www.di.ens.fr/~laptev/download.html#stip

Ivan Laptev牛人主页中的STIP特征点检测code,但是也只是有二进制文件,无源码。该特征点在行为识别中该特征点非常有名。

http://ai.stanford.edu/~quocle/

斯坦福大学Quoc V.Le主页,上有它2011年行为识别文章的代码。

 

开源软件:

http://mloss.org/software/

一些ML开源软件在这里基本都可以搜到,有上百个。

https://github.com/myui/hivemall

Scalable machine learning library for Hive/Hadoop.

http://scikit-learn.org/stable/

 

基于python的机器学习开源软件,文档写得不错。

 

挑战赛:

http://www.chioka.in/kaggle-competition-solutions/

kaggle一些挑战赛的code. 

 

公开课:

网易公开课,国内做得很不错的公开课,翻译了一些国外出名的公开课教程,与国外公开课平台coursera有合作。

coursera在线教育网上公开课,很新,有个邮箱注册即可学习,有不少课程,且有对应的练习,特别是编程练习,超赞。

斯坦福网上公开课链接,有统计学习,凸优化等课程。

udacity公开课程下载链接,其实速度还可以。里面有不少好教程。

机器学习公开课的连接,有不少课。


 
    《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning》
 
介绍:做深度学习如何选择GPU的建议
 
    《Sparse Linear Models》
 
介绍: Stanford的Trevor Hastie教授在H2O.ai Meet-Up上的报告,讲稀疏线性模型——面向“宽数据”(特征维数超过样本数)的线性模型,13年同主题报告 、讲义.
 
    《Awesome Computer Vision》
 
介绍: 分类整理的机器视觉相关资源列表,秉承Awesome系列风格,有质有量!作者的更新频率也很频繁
 
    《Adam Szeidl》
 
介绍: social networks course
 
    《Building and deploying large-scale machine learning pipelines》
 
介绍: 大规模机器学习流程的构建与部署.
 
    《人脸识别开发包》
 
介绍: 人脸识别二次开发包,免费,可商用,有演示、范例、说明书.
 
    《Understanding Natural Language with Deep Neural Networks Using Torch》
 
介绍: 采用Torch用深度学习网络理解NLP,来自Facebook 人工智能的文章.
 
    《The NLP Engine: A Universal Turing Machine for NLP》
 
介绍: 来自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章,作者用Shannon Entropy来刻画NLP中各项任务的难度.
 
    《TThe Probabilistic Relevance Framework: BM25 and Beyond》
 
介绍: 信息检索排序模型BM25(Besting Matching)。1)从经典概率模型演变而来 2)捕捉了向量空间模型中三个影响索引项权重的因子:IDF逆文档频率;TF索引项频率;文档长度归一化。3)并且含有集成学习的思想:组合了BM11和BM15两个模型。4)作者是BM25的提出者和Okapi实现者Robertson.
 
    《Introduction to ARMA Time Series Models – simplified》
 
介绍: 自回归滑动平均(ARMA)时间序列的简单介绍,ARMA是研究时间序列的重要方法,由自回归模型(AR模型)与滑动平均模型(MA模型)为基础“混合”构成.
 
    《Encoding Source Language with Convolutional Neural Network for Machine Translation》
 
介绍: 把来自target的attention signal加入source encoding CNN的输入,得到了比BBN的模型好的多neural network joint model
 
    《Spices form the basis of food pairing in Indian cuisine》
 
介绍: 揭开印度菜的美味秘诀——通过对大量食谱原料关系的挖掘,发现印度菜美味的原因之一是其中的味道互相冲突,很有趣的文本挖掘研究
 
    《HMM相关文章索引》
 
介绍: HMM相关文章
 
    《Zipf’s and Heap’s law》
 
介绍: 1)词频与其降序排序的关系,最著名的是语言学家齐夫(Zipf,1902-1950)1949年提出的Zipf‘s law,即二者成反比关系. 曼德勃罗(Mandelbrot,1924- 2010)引入参数修正了对甚高频和甚低频词的刻画 2)Heaps’ law: 词汇表与语料规模的平方根(这是一个参数,英语0.4-0.6)成正比
 
    《I am Jürgen Schmidhuber, AMA》
 
介绍: Jürgen Schmidhuber在Reddit上的AMA(Ask Me Anything)主题,有不少RNN和AI、ML的干货内容,关于开源&思想&方法&建议……耐心阅读,相信你也会受益匪浅.
 
    《学术种子网站:AcademicTorrents》
 
介绍: 成G上T的学术数据,HN近期热议话题,主题涉及机器学习、NLP、SNA等。下载最简单的方法,通过BT软件,RSS订阅各集合即可
 
    《机器学习交互速查表》
 
介绍: Scikit-Learn官网提供,在原有的Cheat Sheet基础上加上了Scikit-Learn相关文档的链接,方便浏览
 
    《A Full Hardware Guide to Deep Learning》
 
介绍: 深度学习的全面硬件指南,从GPU到RAM、CPU、SSD、PCIe
 
    《行人检测(Pedestrian Detection)资源》
 
介绍:Pedestrian Detection paper & data
 
    《A specialized face-processing network consistent with the representational geometry of monkey face patches》
 
介绍: 【神经科学碰撞人工智能】在脸部识别上你我都是专家,即使细微的差别也能辨认。研究已证明人类和灵长类动物在面部加工上不同于其他物种,人类使用梭状回面孔区(FFA)。Khaligh-Razavi等通过计算机模拟出人脸识别的FFA活动,堪称神经科学与人工智能的完美结合。
 
    《Neural Net in C++ Tutorial》
 
介绍: 神经网络C++教程,本文介绍了用可调节梯度下降和可调节动量法设计和编码经典BP神经网络,网络经过训练可以做出惊人和美妙的东西出来。此外作者博客的其他文章也很不错。
 
    《How to Choose a Neural Network》
 
介绍:deeplearning4j官网提供的实际应用场景NN选择参考表,列举了一些典型问题建议使用的神经网络
 
    《Deep Learning (Python, C/C++, Java, Scala, Go)》
 
介绍:一个深度学习项目,提供了Python, C/C++, Java, Scala, Go多个版本的代码
 
    《Deep Learning Tutorials》
 
介绍:深度学习教程
 
    《自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授》
 
介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.
 
    《FaceNet: A Unified Embedding for Face Recognition and Clustering》
 
介绍:Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别和聚类.
 
    《MLlib中的Random Forests和Boosting》
 
介绍:本文来自Databricks公司网站的一篇博客文章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些简单的例子并建议该从何处上手.中文版.
 
    《Sum-Product Networks(SPN) 》
 
介绍:华盛顿大学Pedro Domingos团队的DNN,提供论文和实现代码.
 
    《Neural Network Dependency Parser》
 
介绍:基于神经网络的自然语言依存关系解析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路实现.
 
    《神经网络语言模型》
 
介绍:本文根据神经网络的发展历程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变形,总结的特别好.
 
    《Classifying Spam Emails using Text and Readability Features》
 
介绍:经典问题的新研究:利用文本和可读性特征分类垃圾邮件。
 
    《BCI Challenge @ NER 2015》
 
介绍:Kaggle脑控计算机交互(BCI)竞赛优胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参赛框架的绝佳实例
 
    《IPOL Journal · Image Processing On Line》
 
介绍:IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术之间的距离.
 
    《Machine learning classification over encrypted data》
 
介绍:出自MIT,研究加密数据高效分类问题.
 
    《purine2》
 
介绍:新加坡LV实验室的神经网络并行框架Purine: A bi-graph based deep learning framework,支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加速。12块Titan 20小时可以完成Googlenet的训练。
 
    《Machine Learning Resources》
 
介绍:这是一个机器学习资源库,虽然比较少.但蚊子再小也是肉.有突出部分.此外还有一个由zheng Rui整理的机器学习资源.
 
    《Hands-on with machine learning》
 
介绍:Chase Davis在NICAR15上的主题报告材料,用Scikit-Learn做监督学习的入门例子.
 
    《The Natural Language Processing Dictionary》
 
介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.
 
    《PageRank Approach to Ranking National Football Teams》
 
介绍:通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛球队排行榜.
 
    《R Tutorial》
 
介绍:R语言教程,此外还推荐一个R语言教程An Introduction to R.
 
    《Fast unfolding of communities in large networks》
 
介绍:经典老文,复杂网络社区发现的高效算法,Gephi中的Community detection即基于此.
 
    《NUML》
 
介绍: 一个面向 .net 的开源机器学习库,github地址
 
    《synaptic.Js》
 
介绍: 支持node.js的JS神经网络库,可在客户端浏览器中运行,支持LSTM等 github地址
 
    《Machine learning for package users with R (1): Decision Tree》
 
介绍: 决策树
 
    《Deep Learning, The Curse of Dimensionality, and Autoencoders》
 
介绍: 讨论深度学习自动编码器如何有效应对维数灾难,国内翻译
 
    《Advanced Optimization and Randomized Methods》
 
介绍: CMU的优化与随机方法课程,由A. Smola和S. Sra主讲,优化理论是机器学习的基石,值得深入学习 国内云(视频)
 
    《CS231n: Convolutional Neural Networks for Visual Recognition》
 
介绍: “面向视觉识别的CNN”课程设计报告集锦.近百篇,内容涉及图像识别应用的各个方面
 
    《Topic modeling with LDA: MLlib meets GraphX》
 
介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.
 
    《Deep Learning for Multi-label Classification》
 
介绍: 基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题
 
    《Google DeepMind publications》
 
介绍: DeepMind论文集锦
 
    《kaldi》
 
介绍: 一个开源语音识别工具包,它目前托管在sourceforge上面
 
    《Data Journalism Handbook》
 
介绍: 免费电子书《数据新闻手册》, 国内有热心的朋友翻译了中文版,大家也可以在线阅读
 
    《Data Mining Problems in Retail》
 
介绍: 零售领域的数据挖掘文章.
 
    《Understanding Convolution in Deep Learning》
 
介绍: 深度学习卷积概念详解,深入浅出.
 
    《pandas: powerful Python data analysis toolkit》
 
介绍: 非常强大的Python的数据分析工具包.
 
    《Text Analytics 2015》
 
介绍: 2015文本分析(商业)应用综述.
 
    《Deep Learning libraries and first experiments with Theano》
 
介绍: 深度学习框架、库调研及Theano的初步测试体会报告.
 
    《DEEP learning》
 
介绍: MIT的Yoshua Bengio等人讲深度学习的新书,还未定稿,线上提供Draft chapters收集反馈,超赞!强烈推荐.
 
    《simplebayes》
 
介绍: Python下开源可持久化朴素贝叶斯分类库.
 
    《Paracel》
 
介绍:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
 
    《HanLP:Han Language processing》
 
介绍: 开源汉语言处理包.
 
    《Simple Neural Network implementation in Ruby》
 
介绍: 使用Ruby实现简单的神经网络例子.
 
    《Hacker’s guide to Neural Networks》
 
介绍:神经网络黑客入门.
 
    《The Open-Source Data Science Masters》
 
介绍:好多数据科学家名人推荐,还有资料.
 
    《Text Understanding from Scratch》
 
介绍:实现项目已经开源在github上面Crepe
 
    《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
 
介绍:作者发现,经过调参,传统的方法也能和word2vec取得差不多的效果。另外,无论作者怎么试,GloVe都比不过word2vec.
 
    《CS224d: Deep Learning for Natural Language Processing》
 
介绍:Stanford深度学习与自然语言处理课程,Richard Socher主讲.
 
    《Math Essentials in Machine Learning》
 
介绍:机器学习中的重要数学概念.
 
    《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
 
介绍:用于改进语义表示的树型LSTM递归神经网络,句子级相关性判断和情感分类效果很好.实现代码.
 
    《Statistical Machine Learning》
 
介绍:卡耐基梅隆Ryan Tibshirani和Larry Wasserman开设的机器学习课程,先修课程为机器学习(10-715)和中级统计学(36-705),聚焦统计理论和方法在机器学习领域应用.
 
    《AM207: Monte Carlo Methods, Stochastic Optimization》
 
介绍:《哈佛大学蒙特卡洛方法与随机优化课程》是哈佛应用数学研究生课程,由V Kaynig-Fittkau、P Protopapas主讲,Python程序示例,对贝叶斯推理感兴趣的朋友一定要看看,提供授课视频及课上IPN讲义.
 
    《生物医学的SPARK大数据应用》
 
介绍:生物医学的SPARK大数据应用.并且伯克利开源了他们的big data genomics系统ADAM,其他的内容可以关注一下官方主页.
 
    《ACL Anthology》
 
介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们,请在提出自己牛逼到无以伦比的idea(自动归纳翻译规律、自动理解语境、自动识别语义等等)之前,请通过谷歌学术简单搜一下,如果谷歌不可用,这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.
 
    《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
 
介绍:论文+代码:基于集成方法的Twitter情感分类,实现代码.
 
    《NIPS 2014 CIML workshop》
 
介绍:NIPS CiML 2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.
 
    《CS231n: Convolutional Neural Networks for Visual Recognition》
 
介绍:斯坦福的深度学习课程的Projects 每个人都要写一个论文级别的报告 里面有一些很有意思的应用 大家可以看看 .
 
    《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
 
介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等


转自博客:http://blog.csdn.net/GrazyThinking/article/details/40687421

0 0
原创粉丝点击