CCF ADL70：机器学习前沿

来源：互联网发布：华北水利水电大学知乎编辑：程序博客网时间：2024/05/19 02:18

Preface

这个月的 20~22 号，我参加了中国计算机协会举办的《机器学习前沿》讲习班。开会地点是在广州的广东外语外贸大学，地处广州白云山的山脚下，环境挺美的。

三天里，共有 5 位讲者在大会上分享他所研究领域的前沿。

第一个分享者是清华大学的朱军老师，讲的是贝叶斯学习前沿；
第二个分享者是香港科技大学的 James Kwok 老师，讲的是统计学习前沿；
第三个分享者是华为若亚方舟实验室的吕正东研究员，讲的是深度学习前沿 — 自然语言理解；
第四个分享者是南京大学 LAMDA 实验室的俞扬老师，讲的是强化学习前沿；
第五个分享者是香港科技大学的杨强老师，讲的是迁移学习前沿。

在我听的过程中，更加感受到了每个学校、公司，及其学者的风格的差异。
朱军老师、俞扬老师很符合清华、南大的务实、踏实；
杨强、James Kowk 教授则是高瞻远瞩，研究的真的是前沿中的前沿。周志华老师在总结 James Kowk 教授的演讲时，也说「真是学到了不少」；
倒是工业界的吕正东研究员，不知道是不是因为公司的保密规则，个人觉得讲的太虚了，不踏实。个人没感觉学到什么太多的东西，而且，演讲时有点「装」（对，我就是这么直）。

上两张本会的两位主持人的近照（我坐第一排^_^），南京大学的周志华老师，以及北京交通大学的于剑老师：

下面我详细的总结一下每位老师在这中间的分享，以及我的收获。

贝叶斯学习前沿

先上朱军老师的近照镇楼：

朱军老师的分享分为三个部分：

贝叶斯的基础理论、典型的模型与算法（Basic theory, models, and algorithms）
可扩展的贝叶斯算法（Scalable Bayesian methods），即大数据的情境下，我们怎么做快速的贝叶斯方法。包括 online learning（在线学习），distributed MCMC（分布式的蒙特卡洛方法）
深度产生式模型（Deep generative models），即集合目前很火的深度学习，从贝叶斯的角度怎么来看这个问题；我们怎么去做比较鲁棒的深度学习模型，重点在深度产生式模型的一些进展。

贝叶斯的基础理论、模型与算法

贝叶斯方法的核心便是大名鼎鼎的 Bayes rule（贝叶斯准则或贝叶斯定理）：

p (θ | D) = p ( D | θ ) π ( θ ) p ( D )

其中：

θ 表示 模型（参数向量）；
p(θ|D) 为 posterior（后验概率）；
π(θ) 为 prior（先验概率、先验分布），看到数据之前，对这个模型分布的刻画；
p(D|θ) 为 likelihood model（似然模型、似然函数），用来描述我们的数据的，给定特定的 θ 后，产生数据的可能性。
p(D) 中的 D 为数据集，故此项为常数；

因为我们关心的是机器学习里面的问题，机器学习中我们要做一些预测（prediction），将贝叶斯规则用到机器学习中：

p (x | D, M) = \int p (x | θ, D, M) p (θ | D) d θ

可扩展的贝叶斯算法

深度生成模型

统计学习前沿

这部分是由香港科技大学的 James Kwok（郭天佑）教授讲授的，内容非常前沿。James 老师讲的也快也深，底下的我们是听的一脸瞢逼。
课间，周志华老师上台给我们说：「用中文听到这么前沿的讲座的机会几乎没有，James 讲的非常前沿，可能你们不是很懂，我给你们科普一下刚刚 James 老师讲的啥……」哈哈哈，当场把我们笑死了……