汤晓鸥：百度并没有“作弊” 吴韧工作令人钦佩

来源：互联网发布：跑跑卡丁车淘宝买号编辑：程序博客网时间：2024/06/06 00:22

原文截图

　　本文原载于2015年6月18日，科学网刘志峰博客

　　ImageNet国际计算机视觉挑战赛（ILSVRC）主办方近日发表公开信宣布百度在ImageNet测试过程中，违反了测试服务器的使用规则，超过了每周2次的提交。国外技术媒体纷纷借机报道，ZDNet报道百度在超算比赛中作弊，MIT Technology Review 则评论百度制造了人工智能首例作弊丑闻。国内舆论一片哗然，关于百度的讨论甚嚣尘上。随后，百度解除了深度学习研究院杰出科学家吴韧的职务。

　　ImageNet国际计算机视觉挑战赛（ILSVRC）是什么？百度做了什么？

吴韧博士

　　Imagenet ILSVRC 全称是ImageNet Large Scale Visual Recognition Challenge （大规模视觉识别挑战赛），包括“图像分类和物体检测”这两项不同的比赛，从2010年开始每年举办一次。从2012年开始，深度学习被应用到大规模视觉识别挑战赛中。比赛也变成了大数据、计算平台和深度学习算法几个方面的、综合实力考量。比赛结果会在每年计算机视觉顶级会议（ICCV或ECCV）的研讨会上公布，竞赛时间截止日期在顶级会议开会前夕。2014年的比赛截止时间是8月15日，结果在官网上有据可查。百度提交的结果是图像分类结果。

　　而百度到底有没有在挑战赛中“作弊”呢？实际上，百度并没有参加2014年的ILSVRC比赛。挑战赛结束之后，ILSVRC比赛主办方允许各个研究团队继续上传结果到服务器上，但这个结果不会被主办方收录到官方网站上。各个研究队伍都会利用两次竞赛之间的时间上传结果来验证最新的研究和工程方案。谷歌、微软等团队也都在比赛之后陆续更新结果。服务器使用规则是每人每周只能上传2次。那么在两次比赛之间每人能做的尝试大约是100次。百度高性能计算的5人小组在2014 ILSVRC开始尝试ImageNet 识别，总共提交200次的结果。

　　汤晓鸥：百度并没有“作弊动作” 国外报道有些夸大其辞

　　“实际上这段时间的结果并不是真正意义上参赛结果，因为比赛是有截止日期的，所以百度并没有任何竞赛中“作弊”的动作，国外的报道有些夸大其辞了。”去年ILSVRC 物体检测比赛亚军队伍，香港中文大学汤晓鸥教授说。汤晓鸥教授带领的Deep-ID-Net团队目前提交的结果已经在ImageNet物体检测任务中排名第一，他说，“就像我们刚刚发布的CVPR论文结果目前在ILSVRC物体检测上超过Google排名第一了，但这只是用来证明团队研究实力，同时让其他团队了解我们的最新研究成果。真正2015年的比赛还没开始。在ImageNet的官方网站上并没有列出百度、谷歌、微软和我们的最新结果。大家能看到的还是去年八月份的官方比赛结果。”

　　一位ImageNet去年参赛者说，这就好比百米赛跑，ImageNet 竞赛是奥运会，而平时提交结果是训练成绩。百度高性能计算团队搭建的异构计算平台使得他们可以在短时间内跑很多次，从而选择最好的一次公布给大家，但是这并不是正式比赛成绩。Baidu只是比别人多跑了一些次训练赛，百度在其发表的相关学术论文中也并没有试图掩盖这一事实。其实百度这篇论文的长处就在于他的系统比别人的大所以可以在有限的时间内跑很多次。比赛成绩和跑多少次其实关系并不大，更重要的是算法本身是否有效，一个13秒的百米运动员跑一千次也进不了10秒。

　　汤晓鸥教授也谈到，“比赛好比是考试，大家都会把最好的原创技术应用到比赛中，而结果一旦公布，各个队伍的方法也都公布了，那之后的队伍就可以利用之前的技术取得好成绩，就好比其他人答案和成绩公布了之后，再去参加考试那成绩肯定会好一些。所以在这个阶段我们更应该关注创新的本身，学术论文的技术含量，学术创新才是真正推动技术领域的发展的核心。百度这篇文章是很有创新性的，它不同于传统的计算机视觉方法，从高性能计算这一新的视角达到最顶级的识别结果，对ImageNet实际上会起到重要的推动作用。从技术上来讲，我很欣赏百度这篇文章。”

　　ILSVRC 给百度的公开信表示百度的队伍违反了服务器使用规则，可能会带来性能上的小提升并且用来指导下一步的研究和开发任务。从数据来看，百度大规模提交结果之前的误差率在0.05 左右，而最后频繁提交结果后达到了世界第一的 0.0458，实际提升并不大。媒体的关注度是因为在没有正式比赛的情况下，各个大公司包括谷歌、微软和百度都频繁发布最新结果展示实力，从而变相形成潜在竞争。因此，从程序上来说，百度的这些尝试并不牵涉到任何学术诚信问题，也和媒体大量报道的竞赛中作弊的情况相差甚远。

　　中国智慧登上世界舞台人工智能领域期待新突破

　　近年来，中国学者在人工智能，超级计算等顶尖国际竞赛中已经取得引人瞩目的成绩。如天河系列在TOP500超级计算机排名竞赛中蝉联冠军。在人工智能领域，微软亚洲研究院的孙剑，何凯明研究员带领的团队也是在ILSVRC 分类竞赛中首次超越人类的分辨能力。汤晓鸥教授和他的团队屡次在人脸识别突破人类极限。 “抛开是否违规提交不说，这次事件还是有很多积极正面的方面”，汤晓鸥说，“百度等中国公司越来越重视创新，愿意投入大量资源真正推动领域发展。这次的高性能计算团队其实具备了与世界一流研究机构进行竞争甚至在某些技术点上领先的能力。他们的计算平台能够在五天之内提交40次的试验结果，也从侧面反映了他们的系统优势。”而百度披露信息表明，参赛团队成员都是高性能计算背景，并没有实际的计算机视觉的研究经验，才会导致对规则的误解。

　　“深度学习技术创新有两类，一种是网络结构，深度学习算法本身的创新，就好比微软、谷歌和我们这些计算机视觉团队在人脸识别和物体检测上的工作。”汤教授说，“而百度吴韧和他团队的论文更多的是从大规模并行计算，和数据增强方面有所突破。从学术的角度看是很有价值的。他们利用现有的学习算法，把数据进行各种变化生成大量的训练数据，利用他们大规模训练平台得到突破性进展。这也是一种发展趋势。只有计算平台，数据和算法三部分同时发展，深度学习才能发挥最大效用。这次事件的发展很是不幸，我相信造成的原因更多是误解，然后被媒体过度放大。吴韧的工作是令人钦佩的，而目前部分媒体的报道有失公允。另一方面，我虽然不认同百度在媒体压力下的过度反应，但百度对任何可能的学术问题（我认为这次的情况不属于此）的零容忍态度和对科研的大量投入令人刮目相看。”

　　中国的公司能够参与到世界顶尖的学术创新竞争中，这本身就是一件很令人鼓舞的事情。在技术创新这条路上，我们不能因噎废食，而是应该在推动技术进步的前提下，尽量了解科技竞赛的相关规则，减少不必要的失误和误解。只有这样，更多的中国公司才会有意愿参与到最高等级的竞赛和学术创新中，才能做到百花齐放，全民创新。

　　汤晓鸥教授简介

　　汤晓鸥，1985年从辽宁鞍山一中进入中国科大。1991年获罗切斯特大学硕士，1996年获得麻省理工学院博士。现为香港中文大学工学院副院长、工程学院杰出学人、信息工程系教授。2005-2007年担任微软亚洲研究院视觉计算组主任。汤晓鸥是电子电气工程师学会会士（IEEE Fellow），并担任多个国际学术会议主席，包括ICCV，并获得CVPR2009最佳论文奖，是CVPR历史上唯一获奖的亚洲论文（http://mmlab.ie.cuhk.edu.hk）。

　　汤晓鸥从90年代起多次捐赠中国科大，并担任USTCAF（海外校友基金会）1999届主席。他是爱心奖学金的倡导者之一，他根据多次调查完成感人至深的筹款信件，为“爱心奖”发起筹款行动赢得大量捐赠。“爱心奖”也成为USTCAF最成功的项目之一。

　　汤晓鸥2014年5月出任新创基金会第三届执行委员会委员（无薪志愿者）。

　　说明：简介部分资料来自互联网，未经本人审阅。编辑亦不保证实时更新简介。如有谬误或过期信息，由新创基金会负责。

0 0