Peter Bailey的SIGIR投稿经验

来源:互联网 发布:淘宝网页编辑 编辑:程序博客网 时间:2024/06/02 08:16

原文SIGIR Paper Writing Tips writen byPeter Bailey

译者按:
本文源自作者在审阅SIGIR 2013稿件时,在Twitter上给投稿者的一些建议。虽然不同的会议有各自的主题和对于稿件有不同的要求和偏好,但是这些小贴士对于初写paper的新手还是有很好的指导作用。

  • Tip1. 文章的标题要尽量简而又准确地描述文章的主旨,不要误导或者过分夸大自己的工作,同时选词谨慎不要造成歧义。对于英文标题来说,140个字符都过于冗长了。
  • Tip2. 摘要浓缩了整篇文章的精华。在短短的一个段落中,囊括了文章的主题,开展该项研究的动机、目标、采用的方法以及最后取得的成果。让读者在看完摘要之后,有想了解详情,继续读下去的欲望。
  • Tip3.引言:这篇文章主要讲述的是什么内容。你做了什么事?为什么这些事引人关注且新颖?读者在接下来的文章中将看到哪些内容?篇幅1/2至3/4页即可,不宜太长。
  • Tip4. 相关工作:30-40个引文为最佳,过少会显得你对相关领域了解不深。千万不要遗漏别人在该领域的重要工作。
  • Tip5.采用适当的统计学信息展示实验结果,如:误差柱状图、置信区间、效果量等。(@elad1 特别是在统计显著性测试以及算法的有效性比较时)分值的增加并不一定代表改进,它只是改进的概率,有时它们可能接近零。
  • Tip6. 机器学习只是为了达到目的采用的方法,并不是主要内容。特征工程只有在它可以洞察用户行为的时候才会引起关注。SIGIR会议与ICML会议是不同的,虽然机器学习可以帮助我们完成想做的事情,但是信息检索的目标并不是改进机器学习方法。
  • Tip7. 希腊字母和数学/统计公式是为了精确且简洁地说明事情。用语言描述直觉类的内容,不要假装对叙述的事情十分精通。即使在最好的情况下,采用数学/统计学表述都是件十分复杂的事情,尽可能让读者可以轻松理解你在做什么以及为什么要这么做。
  • Tip8. 除非空间有限,否则将文章首作者的名字放在引文的交叉索引之前,这样读者就不用频繁的翻来翻去查阅前文了。(译者注:以空间换可读性,真的很少见啊,只在古老些的长论文中才见过这样的用法。建议写小论文时无视这条。)
  • Tip9. 引用:在最终提交之前,在Latex/word中更新交叉索引。仔细检查作者名字是否有拼写错个误,他们很可能就是审稿人。
  • Tip10. 如果使用测试集进行评估,多用几个。不要只使用前2000个数据。可以采用比Ad hoc IR更好的方法。Ad hoc IR 相当棒,是做很多事情的基础。但它无法对典型的网络搜索行为建模,不能对微博使用行为建模…..还有很多事情它无法完成。一个真正有意义的结果是可以被归纳的,比如著名的BM25公式,它就源于Ad hoc IR。多数测试集都具有自己的特殊性,确保自己的试验结果不会overly limited.(译者注:Ad hoc IR,routing IR什么的真的不大熟啊,原谅我 -_-!)
  • Tip11. 跑大量的日志数据并没有意义,只有洞察其内在涵义,进行归纳,这样得出的结果才有意义。这条与Tip6是一个意思,理解数据背后的涵义,远比拿着一堆数据跑一堆实验重要得多。
  • Tip12. 构建一个真实的信息检索系统需要在很多方面做出妥协。不要过度夸大你的新算法的效果,除非你真的试过。作为一名商业公司的研究人员,每每读到“应该很容易就可以融合新算法并改进当前系统”这样的句子总觉得很沮丧。除非在(现有的,业界最先进)的度量标准下,新算法可以带来10%以上的提高,否则就很难判断采用新算法是否能带来经济效益。
  • Tip13. 产品发展方向并不总是等同于研究方向,反之亦然。而且这两者的研究结果都可能会不宜发表。商业公司的研究人员常常会陷入这样的窘境–很多年前Nick Craswell(译者注:作者的同事,就职于英国微软剑桥研究院)就和我抱怨过这事,而分清这两者之间的界限是我们在微软内部常常讨论的话题。有时在出版或者采用其他方式分享研究成果时,需要把握有意义与商业敏感性之间的度。同样的,一个算法,即使它很明显的不适用于大规模计算,但如果它可以为解决问题提供一个全新的视角,那么它同样的有用的。
  • Tip14. 图片:可增强文章的可读性。如果在图片中采用不同颜色来区分结果,需要在图表中标注清楚。
  • Tip15. 如果文中要排除一部分数据的时候,需要描述清楚你做了什么以及为什么要这么做。否则读者很难了解在数据集中这样的偏差究竟意味着什么。(在SIGIR的论文评阅指南中,观点可再现性越来越受到重视。因此描述清楚你做了什么/没做什么是非常必要的。)
  • Tip16. 不好的结果其实是一个非常有意思的问题。是哪部分没有取得预期效果?为什么会造成这样的结果?当然不是每个试验都会成功,仔细分析失败原因非常重要。
  • Tip17. 要知道,在截止日期的重压之下,你的第一个读者(审稿人)是超负荷工作且疲惫不堪的。想象这样的画面,他们把孩子哄上床,然后拿着一瓶酒开始审稿的工作。这个小贴士只是让你了解审稿人可能是在什么样的状态下开始阅读你的论文。尽可能地让他们可以轻松愉快地阅读你的文章,这是你首先要考虑的事情。如果可以清楚地知道你做了大量工作,审稿人是愿意录取文章,并给作者有用的评阅意见的,这将有助于提高你被录取的可能性。
  • Tip18. 两个字: Strunk and White(译者注:他俩的重要著作”The Elements of Style”(译名:《英文写作风格的要素》),是讲英文写作的经典之作。)。阅读他们的著作,并照着做:基本惯用法,作文的基本原则,重要的格式,词和词组的常见误用。
  • Tip19. 不要将低质量的工作放在文章中,刻意拉长篇幅。SIGIR收到的投稿中有大于80%的文章被拒。很多优秀的文章只有8页的篇幅,因此尽可能使你的文章处处都是闪光点。SIGIR的稿件被拒,往往都是因为文章中哪些研究工作做得不到位的薄弱环节,不要让审稿人抓到你研究中的短处。
  • Tip20. 在文章的开头和结尾,清楚明确的写明你的贡献。当然,结论并不是摘要。有什么不同呢?简单的重申文章的贡献并不能作为结论。这些审稿人在开头已经读过了,他希望知道你这部分工作对今后的研究工作能带来怎样的影响?
  • Tip21. 对在你的研究过程中帮助过你的人表示感谢。对他人的帮助表示感谢并不费事,遗忘帮助过你的人会让他人感到不快。如果对你的研究工作有重大帮助,可以邀请他们成为共同撰稿人。

写在最后的话: 感谢所有在twitter上给我反馈的人们,希望这些小帖子能对你们有所帮助。我还遗漏了什么吗?在阅读/撰写/评审 SIGIR的文章的时候,你最喜欢/痛恨的事情是什么?

致谢: 感谢这些年和我一起共事的同事们的帮助,特别感谢Dave Hawking, Nick Craswell, Ryen White 和 Susan Dumais。

0 0
原创粉丝点击