文字版: 如何⾼效阅读机器学习顶会论⽂ 1.读书与读论⽂的区别 教材仔细读:经过⻓时间的打磨,是精品;书籍如CSAPP, ESL, MLAPP, GEB(最后这个花费作者⼀辈⼦ ⼼⾎) 论⽂要甄别: 顶会论⽂:cvpr, icml, nips, 等 70%:在前⼈基础上做了⼀丁点改进,如改⼀下损失函数、调调正则化 -> 不值得花⼤量时间 研读 10%:给领域的从业者带来灵感的启发 1%:给⾏业所有的从业者都有启发,甚⾄带来⽅向性的影响 ⚠ :只有⼀⼩部分的⽂章值得复现,如顶会论⽂的best paper 或 oral; ⚠ :经典的论⽂在你之前可能已经有很多⼈复现过了,作者也可能会给出官⽅的代码; ⚠ :硕⼠、⾼年级的本科⽣、刚⼊⻔者这些垃圾可以不⽤读;但博⼠⽣为了在这个特别⼩的⽅向上能有 所建树、保持敏锐的嗅觉,这些垃圾也要读,宁滥勿缺。 2. 论⽂来源 第⼀类:⼀⼿来源 会议的官⽹:cvpr、iccv、eccv、icml、nips(看best paper & oral & 获奖论⽂) arxiv.org (放着未发表的或者预览版的论⽂),需要⼀个账号 Google scholar;订阅功能 (⾃然语⾔处理、auto ml),订阅搜索结果,每⽇会⾃动搜索,关注最 新论⽂ 第⼆类:⼆⼿来源 ᰀ⽣收集:如github上的awesome list,可以订阅watch、star 可靠信息筛选:公开课(cs224n, cs224w, cs231n, 李宏毅⽼师机器学习公开课)的幻灯⽚⾥有论 ⽂列表⼀定要好好读;被⼈认可的个⼈来源、知乎⼤v、微博;项⽬源码的注释中的论⽂ 第三类:三⼿来源 综述性论⽂ 3. 如何读论⽂ 场景:刚开完会议或正在开,⼿中有⼀次会议上所有被接收的论⽂或者随意按顺序拿出20篇 对20篇论⽂进⾏简单分类:整理、分三类记录 1.论⽂标题和作者 2.⽂章摘要(⽤⾃⼰的话复述,⽤⼀句话或50字以内如何向别⼈推荐和介绍这篇论⽂,最好 ⽤英语;【这篇⽂章⽤了什么⽅法、在⼲什么】) 3.这篇⽂章要不要继续精读+当时作出决定的⽇期 精读环节:带着问题读【把⾃⼰想象成⼀个杠精去挑刺】(你开始提出的问题以及最关⼼的问题有 没有在看完⽂章后得到解答) 精读顺序:摘要(产⽣问题Q)-> 引⾔(上述问题是否被放⼤、有没有出现新问题、前⾯的 问题有没有得到回答A )-> 再次确认要不要读下去 -> 总结部分,即conclusion、feature work(作者总结的⽂章᯿点以及未来的打算是否明确)-> 知识介绍(᯿点读每⼀段的第⼀句 话;如果遇到图表,先仔细的看图表)-> 再次确定要不要继续读 -> 进⼊最耗时的核⼼算法部 分 -> 实验部分(数据集、评价标准)-> 决定要不要复现、将⾃⼰的实验结果与论⽂进⾏⽐较 相关⼯作:仔仔细细的看;这个⽅法是不是在某篇⽂章的基础上做的、与其他⽂章有什么关 系、借鉴了哪些⽅法、以及该领域之前是⽤什么⽅法、有哪些数据集是被其他⼈做过实验 的、其他⼈得到了什么效果;【related works】相关⽂章的题⽬ + ⾃⼰总结这篇⽂章与其他 相关⼯作的关系或区别。 ⚠ 时间:⼀个半⼩时;上述红⾊部分是笔记的记录内容;如果⽂章对于⾃⼰的难度较⼤,可以暂缓阅 读,等把⽂章中提到的概念、需要的基础知识补⼀下再回过头来看。 最后在总结了所有的论⽂后,再附⼀张纸:总结多少⽂章都在关注什么⽅⾯的内容,有多少⽂章在针对 某类技术、某个⽅向,⼤家都在研究什么。 ⚠ 整个过程中要思考 " :这个东⻄有没有价值、为什么⼤家都在做这些、你对他是什么看法。过⼏年 之后,回过头来,可以看到随着时间研究内容发⽣的变化。 将这些样本数据,转化为⾃⼰的记忆是⾮常重要的。 4.⽂献管理⼯具 Zotero : https://www.zotero.org/ (免费&跨平台) Mendeley : https://www.mendeley.com/ (免费&跨平台) Endnote :https://www.endnote.com Papers : https://www.papersapp.com/