高效學術論文閱讀:三遍掃描法
研究者一年花在讀論文上的時間,往往以「百小時」計算;但多數人從來沒有被正式教過怎麼讀。結果就是:花很多時間逐字啃完,卻依然說不清楚這篇到底貢獻了什麼、假設站不站得住、值不值得追下去。
本文把兩份筆記融合成一套可立即照做的流程:S. Keshav 的經典〈How to Read a Paper〉提出的 three-pass approach,加上李沐老師在教學中強調的「看圖表就能抓住方法與實驗」的實戰節奏。你不需要每篇都讀到第三遍;你需要的是知道什麼時候該停,以及停下來時已經得到可用的產出。
三遍掃描法的核心:越往後越貴
三遍不是規定動作,而是成本分層:
- 第一遍(5–10 分鐘):做海選,只求「鳥瞰」與「值不值得繼續」。
- 第二遍(30–60 分鐘):做精選,抓住方法、證據與對比,不陷入推導細節。
- 第三遍(1–5 小時):做研讀,嘗試「虛擬重做一遍」,把隱含假設與可複現路徑挖出來。
一個很實用的目標是:你在第一遍結束時就能拒讀;在第二遍結束時能對同學清楚轉述;在第三遍結束時能開始做研究或複現。
第一遍:5–10 分鐘的「海選」掃描
第一遍只做四件事(Keshav 版):
- 讀標題、摘要、導言(introduction)
- 掃小節標題與子標題(先不讀正文)
- 讀結論/討論(conclusion/discussion)
- 掃參考文獻(看到熟悉的就先在心裡打勾,陌生但頻繁出現的記下來)
做完後,強迫自己回答 Keshav 提的「五個 C」(Five Cs):
- Category(類型):這篇是量測?系統?分析?新方法?實作原型?
- Context(脈絡):它接在誰的工作後面?用到哪些理論或常見設定?
- Correctness(正確性):假設看起來合理嗎?設定是否偏離現實?
- Contributions(貢獻):它真正新增了什麼?是新方法、資料集、觀察,還是工程整合?
- Clarity(清晰度):寫得好不好?關鍵定義是否清楚?
第一遍的產出物(務必寫下來)
用 3–5 句話在筆記裡留下:
- 一句話總結:這篇在解什麼問題、用什麼方向解?
- 它厲害在哪:最關鍵的結果或亮點(可能是一張圖或一個表)
- 我是否繼續:不讀/讀第二遍/直接列為待複現
李沐老師版的提醒很重要:第一遍的任務是「判斷相關性」,不是「把它看懂」。
第二遍:30–60 分鐘的「精選」通讀
第二遍的原則是:沿著文章從頭到尾走一遍,但刻意忽略最細的證明與推導,把注意力放在「證據鏈」上。
你會做兩件事(Keshav + 李沐版融合):
- 把每一段在做什麼標一句話:導言在立題、方法在提方案、實驗在驗證、相關工作在定位。
- 把所有關鍵圖表讀懂:
- x 軸/y 軸在代表什麼?
- 每個點/每條線代表什麼設定?
- 是否有誤差棒、是否有對照組、是否有 ablation?
- 跟基線(baseline)差多少?差異是否穩定?
同時把「該補讀的引用」圈起來:
- 你看不懂的術語、設定、資料集,通常都在引用裡有來源。
- 若文章太難,先去讀它引用的「前置關鍵工作」,門檻常常更低。
第二遍的產出物(務必寫下來)
第二遍結束後,你應該能在不看稿的情況下講清楚:
- 問題定義:輸入/輸出、評估指標、限制條件
- 方法輪廓:方法由哪幾個模組組成?每個模組解決什麼?
- 證據摘要:哪三張圖/哪兩個表最能支持它的主張?
- 失敗與限制:作者承認的限制是什麼?你覺得漏掉了什麼?
第三遍:用「虛擬重做一遍」吃透細節
Keshav 對第三遍的定義非常精準:假裝你要重做作者做的事。你不一定真的寫程式,但你要在腦中走完:
- 如果我用同樣假設與資料,我要怎麼把實驗跑出來?
- 哪些細節沒寫清楚、需要猜?
- 哪些地方看似理所當然,其實是關鍵假設?
李沐老師版的表述更直白:第三遍要做到「知道每一句話在幹嘛」,並能提出:
- 如果換成我來做:我會怎麼實作?怎麼設計對照組?
- 能不能更好:哪些地方可能改動後更強?哪些地方其實不穩?
第三遍的產出物(務必寫下來)
建議固定輸出三個區塊:
- 可複現清單:資料、前處理、模型、訓練細節、超參數、硬體、評估
- 假設清單:每個關鍵結論依賴哪些假設?假設在你的場景成立嗎?
- 後續工作點子:2–5 個「我可以延伸」的方向(越具體越好)
一頁式檢查清單(可直接複製)
第一遍(5–10 分鐘)
- 我能用一句話說出這篇在解什麼問題
- 我能說出它的三個關鍵詞(方法/資料/任務)
- 我能指出它的主要貢獻(不是結果)
- 我知道我為什麼要讀/不讀第二遍
第二遍(30–60 分鐘)
- 我能畫出方法的流程(哪怕是方塊圖)
- 我讀懂每張關鍵圖表的 x/y 軸與對照組
- 我能用 1 分鐘向別人解釋實驗設計
- 我圈出 1–5 篇必補讀的引用
第三遍(1–5 小時)
- 我能列出完整複現步驟與缺失資訊
- 我能指出至少 3 個隱含假設或可能漏洞
- 我能提出至少 2 個具體改進或延伸實驗
用三遍法做文獻綜述:先收斂,再擴張
Keshav 也把三遍法延伸到文獻綜述(literature survey)。簡化成可操作版本是:
- 先找 3–5 篇最新且相關的論文:每篇只做第一遍,快速判斷研究地圖。
- 讀它們的 related work:找反覆出現的引用與作者姓名。
- 收斂出「關鍵論文集合」:把重複被引用的那幾篇列為第二遍/第三遍候選。
- 必要時迭代:如果你發現大家都在引用某篇你沒讀過的工作,就把它加入清單並補第一遍。
這個流程的好處是:你不會一開始就淹沒在細節,而是先拿到「地圖」,再決定鑽哪個洞。
小結:三遍法真正解決的是「注意力分配」
三遍掃描法不是更快把每篇讀完,而是更快把時間花在值得的地方:
- 第一遍幫你拒絕不重要的。
- 第二遍幫你抓住證據鏈。
- 第三遍幫你把它變成可用的研究材料。
如果你願意只做一個改變:從下一篇論文開始,先用 10 分鐘做第一遍,並且強迫自己寫下「五個 C」與「是否繼續」。你會立刻感覺到讀文獻的阻力下降很多。
原始出處
- S. Keshav. How to Read a Paper.(提出 three-pass approach 與 Five Cs)
- 李沐老師如何讀論文