研究品味作為人類的瓶頸

資料來源#

When AI builds itself

摘要#

隨著 AI 吸收了 AI 開發的執行工作（AI Accelerating AI Development），人類角色逐漸收窄至一個殘餘地帶——When AI builds itself 這篇文章稱之為研究品味與判斷：「選擇哪些問題重要、哪些結果值得信任、以及某個方法何時走入死胡同。」這是自主性階梯的最高一階，也是那唯一一項能力：只要它仍掌握在人類手中，就能讓 recursive self-improvement 無法閉合迴圈。它是否仍掌握在人類手中，正是這篇文章承重的不確定性。

逐漸收窄的角色#

這篇文章對此動態最清楚的陳述是：「在 AI 開發流程的每一步，人類角色都在收窄。」兩個具體的收窄：

寫程式 → 審查程式。「一旦人類與 AI 撰寫的程式碼品質達到對等，人類將完全停止寫程式，轉為只做審查。」（文中說對等大約是現在；見 AI Accelerating AI Development。）這就是從人類這一側講述的 harness-shrinkage 故事。
執行實驗 → 選擇實驗。「一旦 Claude 能夠執行實驗，問題就轉向『這些實驗中哪一個值得跑？』」那個動手做——寫程式、跑實驗、產出結果——「現在幾乎不花任何人類時間，即使它仍然有 compute 上的成本。」

人類「目前」殘餘的比較優勢就是品味：決定什麼值得花 compute。用 Compute Allocator 的語彙來說，人類成為一個 compute 分配者，但層級是在整個研究計畫的尺度，而非單次呼叫。

為什麼它可能不會一直屬於人類——「另一種能力而已」#

這篇文章拒絕把研究品味視為人類永久的護城河。有兩個論點與此相抗：

汗水是可以自動化的，而那正是絕大部分的工作。 天才是「1% 的靈感加上 99% 的汗水」；那 99%——把規模拉大、看看哪裡壞掉、修好、再試一次——正是 Claude 擅長的。大規模的研究進展「主要是工具與資源的函數」。（見 The Bitter Lesson、Recursive Self-Improvement。）
品味呈現出與其他一切相同的能力曲線。 研究判斷力正在提升的早期證據——在艱難的轉折時刻，Claude 以 51%→64% 勝過人類對下一步的選擇（AI Accelerating AI Development）——暗示著「研究品味也許只是 AI 系統一時做不好、之後就學會做好的另一種 AI 能力」。先例是：AI 曾經不擅長、後來變得擅長解釋一個笑話為什麼好笑、展現心智理論、以及解開語言謎題——這些都是被假定為人類專屬的質性技能。這是 Jagged Intelligence (Ghosts, Not Animals) 樂觀的一面：今日的低谷就是明日的高峰。

誠實的反駁，用一位 Anthropic 員工的話來說：「人類目前的比較優勢，仍然在於看見更大的全局、以及在當下任務的框限之外思考。」問題在於，「目前」究竟是一個穩定的均衡，還是一條不斷後退的邊界。

無論如何都是瓶頸#

即使品味仍由人類掌握，它也會成為那個綁定限制——整條管線的 Amdahl's-law bottleneck。如果人類無法以 Claude 生成程式碼的速度去審查它，「人類審查就會成為 AI 開發的瓶頸」。而如果人類把大部分時間花在設定方向這個僅佔個位數百分比的工作上，每個人就駕馭著遠遠更多的工作量——於是人類判斷的品質與吞吐量成了稀缺資源，正如 Verification as the New Bottleneck 對驗證的預測、以及 HBR 那項問責制重新設計的研究對監督的預測。風險在於，人類名義上做決定，實際上卻只是橡皮圖章（那個 "not close to substituting for senior researchers" 判斷，悄悄地侵蝕成一種形式）。

人的代價（更安靜的那條線）#

這篇文章收錄了一些異常坦率的員工自述，談這種收窄感覺起來是什麼樣子——值得記錄下來，因為它們點出了生產力圖表所沒有顯示的代價：

小忙的禮物經濟崩解了：請同事「你能幫我把這個腳本跑起來嗎？」「會製造一點點虧欠、一點點彼此的覺察。[Claude] 速度更快、它製造零虧欠，但這每一次都是一個錯失的、向人類協作發出的邀請。」
那種「相關性取決於偶然」的暈眩感：「在一切順利的日子裡，我忍不住會想，我做的一切都無關緊要……但接著總有些日子，一切都壞掉、我搞不懂為什麼，然後我意識到，我根本不知道自己這陣子到底在幹嘛。」

開放問題#

研究品味是一個真正的天花板（一種規模擴展觸及不到的架構性能力），還是下一個有待填平的鋸齒狀低谷？這篇文章稱之為決定性的未知數。
如果品味是可以自動化的，那麼在 AI 開發中——如果還有的話——什麼才是人類持久的比較優勢？
你要如何衡量橡皮圖章行為？「人類設定方向」可以在紙面上為真，而真正的判斷卻悄悄轉移給了模型。

資料來源#

When AI builds itself — §"What might the future of work at Anthropic look like?" 與 §"What if we're wrong?"

研究品味作為人類的瓶頸

資料來源#

摘要#

逐漸收窄的角色#

為什麼它可能不會一直屬於人類——「另一種能力而已」#

無論如何都是瓶頸#

人的代價（更安靜的那條線）#

相關#

開放問題#

資料來源#