核心回答#
人類應留在迴路中,當工作需要的是理解、分配、問責、風險承受度或共用的設計概念。當他們以手動執行者、全面審查者,或對可機械化生成、檢查或路由的工作擔任形式化核准者時,會拖慢系統。
邊界不是「人類 vs AI」。而是判斷 vs 吞吐量:
- 讓人留在迴路中:決定什麼值得花費算力、工作的意義、哪些取捨可接受,以及信任邊界在哪裡。
- 把人推出迴路外:可早期自動化的粗工生產、風格/lint 審查、明顯的 bug 發現、重複的 spec 漂移檢查,以及低風險路由。
- 重新設計迴路:當人類名義上負責但認知超載時——那就是 AI Brain Fry/橡皮圖章區。
邊界表#
| 工作面 | 人類應留在迴路中 | 人類正在拖慢系統 |
|---|---|---|
| 問題選擇 | 決定什麼值得建造或調查。這是 Compute Allocator 角色:把便宜的生成花在對的問題上。 | 要求人類在模型探索選項空間之前,手動產出所有候選計畫/產物。 |
| 理解 | 建立指導與判斷 agents 所需的內部模型。Outsource Your Thinking, Not Your Understanding 指出這不可委派:思考/搜尋可以外包;理解不行。 | 把每個中間推理步驟都當成必須由人親自完成。agent 可以做思考;人類必須理解到足以引導與驗證。 |
| 設計概念 | 模糊、高風險、多分支的決策,在規劃前需要 Design Concept Grilling。人類留到出現共用理解為止。 | 對短小、範圍明確、歧義低的編輯,grilling 是開銷。該頁明確說明:像重新命名函式這類窄變更應跳過。 |
| 驗證 | 人類留在法務審查、風險承受度、信任邊界與需要專業判斷的決策上。Verification as the New Bottleneck 將這些點名為剩餘的人類審查區。 | 風格、lint、明顯 bug 與 spec 漂移檢查應交給自動化審查、CI、測試與 Claude review。在此手動審查會成為瓶頸。 |
| 問責 | 人類擁有決策、部署、核准與後果。AI Employee Framing 說明為何問責無法指派給 agent。 | 把 agents 稱為員工/隊友,或把它們放上組織圖,會稀釋責任、增加升級,並在沒有改善採用的情況下降低錯誤捕獲。 |
| 監督量 | 人類應審查集中的高風險檢查點與系統層級行為。 | 對每份產出做全面審查無法擴展。AI Brain Fry 顯示過度監督會提高錯誤率;人類變成疲憊的橡皮圖章。 |
人類所屬的四個位置#
1. 分配:選擇算力投向何處#
Compute Allocator 是最乾淨的角色定義:一旦生成變便宜,稀缺行為就是決定什麼值得生成。Thariq 的 1%/99% 分割說明了重點:大多數生成的 token 可能是鷹架、計畫、介面或可拋棄的對齊產物;少數進入生產的殘留物之所以有價值,是因為周圍的算力讓決策更好。
因此人類屬於分配邊界:
- 哪個問題值得攻擊?
- 哪些選項值得探索?
- 哪份產物能讓下一個決策可被理解?
- 更多生成何時有用,何時只是雜訊?
把人類放在更深的生產迴路裡,往往是稀缺時代的行為。若模型能便宜地生成十個選項,人類不應花同樣的注意力手寫選項一。他們應判斷選項集並重新導向算力。
2. 理解:知道到足以引導#
Outsource Your Thinking, Not Your Understanding 是對盲目委派的硬停止線。Agents 可以做搜尋、起草、綜合與許多中間步驟。但人類仍需要能回答以下問題的內部模型:
- 我們要建什麼?
- 為什麼值得做?
- 什麼算正確?
- 什麼失敗會重要?
這就是為什麼知識庫不只是檢索。它是理解工具:對同一資訊的多種投影,迫使人類建立心智模型。若人類缺乏該模型,「人在迴路中」會塌縮成核准戲劇。
實務邊界:委派思考步驟,但不要委派評估結果所需的理解。
3. 設計概念:在計畫存在前對齊#
Design Concept Grilling 指出應保持人類密集的 upstream 迴路:在計畫之前,先達到設計概念。這裡人類的偏好、約束、品味與領域模型是承重結構。
grilling 迴路在以下情況合理:
- 簡報模糊;
- 分支彼此相依;
- 選錯方向的代價高;
- agent 否則會衝進看似合理但錯誤的計畫;
- 工作需要在實作前建立共用理解。
同一頁給出限制規則:對小而範圍明確的工作跳過 grilling。人在迴路中不是宗教。若變更明顯且有界,面試只會燒掉注意力。
4. 風險與問責:擁有信任邊界#
Verification as the New Bottleneck 劃出審查線:自動化機械驗證,人類保留法務審查、風險承受度、信任邊界與專業判斷。這不是模糊的「人類監督 AI」口號。而是分工:
- 機器檢查有清晰謂詞的事;
- 人類決定可接受性取決於脈絡、後果與責任的事。
AI Employee Framing 解釋這條線為何重要。當 AI 被框成員工時,真正有 AI agent 接觸經驗的管理者顯示較低的個人問責、更多升級,以及更差的錯誤捕獲。agent 無法擁有結果。部署它的個人或組織才擁有結果。
人類應讓開的地方#
1. 機械式審查#
若檢查可表達為測試、lint 規則、typecheck、CI 閘門、spec 漂移比對,或 fresh-context 自動化審查,就應左移到自動化。Verification as the New Bottleneck 說得很明確:寫程式不再是慢的部分;信心才是。除非機械檢查早期自動化,否則手動審查跟不上爆增的吞吐量。
人類審查每個風格問題或明顯 bug,並不是在增加判斷。他們在變成昂貴的佇列。
2. 粗工生產#
Compute Allocator 框架讓生產殘留物變成次要。人類不必手寫每份計畫、草稿、原型或介面。模型可以產出鷹架;人類判斷鷹架是否帶來清晰度。
失敗模式是懷舊地把生產當作貢獻的證明。在這個體制下,貢獻往往是決定要請求生產什麼。
3. 形式化核准#
AI Brain Fry 是對天真監督的警告標籤。若一個人必須審查太多 agent 產出,審查品質會下降。迴路裡仍有人,但人已不再做有意義的認知。
這意味著「讓人留在迴路中」不夠。迴路必須設計成讓人類看到:
- 更少的決策;
- 更高槓桿的決策;
- 更好的摘要證據;
- 明確的風險旗標;
- 對低風險產出採抽樣或例外式審查。
否則迴路只保留控制的表象。
4. 透過員工框架稀釋問責#
當 AI 員工隱喻把工作不必要地往上推升級時,人類也會拖慢系統。AI Employee Framing 報告在員工框架下,有接觸經驗的管理者升級增加 +44%。那不是安全;是角色混淆。
修正是工具模式編排:有範圍的工作流、決策權、審查閘門與具名的人類負責人。不要問「AI 員工做得好嗎?」要問「這個工作流在我們設計的檢查與核准下,是否產出可接受的產物?」
可用的規則#
當下一個決策會改變方向、責任或風險時,讓人留在迴路中。
當下一步只是套用已同意的規則時,把人移出迴路。
當人類審查的產出多於他們能理解的量時,重新設計迴路。
這與六篇文章一致:
- Compute Allocator 說人類分配稀缺的注意力與豐沛的算力。
- Outsource Your Thinking, Not Your Understanding 說人類無法委派分配良好所需的心智模型。
- Design Concept Grilling 說模糊工作在規劃前需要人類對齊。
- Verification as the New Bottleneck 說正確性信心現在是瓶頸,因此機械驗證必須自動化,人類審查保留給信任邊界。
- AI Brain Fry 說天真的監督在量上會崩潰。
- AI Employee Framing 說把 agent 當員工的語言會損害問責與審查品質,卻無法改善採用。
相關#
- Orchestration vs Employee Framing: Reconciling the Founder's Playbook with HBR's Accountability Evidence —— 將編排(工作流設計)與員工隱喻分開。
- Does the Human-Facing Harness (HTML Artifacts) Hit Its Own Bloat Ceiling? —— 關於有限人類注意力天花板的伴隨分析。
- Human-AI Accountability Redesign —— HBR 證據所隱含的組織層級重新設計。
- Evals as Product Spec —— 把人類判斷轉成可執行的 evaluation 產物。
- Claude Code Auto Mode —— 權限層範例:把例行決策移出人在迴路,同時保留高風險閘門。
證據基礎#
Cited by 1
- Compute Allocator
The human's evolving role: deciding what's worth spending compute on; ~1% of generated tokens ship, 99% is scaffolding…
Related articles
- Open Questions Backlog
_96 pages with open questions, as of 2026-06-14._
- AI Brain Fry
Kropp et al. 2026/03: mental fatigue from excessive AI oversight increases minor errors +11%, major errors +39%; cognit…
- Harness Shrinkage as Models Improve
Prompt scaffolding shrinks each model release; Cat Wu's pruning discipline; Boris Cherny "100 lines of code a year from…
- Engineer PM Convergence
Generalists across disciplines; product taste as bottleneck skill; Anthropic Claude Code team as case study; "just do t…
- Human-AI Accountability Redesign
HBR five-pillar prescription: span-of-control redesign, role redesign, performance management reset, decision-rights/es…
