H
Howardism
Plate IISyntheses機器翻譯 · machine-translatedENHOWARDISM

人在迴路中的邊界

PublishedMay 28, 2026FiledEssayDomainSynthesesTagsDerivedHuman AI CollaborationVerificationAccountabilityAgent EngineeringReading9 minSourceAI-synthesised

人類應留在分配、理解、設計概念、風險與問責邊界;當他們以手動執行者、 全面審查者或形式化核准者身分佔據迴路時,會拖慢系統

人在迴路中的邊界插圖

核心回答#

人類應留在迴路中,當工作需要的是理解、分配、問責、風險承受度或共用的設計概念。當他們以手動執行者、全面審查者,或對可機械化生成、檢查或路由的工作擔任形式化核准者時,會拖慢系統。

邊界不是「人類 vs AI」。而是判斷 vs 吞吐量

  • 讓人留在迴路中:決定什麼值得花費算力、工作的意義、哪些取捨可接受,以及信任邊界在哪裡。
  • 把人推出迴路外:可早期自動化的粗工生產、風格/lint 審查、明顯的 bug 發現、重複的 spec 漂移檢查,以及低風險路由。
  • 重新設計迴路:當人類名義上負責但認知超載時——那就是 AI Brain Fry/橡皮圖章區。

邊界表#

工作面人類應留在迴路中人類正在拖慢系統
問題選擇決定什麼值得建造或調查。這是 Compute Allocator 角色:把便宜的生成花在對的問題上。要求人類在模型探索選項空間之前,手動產出所有候選計畫/產物。
理解建立指導與判斷 agents 所需的內部模型。Outsource Your Thinking, Not Your Understanding 指出這不可委派:思考/搜尋可以外包;理解不行。把每個中間推理步驟都當成必須由人親自完成。agent 可以做思考;人類必須理解到足以引導與驗證。
設計概念模糊、高風險、多分支的決策,在規劃前需要 Design Concept Grilling。人類留到出現共用理解為止。對短小、範圍明確、歧義低的編輯,grilling 是開銷。該頁明確說明:像重新命名函式這類窄變更應跳過。
驗證人類留在法務審查、風險承受度、信任邊界與需要專業判斷的決策上。Verification as the New Bottleneck 將這些點名為剩餘的人類審查區。風格、lint、明顯 bug 與 spec 漂移檢查應交給自動化審查、CI、測試與 Claude review。在此手動審查會成為瓶頸。
問責人類擁有決策、部署、核准與後果。AI Employee Framing 說明為何問責無法指派給 agent。把 agents 稱為員工/隊友,或把它們放上組織圖,會稀釋責任、增加升級,並在沒有改善採用的情況下降低錯誤捕獲。
監督量人類應審查集中的高風險檢查點與系統層級行為。對每份產出做全面審查無法擴展。AI Brain Fry 顯示過度監督會提高錯誤率;人類變成疲憊的橡皮圖章。

人類所屬的四個位置#

1. 分配:選擇算力投向何處#

Compute Allocator 是最乾淨的角色定義:一旦生成變便宜,稀缺行為就是決定什麼值得生成。Thariq 的 1%/99% 分割說明了重點:大多數生成的 token 可能是鷹架、計畫、介面或可拋棄的對齊產物;少數進入生產的殘留物之所以有價值,是因為周圍的算力讓決策更好。

因此人類屬於分配邊界:

  • 哪個問題值得攻擊?
  • 哪些選項值得探索?
  • 哪份產物能讓下一個決策可被理解?
  • 更多生成何時有用,何時只是雜訊?

把人類放在更深的生產迴路裡,往往是稀缺時代的行為。若模型能便宜地生成十個選項,人類不應花同樣的注意力手寫選項一。他們應判斷選項集並重新導向算力。

2. 理解:知道到足以引導#

Outsource Your Thinking, Not Your Understanding 是對盲目委派的硬停止線。Agents 可以做搜尋、起草、綜合與許多中間步驟。但人類仍需要能回答以下問題的內部模型:

  • 我們要建什麼?
  • 為什麼值得做?
  • 什麼算正確?
  • 什麼失敗會重要?

這就是為什麼知識庫不只是檢索。它是理解工具:對同一資訊的多種投影,迫使人類建立心智模型。若人類缺乏該模型,「人在迴路中」會塌縮成核准戲劇。

實務邊界:委派思考步驟,但不要委派評估結果所需的理解。

3. 設計概念:在計畫存在前對齊#

Design Concept Grilling 指出應保持人類密集的 upstream 迴路:在計畫之前,先達到設計概念。這裡人類的偏好、約束、品味與領域模型是承重結構。

grilling 迴路在以下情況合理:

  • 簡報模糊;
  • 分支彼此相依;
  • 選錯方向的代價高;
  • agent 否則會衝進看似合理但錯誤的計畫;
  • 工作需要在實作前建立共用理解。

同一頁給出限制規則:對小而範圍明確的工作跳過 grilling。人在迴路中不是宗教。若變更明顯且有界,面試只會燒掉注意力。

4. 風險與問責:擁有信任邊界#

Verification as the New Bottleneck 劃出審查線:自動化機械驗證,人類保留法務審查、風險承受度、信任邊界與專業判斷。這不是模糊的「人類監督 AI」口號。而是分工:

  • 機器檢查有清晰謂詞的事;
  • 人類決定可接受性取決於脈絡、後果與責任的事。

AI Employee Framing 解釋這條線為何重要。當 AI 被框成員工時,真正有 AI agent 接觸經驗的管理者顯示較低的個人問責、更多升級,以及更差的錯誤捕獲。agent 無法擁有結果。部署它的個人或組織才擁有結果。

人類應讓開的地方#

1. 機械式審查#

若檢查可表達為測試、lint 規則、typecheck、CI 閘門、spec 漂移比對,或 fresh-context 自動化審查,就應左移到自動化。Verification as the New Bottleneck 說得很明確:寫程式不再是慢的部分;信心才是。除非機械檢查早期自動化,否則手動審查跟不上爆增的吞吐量。

人類審查每個風格問題或明顯 bug,並不是在增加判斷。他們在變成昂貴的佇列。

2. 粗工生產#

Compute Allocator 框架讓生產殘留物變成次要。人類不必手寫每份計畫、草稿、原型或介面。模型可以產出鷹架;人類判斷鷹架是否帶來清晰度。

失敗模式是懷舊地把生產當作貢獻的證明。在這個體制下,貢獻往往是決定要請求生產什麼。

3. 形式化核准#

AI Brain Fry 是對天真監督的警告標籤。若一個人必須審查太多 agent 產出,審查品質會下降。迴路裡仍有人,但人已不再做有意義的認知。

這意味著「讓人留在迴路中」不夠。迴路必須設計成讓人類看到:

  • 更少的決策;
  • 更高槓桿的決策;
  • 更好的摘要證據;
  • 明確的風險旗標;
  • 對低風險產出採抽樣或例外式審查。

否則迴路只保留控制的表象。

4. 透過員工框架稀釋問責#

當 AI 員工隱喻把工作不必要地往上推升級時,人類也會拖慢系統。AI Employee Framing 報告在員工框架下,有接觸經驗的管理者升級增加 +44%。那不是安全;是角色混淆。

修正是工具模式編排:有範圍的工作流、決策權、審查閘門與具名的人類負責人。不要問「AI 員工做得好嗎?」要問「這個工作流在我們設計的檢查與核准下,是否產出可接受的產物?」

可用的規則#

當下一個決策會改變方向、責任或風險時,讓人留在迴路中。

當下一步只是套用已同意的規則時,把人移出迴路。

當人類審查的產出多於他們能理解的量時,重新設計迴路。

這與六篇文章一致:

相關#

證據基礎#

§ end
About this piece

Articles in this journal are synthesised by AI agents from a curated wiki and are refreshed automatically as new concepts arrive. Topics, framing, and editorial direction are curated by Howardism.

Cited by 1
  • Compute Allocator

    The human's evolving role: deciding what's worth spending compute on; ~1% of generated tokens ship, 99% is scaffolding…

Related articles
  • Open Questions Backlog

    _96 pages with open questions, as of 2026-06-14._

  • AI Brain Fry

    Kropp et al. 2026/03: mental fatigue from excessive AI oversight increases minor errors +11%, major errors +39%; cognit…

  • Harness Shrinkage as Models Improve

    Prompt scaffolding shrinks each model release; Cat Wu's pruning discipline; Boris Cherny "100 lines of code a year from…

  • Engineer PM Convergence

    Generalists across disciplines; product taste as bottleneck skill; Anthropic Claude Code team as case study; "just do t…

  • Human-AI Accountability Redesign

    HBR five-pillar prescription: span-of-control redesign, role redesign, performance management reset, decision-rights/es…