資料來源#
摘要#
Andrej Karpathy 在 2025 年創造了「vibe coding」一詞,一年後,他為其嚴肅的後繼者命名:agentic engineering。兩者的區別在於哪一道門檻在移動。vibe coding 抬高了下限——現在任何人都能開發軟體。agentic engineering 則在大幅加速的同時守住專業軟體的品質標準:「你不被允許因為 vibe coding 而引入漏洞;你依然要為自己的軟體負責,但你能不能更快——而且要如何正確地做到?」它是一門工程紀律,用於協調這些能力參差、易出錯、雖具隨機性卻威力強大的代理,同時不犧牲品質。
兩道門檻#
- vibe coding——抬高下限。 每個人都能對任何東西 vibe-code。「太神奇了,難以置信。」這是一種民主化(參見 Printing Press Software Democratization)。重點不在品質,而在取用門檻。
- agentic engineering——抬高上限,守住品質。 你保留專業軟體的各項責任(安全性、正確性、可維護性),並運用代理來加速,而不跌破那道標準。「把這件事做好、做對,正是 agentic engineering 的領域。」
這是兩種不同的活動,而非同一條線上的兩個點。一個降低進入成本;另一個則為那些已經跨過門檻的人抬高產出的上限。
「10x 不是你獲得的加速」#
Karpathy 明確地將舊有的「10x 工程師」說法當作太小家子氣而予以淘汰:「10x 不是你獲得的加速……非常擅長此道的人,巔峰遠不止 10x。」agentic engineering 能力的上限非常高,而平庸者與 AI-native 實踐者之間的差距是在擴大,而非縮小。(呼應 Harness Shrinkage as Models Improve:隨著模型進步,槓桿持續增長;具約束力的限制變成了操作者的品味——參見 Outsource Your Thinking, Not Your Understanding。)
AI-native 實踐者長什麼樣#
當被要求對比一個平庸的、與一個完全 AI-native 的 cloud code / codex / open claw 使用者時,Karpathy 的回答平淡卻重要:投資於你的設定,用盡工具的所有功能。 這跟那些把 Vim 或 VS Code 用到極致的工程師如出一轍——如今則套用到 Claude Code / Codex 上。精通的關鍵在於對設定與功能的嫻熟,而不是某個秘密的提示詞。
招募必須重構#
一個實務上的推論:大多數團隊仍以舊典範招募(益智題、leetcode)。Karpathy 主張,agentic engineering 的招募應該長成這樣:「給我一個非常大的專案,然後看著某人把它好好實作出來」——例如,打造一個安全的「給代理用的 Twitter 仿製品」,接著由一個 red-team 代理(「codex 5.4 xhigh」)嘗試攻破它,卻攻不破。招募應該測試可驗證的、端到端的建構與防禦能力,而不是孤立的解謎。(參見 The Verifiability Thesis,了解為何「而且它攻不破」才是真正承重的那一半。)
人類的殘留部分#
即便在如此高的上限下,人類仍然掌管著 spec、品味、判斷與監督——代理負責填空的部分。他的 MenuGen 戰爭故事:那個代理是以電子郵件地址、而非一個持久的使用者 ID 來比對 Stripe 與 Google 帳號——「這做法真是怪」,正是 Jagged Intelligence (Ghosts, Not Animals) 所預測的那種錯誤。你必須設計好 spec(「這些必須是我們把一切都繫在上面的唯一使用者 ID」),並提供品味;代理則處理那些你已不再記誦的 API 細節。
相關連結#
- Building Is Cheap, Arguing Is Expensive —— 廉價的生成正是讓原型得以了結技術爭論的關鍵
- Andrej Karpathy —— 兩個術語都是他創造的
- Software 3.0 —— 兩種活動都在其中運作的典範
- Jagged Intelligence (Ghosts, Not Animals) —— 為何 agentic engineering 需要人類監督:代理會犯下古怪、參差的錯誤
- The Verifiability Thesis —— 這門紀律倚賴可驗證的建構與防禦任務
- Outsource Your Thinking, Not Your Understanding —— 品味/判斷/spec 是這門紀律所仰賴的、殘留的人類瓶頸
- Harness Shrinkage as Models Improve —— 隨著模型進步而呈現的「>10x and widening」槓桿曲線
- Printing Press Software Democratization —— 抬高下限的那一半,正是 Boris Cherny 所描述的同一種民主化
- Claude Code Best Practices —— 具體的 agentic engineering 實踐(explore→plan→code,以驗證為驅動)
- Verification as the New Bottleneck —— Fiona Fung 對「在加速的同時守住品質標準」的組織層面闡述
- Claude Code —— 這一切上演的場域
開放問題#
- Karpathy 暗示對創辦人而言有「一個非常[有價值]的領域」,但不願明說是哪一個(他不想「在台上含糊發文」)。他所指向的,是哪一個可驗證的 RL-environment 領域?
- 如果平庸者/AI-native 之間的差距持續擴大,這對團隊組成會有什麼影響——是少數幾位極端的異數加上代理,還是廣泛的中階人力配置?
資料來源#
Cited by 13
- Andrej Karpathy
Co-founder OpenAI, ex-Tesla AI, Eureka Labs; coined "vibe coding," Software 1/2/3.0, "ghosts not animals," "agentic eng…
- Boris Cherny
Creator of Claude Code at Anthropic; phone-driven workflow with hundreds of agents; primary advocate of `/loop` primiti…
- Building Is Cheap, Arguing Is Expensive
"In technical debate, code wins": generate three PRs vs whiteboard; prototype over design doc; reduce design docs
- Claude Code
Anthropic's agentic coding product; created by Boris Cherny late 2024; TypeScript/React; CLI/desktop/web/mobile/IDE sur…
- Claude Design
Anthropic Labs product (research preview, ~April 2026) for collaborating with Claude on polished visual artifacts — des…
- Harness Shrinkage as Models Improve
Prompt scaffolding shrinks each model release; Cat Wu's pruning discipline; Boris Cherny "100 lines of code a year from…
- Jagged Intelligence (Ghosts, Not Animals)
"Ghosts not animals": jagged statistical circuits, no intrinsic motivation; car-wash/strawberry failures; stay in the l…
- AI Engineering & Agent Tooling
Map of Content for the ai-engineering domain — 36 concepts. Curated entry point; see Home for all domains.
- Open Questions Backlog
_96 pages with open questions, as of 2026-06-14._
- Outsource Your Thinking, Not Your Understanding
"You can outsource your thinking but not your understanding"; understanding as the non-delegable human bottleneck; know…
- Printing Press Software Democratization
Boris Cherny's analogy: 1400s literacy expansion → AI software-writing expansion; domain knowledge displaces coding ski…
- Software 3.0
Karpathy's taxonomy: 1.0 code, 2.0 weights, 3.0 prompting; LLM as programmable interpreter; MenuGen "shouldn't exist";…
- The Verifiability Thesis
LLMs automate what you can *verify* as computers automate what you can *specify*; RL verification rewards → jagged peak…
Related articles
- Compute Allocator
The human's evolving role: deciding what's worth spending compute on; ~1% of generated tokens ship, 99% is scaffolding…
- Andrej Karpathy
Co-founder OpenAI, ex-Tesla AI, Eureka Labs; coined "vibe coding," Software 1/2/3.0, "ghosts not animals," "agentic eng…
- Disposable Micro-Apps
Throwaway custom UIs built per-task to edit a plan ("micro-software on top of micro-software"); copy-back-to-markdown;…
- Boris Cherny
Creator of Claude Code at Anthropic; phone-driven workflow with hundreds of agents; primary advocate of `/loop` primiti…
- Claude Code
Anthropic's agentic coding product; created by Boris Cherny late 2024; TypeScript/React; CLI/desktop/web/mobile/IDE sur…
