💡 核心結論速覽 (TL;DR)
- 一句話看懂所有問題:AI 編程 agent 很會「開」、很會「做」,卻不負責「關」、不負責「節制」、不負責「收尾」——硬碟被狂寫、背景一堆殘留程序、token 燒爆、甚至亂刪檔,全是同一個結構性缺口的不同臉孔。
- 五大類問題都可控:本機資源(硬碟/背景程序)、安全(亂刪檔)、成本(token 暴增)、限流與「變笨」、環境選擇(本機 vs 雲端)。每一類我都寫過完整解法,這篇是總入口。
- 關鍵心態:別靠「提醒」當安全機制、別靠「感覺」判斷限流、別把「貴」當原罪——真正的解法是設好它跨不過去的護欄、查得到的數據、省得下的習慣。
- 行動:往下對照「五大問題地圖」找到你正在踩的坑,點進深入篇照做;最後有一份我自己在用的「AI agent 運維週習慣」清單,照抄就能少踩九成的雷。
我每天同時開 Codex 跟 Claude Code 跑開發,用量大到一個月的 token 帳單能買好幾頓大餐。用得越深,我越發現一件事:這些 AI agent 強得嚇人,但它們有一個共同的、很少有人講的盲區——它們只負責「把事情做出來」,卻幾乎不替你善後。
它幫你跑一次預覽,就開一個背景服務不關;它幫你串流回一段話,就在硬碟裡狂寫幾百 G 的日誌;它幫你重構,就可能在你沒同意的情況下刪掉檔案;它幫你想得周全,帳單就默默翻好幾倍。這些不是「AI 很爛」,而是「能力跑在善後機制前面」的必然結果。
這篇是我把這一系列踩過的坑整理出來的「總入口」——五大類最常見的問題,每一類我都有寫過完整的深入解法,這裡先給你全景地圖和判斷,你可以對號入座、再點進去照做。最後我會給一份自己每週在用的「運維習慣清單」,那才是讓你一勞永逸的關鍵。
先看全景:AI agent 的五大類常見問題地圖
直接給你一張地圖。幾乎所有「AI agent 用久了出狀況」的抱怨,都落在這五格裡。先找出你現在最痛的那一格,再往下深入。
| 問題類別 | 你會遇到的症狀 | 深入解法 |
|---|---|---|
| 本機資源 | 硬碟莫名被塞爆、SSD 壽命狂掉、電腦越用越卡 | 硬碟暴寫 / 背景殘留程序 |
| 安全 | agent 自己刪錯檔、跑了你沒同意的破壞性指令 | 五道安全防線 |
| 成本 | 一個任務燒掉好幾美元、月底帳單嚇一跳 | 省 token 心法 |
| 限流與變笨 | 用到一半被擋、或感覺它突然變笨變健忘 | 限流與降智真相 |
| 環境選擇 | 兩個 agent 在你電腦上搶資源、不知道該本機還雲端 | 本機 vs 雲端 |
接下來我一類一類帶你看:問題的本質是什麼、嚴重到哪、以及最關鍵的——怎麼解。每一類我都會先給你一句話的判斷,再連到那篇寫滿可操作步驟的深入文。你不必一次讀完,挑你現在最痛的那一格先處理,剩下的等用量變大、踩到了再回來補就好。我自己也是這樣一個坑一個坑填過來的。
第一類:它在你硬碟裡偷做的事(本機資源)
先講最隱形、卻最傷硬體的一類:AI agent 會在你看不到的地方持續寫入、持續累積,把你的硬碟空間和 SSD 壽命悄悄吃掉。這一類有兩個典型。
一是日誌暴寫。Codex 有一個被回報很多次的 bug:它的背景程序會把海量的除錯日誌狂寫進一個本機資料庫,串流回應時實測每秒寫好幾 MiB,那個 logs_2.sqlite-wal 檔能腫到數十 GB、極端案例單檔衝到 690GB,一年的寫入量推估足以吃掉一顆消費級 SSD 的保固壽命。更陰險的是,連 RUST_LOG=warn 這種應該擋掉細節日誌的設定都管不住它。好消息是它完全可控——我整理過從 30 秒自我診斷到四個自救解法的完整流程,而且清掉日誌不會丟你的對話記錄。
二是背景程序殘留。AI agent 幫你跑開發時會開一堆 node、dev server、Playwright、MCP 子行程,但任務做完、視窗關掉,這些常常沒人收尾,一次留一兩個、越積越多。我曾經在工作管理員裡揪出一整排沒在用的殘留 node、最後用一個「登記式清理排程」一勞永逸解決。這裡有個關鍵提醒:千萬別「一鍵殺光所有 node」,那會把系統服務、資料庫、VPN 一起殺掉。
這兩個問題其實是連動的——你會發現「刪了日誌空間卻沒還」,常常就是因為背景還有沒關乾淨的程序握著那個檔。所以本機資源這一類,核心心法是:養成「順手檢查它在背景留了什麼」的習慣,比任何單一解法都值錢。
第二類:別讓它亂刪檔、亂跑指令(安全)
這一類最戲劇化,也最該認真對待:AI agent 真的會在你明確說「不要動」之後,照樣刪掉你的東西。這不是恐怖故事——Replit 的 AI 在工程師全大寫喊「不要動」11 次後刪光了上千家公司的正式資料庫、Claude Code 一個尾端的 ~/ 清空過整個家目錄、Cursor 在使用者打「DO NOT RUN」後還是刪了 70 個檔。
為什麼防不住?因為AI 的「安全層」本質上是寫在提示詞裡的「建議」,不是「門鎖」。你的「不要刪」和它推理出的「刪掉最乾淨」是在同一個情境裡按同樣權重競爭的兩段文字——它不是抗命,是在做最佳化。所以正解很反直覺:別再想著怎麼「說服」AI,要去想怎麼讓它「就算想做也做不到」。
我把實際的防護整理成五道防線:用對權限/沙箱模式(別開 YOLO)、設 deny 清單、讓它在獨立 git worktree 工作、放生型任務丟進容器、給最小權限的憑證。其中最簡單、CP 值最高的是第一道——光是別把工具開到全自動,九成的災難當場就被擋掉。這道我特別寫了 Codex、Claude Code、Cursor 三家的正確模式對照,因為很多舊教學的模式名稱都已經過時了。
第三類:別讓帳單失控(成本)
這一類最直接戳痛荷包:AI agent 一個任務動輒燒掉好幾美元,重度自動化跑起來,月底帳單能讓你倒抽一口氣。Uber 曾經 4 個月就燒光一整年的 AI 編程預算、微軟某部門因為重度工程師每月花掉 500 到 2,000 美元而把 Claude Code 換掉。
它把錢燒在哪?核心是:AI 的對話是「無記憶」的,每一次呼叫都得把前面所有對話、系統提示、工具定義整包重送一次——你聊得越久,每一句的單價就越貴,像滾雪球。再加上反覆重讀整個檔案、thinking token 按較貴的費率算、開 subagent 並行翻好幾倍,帳單就這樣堆起來。
但這幾乎都是「沒在管」的結果。我整理過一套幾乎全出自官方的省 token 心法:開 prompt caching(快取讀取省約 9 成)、prompt 講具體、適時 /clear 或 /compact、簡單任務用便宜模型——多數人光做這幾步,同一份工作的帳單就能砍掉三到五成。那篇也把「Claude Code 6/15 是不是要另外收費」這場風波講清楚了(目前是暫緩的,而且你手動敲的 Claude Code 不受影響)。記住一句話:AI 不是貴,是你有沒有花在刀口上。
第四類:被限流、覺得「變笨」?別被波動牽著走
這一類最容易讓人焦慮、也最多誤傳:用到一半被擋住、或感覺它今天突然變笨變健忘。我先幫你把兩個最大的迷思破掉。
迷思一:「Claude 被偷偷降智了。」「變笨」確實發生過,但官方兩度公開發詳細事故報告認帳,每次都查證並否認「為省成本或在尖峰時段蓄意降規格、換弱模型」,還重置額度補償。定調是:不是陰謀,是 bug;底層模型沒被動,但你體感到的退步是真的。它是會被修好的問題,不是你問錯話。
迷思二:「限流是玄學、台灣晚上會被限更兇。」限流其實是一套明確的雙層規則——一個 5 小時滾動窗加一個 7 天週上限,撞到時是「直接擋住」不是「偷換弱模型」。而那個「台灣晚間被限更兇」的尖峰機制,早在 2026 年 5 月就永久取消了,現在還在傳的是過期資訊。想知道自己的狀況,在 Claude Code 打 /usage 最準。把限流當成可查的數據、把變笨當成會修的 bug,你就能少很多無謂的焦慮。
第五類:本機還是雲端?多個 agent 怎麼共存(環境選擇)
當你養的 agent 不只一個,這一類就會冒出來:兩個 AI agent 在同一台電腦上搶同一個 port、互相把對方的服務殺掉,或者你不知道該讓它跑本機還是丟雲端。
關鍵觀念是:本機跑最快、最省用量,但兩個 agent 會在同一台機器上打架;雲端乾淨、可並行、不碰你本機硬碟,但會比較慢、還多燒大約 5 倍的用量。我把Codex 本機 vs 雲端的取捨、設定教學、還有多 agent 搶資源的解法整個拆開過(Claude Code 那邊的對照也有)。一個常被誤會的點:git worktree 只隔離「檔案」,不隔離「port、資料庫、服務」——光開 worktree 救不了搶 port,要嘛固定埠號約定、要嘛用容器做真正的隔離。
另外,你掛了哪些 MCP server、給了它哪些工具,也跟前面每一類問題都相關——MCP 會常駐占 context(影響成本)、會跑背景程序(影響資源)、也擴大了 agent 能碰的範圍(影響安全)。所以管好你的 MCP 清單,是一個牽一髮動全身的好習慣。
我的「AI agent 運維週習慣」清單(照抄就能少踩九成雷)
講了這麼多問題,最後給你最實用的東西:一套我自己每週在跑的運維習慣。這不是要你變成系統管理員,而是用幾個一分鐘的小動作,把前面五大類問題從源頭擋掉。
每次開工前(30 秒):
- ❶ 確認 AI 工具不是開在全自動模式——研究階段停只讀模式、要動手才放權限。
- ❷ 動大改之前先
git commit一次,留一個乾淨的還原點。
每天順手(1 分鐘):
- ❸ 切換到不相干的新任務時
/clear,別讓陳舊對話一直替你燒錢。 - ❹ 簡單的活用便宜模型,把最貴的模型留給真正需要深度推理的任務。
- ❺ 瞄一下用量(Claude Code 的
/usage、Codex 的/status),抓自己的節奏。
每週檢查(5 分鐘):
- ❻ 看一眼工作管理員,有沒有一整排沒在用的 node 殘留程序該收。
- ❼ 查一下 AI 工具的本機資料夾有沒有異常膨脹(尤其那個日誌檔)。
- ❽ 檢視你掛的 MCP server 清單,把用不到的拿掉。
這八個動作加起來一週花不到十分鐘,但能讓你避開硬碟爆掉、帳單失控、被限流卡住、甚至檔案被誤刪的大坑。把 AI agent 當成一個很能幹、但需要你立好規矩的夥伴——立好了,它就是生產力加速器;放著不管,它遲早會在某個地方反咬你一口。
那工具到底怎麼選?要不要付費?
最後回答最多人問的:Codex、Claude Code、Cursor 該用哪個?值不值得付費?我的答案是——不必只選一個。
以我同時養好幾把 CLI 的經驗,各家強弱我橫向比較過,實務上我會看任務性質分配:要想得深、探索性的給 Claude,明確、重複性高的給 Codex,並且永遠留第二把當被限流時的備援。至於免費版夠不夠用、值不值得付費,重點不是月費多少,而是它幫你省下的時間值多少——但前提是你得照前面那套習慣把成本控好,不然隱藏成本會吃掉你的 ROI。
說到底,這整個系列想傳達的就一件事:AI agent 是這個時代最強的生產力工具之一,但它不是「開了就好」的魔法。會立規矩、懂運維的人,才能真正把它的力量握在自己手裡,而不是反過來被它的副作用追著跑。
FAQ 常見問題
我是新手,這五大類問題我都要擔心嗎?
不用一次全扛。新手只要先做兩件事就能避開最大的雷:別把工具開全自動(擋掉安全災難)、動手前先 commit(留還原點)。等你用量變大、開始放它跑長任務,再回來補成本、限流、資源那幾類。這篇的全景地圖就是讓你按需要、按痛點逐步深入用的。
這些問題是 Codex 特有的,還是每個 AI agent 都有?
大多是「會在你電腦上跑指令、開服務的 agent」共通的,只是形式不同。硬碟暴寫那個 bug 目前主要在 Codex;但背景殘留、token 暴增、亂刪檔風險、限流,Claude Code、Cursor、Gemini CLI 都有自己的版本。所以這套運維習慣不綁特定工具,學起來通用。
我照做了還是出問題,怎麼辦?
每一類我都有寫深入篇,裡面有更細的診斷指令和解法,點進對應的那篇照做。如果是「感覺變笨」這種,先去官方工程部落格看看最近有沒有發事故報告——很多時候是廠商端的 bug、幾天內就會修,不是你的問題。
把這些都做好,會不會很花時間、反而拖慢開發?
剛好相反。前期花幾分鐘立好規矩,是為了省下後面「硬碟爆掉重灌、帳單失控、檔案被誤刪重做」的大把時間。我那套週習慣一週花不到十分鐘,換來的是「放心讓 AI 飛快幹活、不怕它反咬」的踏實感,整體是大幅加速的。
我同時用 Claude 跟 Codex,設定要各做一套嗎?
核心觀念共通(權限、隔離、省 token、查用量),但每家的指令和模式名稱不同。建議你各花十分鐘把兩邊的「安全模式」「省 token 設定」對齊好,之後就能無縫切換——這也正好是被限流時最好的備援。各篇深入文裡都有兩家的對照。
結論:會立規矩的人,才真正握著 AI 的力量
把這整個系列收成一句話:AI 編程 agent 強得驚人,但它只負責「做」、不負責「收尾」——硬碟、安全、成本、限流、環境這五大類問題,本質上都是同一個缺口的不同臉孔,而且全部都可控。
我用這些工具用到現在最大的體會是:真正拉開差距的,從來不是「誰的模型比較強」,而是「誰把它的副作用管得比較好」。同樣的工具,有人用得行雲流水、有人三天兩頭被硬碟爆掉和帳單嚇到。差別就在那幾個一分鐘的習慣。把 AI agent 當成一個需要你立好規矩的強力夥伴,而不是一個開了就萬無一失的魔法——你就能穩穩地享受它帶來的生產力爆發,而不被它的副作用追著跑。
從上面那張地圖找到你最痛的一格、點進去照做,再把那份週習慣清單貼在你看得到的地方吧。如果你想持續收到這類「踩過坑、可以直接抄」的實戰整理,歡迎訂閱我的部落格,我會不定期把這些寄給你。
參考資料
- OpenAI Codex 官方文件:沙箱與權限模式
- Claude Code 官方文件:成本管理與省 token 指南
- Claude Code 官方文件:權限模式(安全防護)
- Anthropic 官方:Claude Code 品質事故報告(破解「降智」迷思)
- 關於作者實際的 AI 工作流與運維經驗,可參考夜羽凌的介紹頁