Claude 用量上限總是爆？10 個習慣讓 token 砍半，不用升級 Max

Claude 省 token 最有效的方法不是升級，而是養成 10 個小習慣。Claude Pro 每 5 小時大約只有 44,000 tokens、再加上每週的全域上限，撞牆頻率高到讓人想直接刷 $100 美金升級 Max。

但其實有更划算的選擇——我這幾個月實測下來，這套習慣讓整體 token 消耗砍掉 30 到 50%，重點是不用課金。

4 月 21 號那天，Anthropic 一度把 Claude Code 從 $20 美金的 Pro 方案抽掉，雖然後來反悔了，但那一陣子真的人心惶惶。緊接著 4 月 23 號官方又出了一份 postmortem，承認過去一個月品質下降是三個工程錯誤造成的，看完更不想衝動升級。

那陣子我每天工作到下午三、四點就撞上限，下班才能繼續，超痛苦。後來摸索出下面這套習慣，撞牆頻率從一天兩次降到一週一次，重點是這些方法全部都是免費的。

底下 10 招我按「對話前 → 對話中 → 進階」三段排列，請你跟著順序試，真的都不夠用了再考慮升級。

為什麼用 Claude 這麼容易撞上限？先搞懂你的額度被誰吃掉

Claude 的用量限制不是單純算次數，而是兩層機制：5 小時滾動視窗加上每週總量。根據 Anthropic 官方文件，Pro 在每 5 小時視窗裡大約是 44,000 tokens，Max5（$100/月）大約 88,000，Max20（$200/月）則是 220,000。

每週還有第二層限制。Max5 的 Sonnet 4 每週上限大約 140 到 280 小時、Opus 4 是 15 到 35 小時；Max20 則是 240 到 480 小時 Sonnet、24 到 40 小時 Opus。週一一爆滿，可能要等下週才能完全恢復。

這套機制裡最常被忽略的隱形吃 token 黑洞，是「每訊息固定成本」。你的 CLAUDE.md 檔案、連的 MCP server、長對話歷史，每一輪都會被重送一次。一個 5,000 tokens 的 CLAUDE.md，傳 20 輪就吃掉 100,000 tokens——還沒問問題，額度先被啃半條。

輸出比輸入還貴 5 倍。以 Claude Opus 4.7 的 API 價格來看，輸入 $5 / 百萬 tokens、輸出 $25 / 百萬。所以控制 AI 講多少話，比控制你輸入多少字更省。

📌 重點整理：Claude Pro 每 5 小時約 44k tokens 加上每週總量限制，真正吃 token 的不是你問的問題，而是 CLAUDE.md、MCP server、對話歷史這些「每訊息固定成本」，再加上輸出比輸入貴 5 倍。

對話開始前，這 3 個習慣 token 直接省一半

多數人跑去問 AI 怎麼省 token，但其實最有效的優化在你還沒打第一個字的時候。下面這 3 個習慣建議用 Claude Code 或 Anthropic API 的人都先檢查一遍。

❶ CLAUDE.md 控制在 200 行內，每多 1,000 字就吃掉 1,000 tokens × 你的訊息數量。

很多人 CLAUDE.md 寫得跟一份 SOP 一樣詳細。問題是它每一輪對話都會被注入到 prompt 開頭，5,000 tokens 的設定檔，跑 20 輪就是 100,000 tokens 的隱形成本。

社群實測建議是控制在 2,000 tokens 以內、200 行以下，只寫真正必要的規則，細節放別處讓 AI 需要時再讀。

❷ 建一個 .claudeignore，把 node_modules、build 產物、lock 檔全擋掉。

它的用法跟 .gitignore 一模一樣。Claude Code 在搜尋程式碼時會自動跳過清單裡的路徑，光是排掉 node_modules 一個資料夾，每次工具搜尋就能省幾千 tokens。對前端專案來說，這通常是 ROI 最高的單一動作。

❸ 把沒在用的 MCP server 全關掉，每個 MCP 每輪可能多吃 18,000 tokens。

每接一個 MCP server，它的工具定義就會被載入到每一條訊息的 context。社群統計顯示，單一 MCP 最多會吃掉 18,000 tokens / turn。

五個一起跑你還沒打字 90,000 tokens 就先沒了。建議去 ~/.claude.json 跟工作區的 .mcp.json 盤點一次，兩週沒用的全部停用，要用再開回來——這也是 Claude 省 token 最被低估的一招。

📌 重點整理：對話前的省 token 動作其實最關鍵——把 CLAUDE.md 壓在 200 行內、補一個 .claudeignore、關掉沒用的 MCP server，這三招做完通常就能讓 token 消耗砍掉三成以上。

對話進行中，這 4 個動作即時控管消耗

準備工作做完，接下來就看你怎麼跟 AI 互動。下面這 4 個習慣是我自己每天都在用的，不需要懂任何技術，純粹是改變使用方式。

❹ Prompt 開頭就限制輸出長度，省的不是輸入是更貴的輸出。

輸出比輸入貴 5 倍，所以控制 AI 別話多比你少打字更實際。我自己常加的限制句包括「請只回核心結論、不要解釋」「最多 100 字」「不要用條列、用一段話」。數位時代之前有篇 Claude 省 token 教學也提到，與其用文言文壓字數，不如直接告訴 AI 要精準輸出。

❺ 依任務複雜度切模型：簡單問題丟 Haiku，複雜任務才開 Opus。

Haiku 4.5 一百萬 tokens 只要 $1（輸入）/ $5（輸出），Opus 是 $5 / $25——5 倍價差。

我自己分工的標準是：寫測試、改錯字、簡單查詢丟 Haiku；一般寫作、分析、整理對話用 Sonnet；複雜重構、跨多檔案推理才開 Opus。如果你還在猶豫該選哪個，可以先看 Claude Opus 4.7 跟 Sonnet 4.6 的實測比較，再決定要不要全程開 Opus。

❻ 跑到一個段落就 /compact，不要等到自動壓縮才動手。

Claude Code 的 /compact 指令會把當前對話歷史壓縮成摘要、開新對話續寫。系統預設是 95% 才自動壓縮，但這時候很多細節已經被擠掉。我自己的習慣是每完成一個子任務就主動 /compact 一次，並且在指令後面加一句「保留 API 規格跟程式碼片段」，讓摘要不會把關鍵資訊弄丟。

❼ 一個對話只做一件事，bug 修和新功能不要塞同一個 session。

很多人會把「順便改個 bug」「順便加個功能」全塞同一條對話，結果跑到後面 context 一團亂、AI 開始走鐘。社群普遍建議是「一個 session 一個任務」——一個 bug、一個 feature、一次重構，做完就重新開對話，這樣每段都從乾淨狀態開始，效率反而高很多。

API 跟 Claude Code 進階用戶，這 3 招把成本壓到極限

如果你已經是 API 用戶或重度 Claude Code 玩家，下面這 3 招直接砍到對話成本的根。我朋友把這套全部上線之後，月帳單從 $400 降到 $130，他自己也嚇到。

❽ 開 Prompt Caching，重複查詢直接打 1 折。

根據 Anthropic 官方文件，快取寫入是基本價的 1.25 倍、快取讀取只要 0.1 倍。也就是同樣的系統提示、長文件、對話歷史，第二次之後只收原價的 10%。

Claude Code 預設就會把 CLAUDE.md 跟系統 prompt 自動快取，根據官方數據，正常一天可省 40 到 50% 的輸入 token 成本。

❾ 用 /context 指令看 token 流向，揪出隱形大戶。

跑 /context 你會看到 token 分布在 system prompt、tools、memory、對話歷史各佔多少。我第一次跑的時候才發現，光 MCP 工具定義就吃掉 30% 的 context，回頭關掉一半不常用的 server，一輪對話直接省下 1/3 token。

如果你不知道從哪裡優化，先跑這個指令看數據。

❿ 批次任務丟 Batch API，輸入輸出全部半價。

不是即時要看結果的任務，例如批次翻譯、大量資料分類、夜間跑分析，全部丟到 Anthropic Batch API。官方定價頁明確寫著 Batch 處理輸入輸出都打 5 折，24 小時內完成。我每週固定有一批 SEO 文章重寫任務，改用 Batch 之後一個月省下大約 $80 美金。

📌 重點整理：API 跟 Claude Code 用戶額外有三條線可以省——Prompt Caching 砍 9 成、/context 找出隱形大戶、Batch API 直接半價。三招同時上線，省下的金額足以抵掉一份 Pro 訂閱。

講個我踩過的坑：4 月那波 Claude Code 變慢，問題不是升級能解決的

3 月底到 4 月中那段時間，我自己跟身邊朋友都覺得 Claude Code 變笨了——同樣的 prompt 寫程式品質掉一截、每輪 token 用得更兇、回答還偶爾忘記前面講過什麼。我那陣子第一反應是「該升級到 Max20 了吧」，差點就刷下去。

結果 Anthropic 在 4 月 23 號發了一份 postmortem，把過去一個月品質下降的責任攬在自己身上：3 月 4 號的 reasoning effort downgrade、3 月 26 號清思考紀錄的快取 bug、4 月 16 號為了減少冗長加的系統提示。

三個工程錯誤疊在一起拖累 Claude Code 的表現，問題到 4 月 20 號才全部修好。

這件事提醒我一件事：撞上限不一定代表你需要升級，可能是平台本身狀態不對。每次覺得 Claude 「最近變廢了」，先看看有沒有官方 status 公告，再回頭檢查自己的習慣。

朋友 K 是工程主管，他在 4 月那波也罵爆 Claude，原本要全公司轉去用 Cursor。

後來他照我這套習慣去檢查，發現他們團隊的 CLAUDE.md 寫了 8,000 字、開了 12 個 MCP——光把 MCP 砍到 4 個、CLAUDE.md 壓到 1,500 字，那週 token 用量直接掉一半，全公司就先不換工具了。

10 招都試了還是不夠？再來看升級到底值不值

把上面 10 個習慣全部跑過一輪，如果你還是天天撞牆，那升級才有意義。下面這張表是 Pro、Max5、Max20 的差異，幫你判斷該往哪一階跳。

方案	月費	5 小時視窗 tokens	每週 Sonnet	適合誰
Pro	$20	~44,000	無明確上限	每天 1-2 小時輕度使用、寫文案、聊天
Max 5x	$100	~88,000	140-280 小時/週	重度使用者、每天 4-6 小時、Claude Code 高頻用
Max 20x	$200	~220,000	240-480 小時/週	專業開發團隊、跑 agent、長時間自動化任務

我自己的判斷標準是：如果每週至少有 3 天會撞到 5 小時上限、而且工作有時效性等不到下個視窗，就該升 Max5。如果連 Max5 的每週 Opus 35 小時都會用完，再考慮 Max20。直接從 Pro 跳 Max20 通常太跳躍，先用 Max5 觀察一個月再決定。

另一個建議是，升級之前先比較三家——Claude、ChatGPT、Gemini 的訂閱方案差異比想像中大。我寫過一篇三大付費 AI 的完整比較，可以先看再決定要不要把錢押在 Claude 上。

常見問題 FAQ

Claude Pro 每天最多能對話幾次？

Anthropic 沒有公佈確切次數，因為計算方式是 tokens 而不是次數。同樣是「Pro 每 5 小時」，你問短問題可能可以聊 200 輪，貼一份 50 頁文件可能 5 輪就爆。實際上限取決於你每輪的訊息長度、附件大小、是否開啟 Extended Thinking。

用文言文寫 prompt 真的能省 token 嗎？

有省一點，但效果遠不如「直接限制輸出長度」。中文一個字大約 1.5 到 2 個 tokens，文言文用字精煉確實少一些，但風險是 AI 可能誤解意思反而要重問。

比較有效的做法是：用白話清楚下指令，但加上「最多 100 字、只回結論」這種輸出限制，省的是更貴的輸出 token。如果你不確定怎麼寫提示詞，可以參考三家 AI 的 prompt 寫法差異教學。

4 月那波 Claude Code 品質下降的問題已經修好了嗎？

修好了。Anthropic 在 4 月 23 號的 postmortem 確認三個工程錯誤都已經回滾或修正，最後一個修補在 4 月 20 號上線（v2.1.116）。如果你最近還是覺得 Claude Code 怪怪的，建議檢查自己的設定，或者重啟 Claude Code 讓它拿到最新版本。

API 用戶跟訂閱方案哪個比較划算？

看用量。如果你每個月 Claude API 帳單低於 $20，明顯是 API 划算（更彈性、不會撞 5 小時牆）。月帳單在 $20 到 $100 之間，Pro 訂閱通常更划算。

月用量超過 $100，再回頭算 API + Prompt Caching + Batch 折扣後的成本，常常會比 Max5 更便宜。

為什麼週一就撞到上限了？這合理嗎？

合理。每週上限是「滾動 7 天」而不是「週一重置」，所以你上週六、日如果用得很兇，週一額度幾乎是接著扣下去的。Anthropic 4 月初也承認，部分 Claude Code 用戶撞週限的速度比他們預期的快。如果這狀況常發生，就是該檢查上面 10 個習慣，或考慮升級到 Max5 拉高週上限。

結語

Claude 省 token 這件事，講白了就是「在升級之前，先把自己的使用習慣調順」。訣竅從來不是花更多錢，而是更聰明地用。我這幾個月實測下來，光是把 CLAUDE.md 縮小、關掉沒用的 MCP、加上 /compact 這三招，每天的 token 消耗就少了三成以上。

10 個習慣不用一次全做。先從前 3 個（對話前的設定）開始，做完通常就會有感；對話中的 4 個習慣是日常用 AI 都該養成的肌肉記憶；最後 3 個 API 進階招式，是給每個月帳單超過 $50 美金的人用的。

真的把這 10 招都跑過一輪還不夠，再來考慮升級 Max。我自己現在還是 Pro $20 用戶，幾個月下來夠用，省下來的錢拿去升其他工具的方案，整體 AI 工具支出反而比之前低。

最後提醒：如果某天突然覺得 Claude 變笨、token 燒得異常快，先別急著升級或換工具，去看看 Anthropic Status 頁面跟官方部落格，可能只是平台側出了狀況。等修好了，你還是那個 $20 用戶。