Claude 用量上限總是爆?10 個習慣讓 token 砍半,不用升級 Max

目錄

Claude 省 token 最有效的方法不是升級,而是養成 10 個小習慣。Claude Pro 每 5 小時大約只有 44,000 tokens、再加上每週的全域上限,撞牆頻率高到讓人想直接刷 $100 美金升級 Max。

但其實有更划算的選擇——我這幾個月實測下來,這套習慣讓整體 token 消耗砍掉 30 到 50%,重點是不用課金。

4 月 21 號那天,Anthropic 一度把 Claude Code 從 $20 美金的 Pro 方案抽掉,雖然後來反悔了,但那一陣子真的人心惶惶。緊接著 4 月 23 號官方又出了一份 postmortem,承認過去一個月品質下降是三個工程錯誤造成的,看完更不想衝動升級。

那陣子我每天工作到下午三、四點就撞上限,下班才能繼續,超痛苦。後來摸索出下面這套習慣,撞牆頻率從一天兩次降到一週一次,重點是這些方法全部都是免費的。

底下 10 招我按「對話前 → 對話中 → 進階」三段排列,請你跟著順序試,真的都不夠用了再考慮升級。


為什麼用 Claude 這麼容易撞上限?先搞懂你的額度被誰吃掉

Claude 的用量限制不是單純算次數,而是兩層機制:5 小時滾動視窗加上每週總量。根據 Anthropic 官方文件,Pro 在每 5 小時視窗裡大約是 44,000 tokens,Max5($100/月)大約 88,000,Max20($200/月)則是 220,000。

每週還有第二層限制。Max5 的 Sonnet 4 每週上限大約 140 到 280 小時、Opus 4 是 15 到 35 小時;Max20 則是 240 到 480 小時 Sonnet、24 到 40 小時 Opus。週一一爆滿,可能要等下週才能完全恢復。

這套機制裡最常被忽略的隱形吃 token 黑洞,是「每訊息固定成本」。你的 CLAUDE.md 檔案、連的 MCP server、長對話歷史,每一輪都會被重送一次。一個 5,000 tokens 的 CLAUDE.md,傳 20 輪就吃掉 100,000 tokens——還沒問問題,額度先被啃半條。

輸出比輸入還貴 5 倍。以 Claude Opus 4.7 的 API 價格來看,輸入 $5 / 百萬 tokens、輸出 $25 / 百萬。所以控制 AI 講多少話,比控制你輸入多少字更省。

📌 重點整理:Claude Pro 每 5 小時約 44k tokens 加上每週總量限制,真正吃 token 的不是你問的問題,而是 CLAUDE.md、MCP server、對話歷史這些「每訊息固定成本」,再加上輸出比輸入貴 5 倍。


對話開始前,這 3 個習慣 token 直接省一半

多數人跑去問 AI 怎麼省 token,但其實最有效的優化在你還沒打第一個字的時候。下面這 3 個習慣建議用 Claude Code 或 Anthropic API 的人都先檢查一遍。

❶ CLAUDE.md 控制在 200 行內,每多 1,000 字就吃掉 1,000 tokens × 你的訊息數量。

很多人 CLAUDE.md 寫得跟一份 SOP 一樣詳細。問題是它每一輪對話都會被注入到 prompt 開頭,5,000 tokens 的設定檔,跑 20 輪就是 100,000 tokens 的隱形成本。

社群實測建議是控制在 2,000 tokens 以內、200 行以下,只寫真正必要的規則,細節放別處讓 AI 需要時再讀。

❷ 建一個 .claudeignore,把 node_modules、build 產物、lock 檔全擋掉。

它的用法跟 .gitignore 一模一樣。Claude Code 在搜尋程式碼時會自動跳過清單裡的路徑,光是排掉 node_modules 一個資料夾,每次工具搜尋就能省幾千 tokens。對前端專案來說,這通常是 ROI 最高的單一動作。

❸ 把沒在用的 MCP server 全關掉,每個 MCP 每輪可能多吃 18,000 tokens。

每接一個 MCP server,它的工具定義就會被載入到每一條訊息的 context。社群統計顯示,單一 MCP 最多會吃掉 18,000 tokens / turn。

五個一起跑你還沒打字 90,000 tokens 就先沒了。建議去 ~/.claude.json 跟工作區的 .mcp.json 盤點一次,兩週沒用的全部停用,要用再開回來——這也是 Claude 省 token 最被低估的一招。

📌 重點整理:對話前的省 token 動作其實最關鍵——把 CLAUDE.md 壓在 200 行內、補一個 .claudeignore、關掉沒用的 MCP server,這三招做完通常就能讓 token 消耗砍掉三成以上。


對話進行中,這 4 個動作即時控管消耗

準備工作做完,接下來就看你怎麼跟 AI 互動。下面這 4 個習慣是我自己每天都在用的,不需要懂任何技術,純粹是改變使用方式。

❹ Prompt 開頭就限制輸出長度,省的不是輸入是更貴的輸出。

輸出比輸入貴 5 倍,所以控制 AI 別話多比你少打字更實際。我自己常加的限制句包括「請只回核心結論、不要解釋」「最多 100 字」「不要用條列、用一段話」。數位時代之前有篇 Claude 省 token 教學也提到,與其用文言文壓字數,不如直接告訴 AI 要精準輸出。

❺ 依任務複雜度切模型:簡單問題丟 Haiku,複雜任務才開 Opus。

Haiku 4.5 一百萬 tokens 只要 $1(輸入)/ $5(輸出),Opus 是 $5 / $25——5 倍價差。

我自己分工的標準是:寫測試、改錯字、簡單查詢丟 Haiku;一般寫作、分析、整理對話用 Sonnet;複雜重構、跨多檔案推理才開 Opus。如果你還在猶豫該選哪個,可以先看 Claude Opus 4.7 跟 Sonnet 4.6 的實測比較,再決定要不要全程開 Opus。

❻ 跑到一個段落就 /compact,不要等到自動壓縮才動手。

Claude Code 的 /compact 指令會把當前對話歷史壓縮成摘要、開新對話續寫。系統預設是 95% 才自動壓縮,但這時候很多細節已經被擠掉。我自己的習慣是每完成一個子任務就主動 /compact 一次,並且在指令後面加一句「保留 API 規格跟程式碼片段」,讓摘要不會把關鍵資訊弄丟。

❼ 一個對話只做一件事,bug 修和新功能不要塞同一個 session。

很多人會把「順便改個 bug」「順便加個功能」全塞同一條對話,結果跑到後面 context 一團亂、AI 開始走鐘。社群普遍建議是「一個 session 一個任務」——一個 bug、一個 feature、一次重構,做完就重新開對話,這樣每段都從乾淨狀態開始,效率反而高很多。


API 跟 Claude Code 進階用戶,這 3 招把成本壓到極限

如果你已經是 API 用戶或重度 Claude Code 玩家,下面這 3 招直接砍到對話成本的根。我朋友把這套全部上線之後,月帳單從 $400 降到 $130,他自己也嚇到。

❽ 開 Prompt Caching,重複查詢直接打 1 折。

根據 Anthropic 官方文件,快取寫入是基本價的 1.25 倍、快取讀取只要 0.1 倍。也就是同樣的系統提示、長文件、對話歷史,第二次之後只收原價的 10%。

Claude Code 預設就會把 CLAUDE.md 跟系統 prompt 自動快取,根據官方數據,正常一天可省 40 到 50% 的輸入 token 成本。

❾ 用 /context 指令看 token 流向,揪出隱形大戶。

跑 /context 你會看到 token 分布在 system prompt、tools、memory、對話歷史各佔多少。我第一次跑的時候才發現,光 MCP 工具定義就吃掉 30% 的 context,回頭關掉一半不常用的 server,一輪對話直接省下 1/3 token。

如果你不知道從哪裡優化,先跑這個指令看數據。

❿ 批次任務丟 Batch API,輸入輸出全部半價。

不是即時要看結果的任務,例如批次翻譯、大量資料分類、夜間跑分析,全部丟到 Anthropic Batch API。官方定價頁明確寫著 Batch 處理輸入輸出都打 5 折,24 小時內完成。我每週固定有一批 SEO 文章重寫任務,改用 Batch 之後一個月省下大約 $80 美金。

📌 重點整理:API 跟 Claude Code 用戶額外有三條線可以省——Prompt Caching 砍 9 成、/context 找出隱形大戶、Batch API 直接半價。三招同時上線,省下的金額足以抵掉一份 Pro 訂閱。


講個我踩過的坑:4 月那波 Claude Code 變慢,問題不是升級能解決的

3 月底到 4 月中那段時間,我自己跟身邊朋友都覺得 Claude Code 變笨了——同樣的 prompt 寫程式品質掉一截、每輪 token 用得更兇、回答還偶爾忘記前面講過什麼。我那陣子第一反應是「該升級到 Max20 了吧」,差點就刷下去。

結果 Anthropic 在 4 月 23 號發了一份 postmortem,把過去一個月品質下降的責任攬在自己身上:3 月 4 號的 reasoning effort downgrade、3 月 26 號清思考紀錄的快取 bug、4 月 16 號為了減少冗長加的系統提示。

三個工程錯誤疊在一起拖累 Claude Code 的表現,問題到 4 月 20 號才全部修好。

這件事提醒我一件事:撞上限不一定代表你需要升級,可能是平台本身狀態不對。每次覺得 Claude 「最近變廢了」,先看看有沒有官方 status 公告,再回頭檢查自己的習慣。

朋友 K 是工程主管,他在 4 月那波也罵爆 Claude,原本要全公司轉去用 Cursor。

後來他照我這套習慣去檢查,發現他們團隊的 CLAUDE.md 寫了 8,000 字、開了 12 個 MCP——光把 MCP 砍到 4 個、CLAUDE.md 壓到 1,500 字,那週 token 用量直接掉一半,全公司就先不換工具了。


10 招都試了還是不夠?再來看升級到底值不值

把上面 10 個習慣全部跑過一輪,如果你還是天天撞牆,那升級才有意義。下面這張表是 Pro、Max5、Max20 的差異,幫你判斷該往哪一階跳。

方案月費5 小時視窗 tokens每週 Sonnet適合誰
Pro$20~44,000無明確上限每天 1-2 小時輕度使用、寫文案、聊天
Max 5x$100~88,000140-280 小時/週重度使用者、每天 4-6 小時、Claude Code 高頻用
Max 20x$200~220,000240-480 小時/週專業開發團隊、跑 agent、長時間自動化任務

我自己的判斷標準是:如果每週至少有 3 天會撞到 5 小時上限、而且工作有時效性等不到下個視窗,就該升 Max5。如果連 Max5 的每週 Opus 35 小時都會用完,再考慮 Max20。直接從 Pro 跳 Max20 通常太跳躍,先用 Max5 觀察一個月再決定。

另一個建議是,升級之前先比較三家——Claude、ChatGPT、Gemini 的訂閱方案差異比想像中大。我寫過一篇 三大付費 AI 的完整比較,可以先看再決定要不要把錢押在 Claude 上。


常見問題 FAQ

Claude Pro 每天最多能對話幾次?

Anthropic 沒有公佈確切次數,因為計算方式是 tokens 而不是次數。同樣是「Pro 每 5 小時」,你問短問題可能可以聊 200 輪,貼一份 50 頁文件可能 5 輪就爆。實際上限取決於你每輪的訊息長度、附件大小、是否開啟 Extended Thinking。

用文言文寫 prompt 真的能省 token 嗎?

有省一點,但效果遠不如「直接限制輸出長度」。中文一個字大約 1.5 到 2 個 tokens,文言文用字精煉確實少一些,但風險是 AI 可能誤解意思反而要重問。

比較有效的做法是:用白話清楚下指令,但加上「最多 100 字、只回結論」這種輸出限制,省的是更貴的輸出 token。如果你不確定怎麼寫提示詞,可以參考 三家 AI 的 prompt 寫法差異教學

4 月那波 Claude Code 品質下降的問題已經修好了嗎?

修好了。Anthropic 在 4 月 23 號的 postmortem 確認三個工程錯誤都已經回滾或修正,最後一個修補在 4 月 20 號上線(v2.1.116)。如果你最近還是覺得 Claude Code 怪怪的,建議檢查自己的設定,或者重啟 Claude Code 讓它拿到最新版本。

API 用戶跟訂閱方案哪個比較划算?

看用量。如果你每個月 Claude API 帳單低於 $20,明顯是 API 划算(更彈性、不會撞 5 小時牆)。月帳單在 $20 到 $100 之間,Pro 訂閱通常更划算。

月用量超過 $100,再回頭算 API + Prompt Caching + Batch 折扣後的成本,常常會比 Max5 更便宜。

為什麼週一就撞到上限了?這合理嗎?

合理。每週上限是「滾動 7 天」而不是「週一重置」,所以你上週六、日如果用得很兇,週一額度幾乎是接著扣下去的。Anthropic 4 月初也承認,部分 Claude Code 用戶撞週限的速度比他們預期的快。如果這狀況常發生,就是該檢查上面 10 個習慣,或考慮升級到 Max5 拉高週上限。


結語

Claude 省 token 這件事,講白了就是「在升級之前,先把自己的使用習慣調順」。訣竅從來不是花更多錢,而是更聰明地用。我這幾個月實測下來,光是把 CLAUDE.md 縮小、關掉沒用的 MCP、加上 /compact 這三招,每天的 token 消耗就少了三成以上。

10 個習慣不用一次全做。先從前 3 個(對話前的設定)開始,做完通常就會有感;對話中的 4 個習慣是日常用 AI 都該養成的肌肉記憶;最後 3 個 API 進階招式,是給每個月帳單超過 $50 美金的人用的。

真的把這 10 招都跑過一輪還不夠,再來考慮升級 Max。我自己現在還是 Pro $20 用戶,幾個月下來夠用,省下來的錢拿去升其他工具的方案,整體 AI 工具支出反而比之前低。

最後提醒:如果某天突然覺得 Claude 變笨、token 燒得異常快,先別急著升級或換工具,去看看 Anthropic Status 頁面跟官方部落格,可能只是平台側出了狀況。等修好了,你還是那個 $20 用戶。


延伸閱讀

 

延伸閱讀