💡 核心結論速覽 (TL;DR)
- 「Claude 變笨」是真的發生過,但不是陰謀:Anthropic 兩度公開認帳——2025/9 三個基礎設施 bug、2026/4 三個產品層設定失誤——而且每次都明確否認「為省成本或在尖峰時段偷偷降規格、換弱模型」,還重置額度補償。底層模型沒被動,但你體感到的退步是真的。
- 限流是雙層的:一個 5 小時滾動窗 + 一個 7 天週上限。撞到上限時,Claude 是「直接擋住、不讓你發新訊息」,不會把你偷換成比較笨的模型。
- 那個「台灣晚上會被限流」的說法已經過時:尖峰時段扣更兇是 2026/3 短暫實施、5/6 就永久取消了,現在沒有了。
- 行動:在 Claude Code 打
/usage看你撞的是 5 小時窗還是週上限;省 token 就等於少觸發限流;保留第二把 CLI(Codex/ChatGPT)當被限時的備援。
你有沒有過這種感覺:明明同一個 AI、同一種問法,昨天還很聰明,今天突然變得又笨又囉嗦、講過的事轉頭就忘?或者用到一半,它直接告訴你「用量已達上限」,把你晾在那裡?我每天同時開 Claude Code 跟 Codex 跑開發,用得很兇,這兩種挫折我太熟了。
先給你直接的答案:「變笨」跟「被限流」是兩件不同的事,而且網路上對這兩件事的說法,有一大半是過時或誤傳的。「變笨」確實發生過,但它不是你以為的「廠商偷偷降規格省成本」;「被限流」也有一套你可以查、可以避的明確規則,不是玄學。
這篇我想用一個每天踩這些坑的重度使用者角度,把話講清楚:Claude 到底有沒有變笨、是 bug 還是陰謀;限流的 5 小時窗跟週上限怎麼運作;ChatGPT 那邊又是什麼情況;最後給你一套我自己在用的應對心法。看完你會發現,這些其實都可控。
Claude 真的「變笨」了嗎?是 bug 還是陰謀?
直接定調:是 bug,不是陰謀。Claude 確實有幾段時間品質下滑、而且 Anthropic 兩度公開認帳,但每一次官方都查證並否認「蓄意降規格或偷換弱模型」,底層模型本身沒被動手腳——你體感到的退步是真的,但原因跟你想的不一樣。
我特別想把這段獨立講,因為這是中文圈現有報導最少講清楚、卻最重要的一點。很多人的直覺是「一定是廠商人多了,偷偷把我降到爛模型省算力」。但實際上,官方發過兩份非常詳細的事故報告:
事件 | 到底發生什麼 |
|---|---|
2025/9 那次 | 官方承認三個 bug:一個把請求「路由」到錯誤設定的伺服器(最糟的尖峰時刻,約 16% 的某模型請求受影響)、一個 TPU 設定錯誤讓回應冒出亂碼字元、還有一個運算精度的編譯 bug。全是基礎設施在出包。 |
2026/4 那次 | 更貼近最近:官方承認三個「產品層」的調整害了它——把預設思考強度從高調成中(後來應使用者要求改回)、一個快取 bug 害它每一輪都把「思考記憶」清掉所以變健忘又重複、還有一條想讓它「少囉嗦」的指令反而讓寫程式的評測掉了約 3%。三個後來都回退或修掉了。 |
看出重點了嗎?這些全是「設定」跟「基礎設施」的失誤,不是把模型換成廉價版。官方在報告裡甚至撂了兩句很硬的話:2025 那次是「我們絕不會因為需求、時段或伺服器負載而降低模型品質」;2026 那次是「我們絕不蓄意降低模型品質,而且我們已立刻確認 API 與推理層沒受影響」。換句話說,動到的是「外圍的設定」,不是「模型的腦袋」。而且兩次出包後,官方都重置了用量額度當補償。
當然,你可以選擇不信廠商的話——這很合理。但客觀來說,截至目前沒有任何獨立的技術證據能證明模型真的被靜默換成弱模型;那些懷疑論主要是「同時出三個 bug,也太巧了吧」的時序質疑,而不是實證。連以嚴格出名的獨立開發者,看完報告後也認為解釋站得住腳、樂見這種透明。所以我的結論是:體感的退步別自我懷疑,那是真的;但把它想成「陰謀」會讓你抓錯重點。它是會被修好的 bug,官方現在也加了更嚴的測試流程想更早攔截。
限流到底怎麼運作?5 小時窗 + 週上限一次拆解
先給你框架:Claude 的限流是「雙層」的——一個 5 小時的滾動窗管你的短時間爆量,一個 7 天的週上限當總天花板,兩個同時生效。搞懂這兩層,你就知道自己為什麼被擋、什麼時候會恢復。
幾個關鍵觀念,幫你一次釐清:
- 5 小時窗是「滾動」的:它從你送出第一個 prompt 那刻起算,5 小時後那批用量會逐漸「滾掉」釋放,不是固定整點重置。所以網路上常說的「被限了等 2 小時就好」是誤傳——實際要看你最早那批用量何時送出,最長到 5 小時。
- 週上限是絕對天花板:它在 2025 年 8 月導入,就算你當下的 5 小時窗還有額度,一旦撞到週上限,照樣鎖到該週 reset 為止。
- 撞限時,它是「擋住」不是「降智」:這點很重要——額度用完,Claude 是直接不讓你發新訊息(既有對話轉成唯讀),不會偷偷把你切到比較笨的模型。所以「我被限流之後它變笨了」這種感覺,多半是兩件事被你連在一起誤會了。
還有兩個最新狀況,是很多舊文章(跟還在流傳的截圖)會寫錯、害你誤判的:
❶ 額度其實一直在加大,不是縮小。2026 年 5 月初,官方把 5 小時窗的額度永久加倍;同月中又把週上限調高 50%(這個是促銷,原訂到 7 月中)。所以如果你覺得最近比較不容易撞限,不是錯覺。
❷ 「台灣晚上 8 點到凌晨 2 點會被限更兇」已經沒有了。這個尖峰時段扣更兇的機制,是 2026 年 3 月底短暫實施、影響約 7% 用戶的措施,但在 5 月初就永久取消了,還是跟「5 小時窗加倍」一起宣布的。所以你現在還看到有人叫你「避開晚間用 Claude」,那是過期資訊。想算自己什麼時候 reset、查目前用量,最準的是在 Claude Code 終端打 /usage,它會把 5 小時窗跟各模型週上限的百分比、還有確切的重置時間都列給你。這跟我一直強調的 省 token 是一體兩面:用得越省,越不容易撞限。
那 ChatGPT/Codex 那邊呢?邏輯不太一樣
一句話差異:Claude 撞限是「整個擋住、不換模型」,而 ChatGPT/Codex 這邊更傾向用一個「路由器」在不同模型之間切換——這也正是它「變笨」爭議的來源。
還記得 GPT-5 剛上線(2025 年 8 月)那波「變笨」罵聲嗎?很多人說它比舊版還差、亂編不存在的 API。連 Sam Altman 都公開承認那次發布「比預期顛簸」,並解釋:GPT-5 之所以看起來變笨,是因為那個「即時決定要用哪個子模型」的路由器剛上線時沒運作正常——本來該調用強模型的,被丟給了弱的。後來他們修好、把 Plus 的額度加倍、也讓舊模型回歸。到了 2026 年的 GPT-5.5,也零星有人抱怨被「靜默降級」,只是 OpenAI 這邊比較少像 Anthropic 那樣發逐項的事故報告。
至於限流,Codex 的邏輯跟 Claude 很像:也是 5 小時窗、可能加上週上限、官方一樣不公布固定數字。差別在於它走 token 計費,你可以用 /status 查剩餘額度、也能加購 credits 續用。實務上我的判斷是:如果你會因為單一工具被限就卡住工作,別把雞蛋放同一個籃子——這也是我下面要講的備援策略。各家工具的強弱我之前也橫向比較過,留兩把 CLI 在手是很值得的保險。
我的實戰應對:查、避、備援、要不要升級
直接給你最有效的四步:先用 /usage 搞清楚你撞的是哪一層,再用「省 token」少觸發,被限時切換備援工具,真的常撞週上限才考慮升級。下面對號入座。
你的狀況 | 我會怎麼做 |
|---|---|
偶爾撞 5 小時窗 | 多半是短時間爆量。把大任務拆開、里程碑後 |
常常撞「週上限」 | 這才是真的需要更高方案的訊號(例如 Max 5x 升 20x)。Max 還有「用標準 API 價加購超額」的彈性,Pro 沒有。 |
覺得它「變笨」了 | 先別自我懷疑也別罵。去官方的工程部落格看看最近有沒有發事故報告——通常幾天內就會修。同時可以暫時切到另一家工具頂著。 |
工作不能停、被限就崩潰 | 保留第二把 CLI(Claude 被限切 Codex,反之亦然),把不急的重任務排到自己用量低的時段跑。 |
說說我自己。我每家 AI 都付費訂閱、用量很大,所以撞限對我是日常。我的習慣是:每天會瞄一下 /usage 抓自己的節奏,知道大概幾點會緊;日常開發絕不一律用最貴的模型,把它留給真的需要深度推理的任務;手邊永遠有 Claude 跟 Codex 兩套,一邊被限就無縫切到另一邊。至於「變笨」,老實說我現在的反應很淡定——出包過幾次、官方也修過幾次之後,我學會先去看有沒有事故報告,而不是急著懷疑自己問錯問題。把這些工具當成「會有狀況、但狀況可查可避」的夥伴,比把它當成「永遠完美或一定有陰謀」都更接近真相,也讓你用得更安穩。
FAQ 常見問題
Claude 是不是在尖峰時段把我偷偷降智了?
沒有,而且官方有明確的否認原句:「我們絕不會因為需求、時段或伺服器負載而降低模型品質。」過去確實有過品質下滑,但官方查證後歸因於基礎設施與產品設定的 bug,不是蓄意降規格,底層模型也沒被換。而那個「尖峰時段扣更兇」的限流措施,也已經在 2026 年 5 月永久取消了。
被限流之後要等多久才能再用?
看你撞的是哪一層。5 小時窗是滾動的,從你最早那批 prompt 起算、最長到 5 小時會逐漸釋放,不是固定「等 2 小時」。週上限則要等到該週 reset。最準的做法是打 /usage,它會直接告訴你確切的重置時間,別憑感覺空等。
Pro 跟 Max 的用量差多少?我該升級嗎?
官方 2026 年起改用相對倍率表示(Max 5x 約是 Pro 的 5 倍、Max 20x 約 20 倍),不再公布固定時數。要不要升級,先用 /usage 看你常撞的是 5 小時窗還是週上限——常撞週上限才是真的需要更高方案;只是偶爾短時間爆量,用省 token 跟分散時段就能解決。
我同時被 Claude 跟 ChatGPT 限流,是不是我用太兇?
很可能是。兩家都有 5 小時窗加週上限的雙層限制,重度自動化很容易同時撞到。治本之道是「少觸發」——把 context 保持精簡、簡單任務用便宜模型、verbose 的活丟給子代理處理。這跟省 token 是同一套功夫,做好了限流跟帳單會一起改善。
那到底還能不能信任這些 AI 工具?
能,但要用「對的期待」。它們不是永遠完美、也不是背後有陰謀,而是「快速迭代中、偶爾會出包、但通常很快修好且願意公開說明」的產品。把它當夥伴而非神,遇到變笨先去看事故報告、遇到限流先查 /usage,你就不會被情緒帶著走。
結論:不是陰謀,是 bug;不是玄學,是有規則的限流
把這篇收成一句話:Claude「變笨」是真的、但那是會修好的 bug 不是陰謀;限流也不是玄學,而是一套你查得到、避得開的雙層規則。看懂這兩件事,你就能少很多無謂的焦慮跟自我懷疑。
我自己用這些工具用到現在最大的心得是:對 AI 抱「對的期待」,比抱「過高或過低的期待」都更能讓你用得好。期待它永遠完美,你會在它出包時崩潰;認定它背後都是陰謀,你會錯過真正的解法。它就是個還在快速長大的工具——會有狀況,但狀況幾乎都可查、可避、可繞。把 /usage 養成習慣、把省 token 練成本能、手邊留一把備援的 CLI,你就能穩穩地享受它帶來的生產力,而不被這些波動牽著鼻子走。
下次再覺得 AI「變笨」或被限流時,先別急著生氣——打開 /usage 看一眼、去官方部落格瞄一下有沒有事故報告。如果你想把成本跟限流一起壓下來,歡迎接著看我那篇 省 token 心法(省 token 等於少撞限流)、或我怎麼 替 AI agent 設好安全護欄別讓它亂刪檔、揪出它在背景偷留的殘留程序、還有它 狂寫硬碟磨損 SSD 的毛病,再不然訂閱我的部落格,我會不定期把這類踩過的坑整理成可以直接抄的解法寄給你。
參考資料
- Anthropic 官方工程部落格:2026/4 Claude Code 品質事故報告(三個產品層變更的逐項說明)
- Anthropic 官方工程部落格:2025/9 三個基礎設施 bug 的事故報告(含「絕不因負載降品質」原句)
- Anthropic 官方公告:2026/5 5 小時窗永久加倍、永久移除尖峰時段限制
- Anthropic 官方支援頁:用量與長度限制如何運作(5 小時窗 + 週上限)
- OpenAI Codex 官方定價與用量頁(5 小時窗、/status 查額度)
- 關於作者實際的 AI 工作流與使用經驗,可參考夜羽凌的介紹頁