AI 讓你變快但不會讓你變強：拉開職場差距的三個 AI 思考階梯

上週朋友傳訊問我：「為什麼我用 AI 一年了，產出的東西速度變快，但老闆對我評價沒有真的變高？」我看完她傳過來的範例，心裡的答案很直接——她爬到了「快」的階梯，卻沒爬上「強」的階梯。

AI 思考階梯不是 prompt 技巧，是你跟 AI 之間「誰在主導思考」的分工結構。我自己跌跌撞撞走了快兩年，整理出三個階梯：複述層、整合層、質詢層。今天把這套拆給你看，順便聊一下為什麼大部分人卡在第一層動不了。

AI 真的讓人變聰明嗎？MIT 用 EEG 看了 4 個月給出什麼結論？

結論很直白：用得越多、神經連結越弱。MIT Media Lab 在 2025 年發表的「Your Brain on ChatGPT」研究把參與者分三組（純大腦、搜尋引擎、LLM 輔助）寫作四個月，用腦電圖 EEG 觀察大腦活動。結果是 LLM 組的大腦連結最弱，純大腦組最強，搜尋引擎組落在中間。

更刺眼的是後續實驗：當研究團隊把 LLM 組的人換到純大腦組寫文章，他們的 alpha 和 beta 腦波連結仍然偏低——「認知債」會持續一段時間，停掉 AI 不代表大腦自動回血。LLM 組對自己文章的「擁有感」最低，連自己引用過的內容都背不太出來。

微軟研究院 2025 年初訪談 319 名知識工作者得出類似結論：對 AI 越有信心的人，自己投入的批判性思考越少；對「自己」有信心的人，反而更認真檢查 AI 的輸出。兩個信心走相反方向，值得停下來想一下你站在哪邊。

📌 重點整理：AI 不會自動讓你變聰明。它幫你省下的時間，如果沒拿去做更高層次的思考，會直接轉成「神經連結變弱」的代價。「快」跟「強」不是同一件事。

三個 AI 思考階梯到底是什麼？跟 Prompt 教學差在哪？

Prompt 教學講「怎麼問」，思考階梯講「你站在哪一層問」。大部分網路上的 AI 教學停在「指令格式」層級——加上身份、加上情境、加上範例，這些都對，但都是「同一層裡寫得更好」。階梯是「你跟 AI 的分工結構整個不一樣」。

我用一個比喻：階梯 1 是把 AI 當「會打字的下屬」，階梯 2 是把 AI 當「資料豐富的助理」，階梯 3 是把 AI 當「願意被你挑戰的對手」。三個位置產出的東西，差距不是 10%、20%，是整個層次的差別。

階梯	你的角色	AI 的角色	產出特徵	典型卡點
階梯 1｜複述層	使用者	會打字的下屬	速度快、跟別人寫的差不多	東西多但沒記憶點
階梯 2｜整合層	編輯	素材庫	有結構、能用、但缺新意	觀點不夠尖
階梯 3｜質詢層	主導者	對手	有觀點、能撐住反駁	耗腦、不能批量

很多人以為自己在階梯 3，其實在階梯 1。判斷方法很簡單——把你最近一次的 AI 對話從頭到尾讀一遍，看 AI 寫的東西和你「主動補進去的思考」哪個比例高。如果 AI 字數比你多很多、而且你大多在按「接受」，那你在第一層。

階梯 1「複述層」：為什麼大部分人卡在這、自己卻沒發現？

因為複述層在交付速度上「看起來」最有效率。你問 AI 一個問題，它給你答案，你貼到文件裡稍微改幾個字交出去。一週的工作量你三天搞定，剩下兩天滑手機。對個人時間最好、對組織貢獻最低。

我第一次意識到自己在這層，是看了一份我寫的簡報。每張投影片單獨看都還行，但整份拉開來——邏輯結構是 ChatGPT 預設的「五段式論述法」，因為我問它「幫我列五個重點」太多次了。簡報變成 AI 的思考骨架，我只是「翻譯員」。

研究界對這現象有專有名詞，叫「認知卸載」（cognitive offloading）。一份 2025 年發表在《Societies》期刊的研究調查 666 名使用者，發現 AI 工具使用度跟批判性思考能力呈高度負相關（r = -0.68），中間的中介變項就是認知卸載。

怎麼分辨自己有沒有卡在這層？三個訊號自我檢查：

❶ AI 答案出來，第一反應是「貼進去」而不是「為什麼是這個」。你連看都沒仔細看，直接複製貼上。

❷ 寫完的東西，三天後重看不知道自己寫了什麼。因為那些字本來就不是你想出來的，只是經你的手轉一道。

❸ 換一個 AI 用，發現答案差很多，但說不出哪個比較好。因為你沒在判斷品質，只在收貨。

📌 重點整理：複述層不是壞事，做行政性、模板性的工作很好用。問題是當你重要的產出（策略、提案、決策）也在這層，你的職場價值就在被 AI 反向稀釋。

階梯 2「整合層」：怎麼讓 AI 退到副駕、你拿回方向盤？

整合層的關鍵動作是「先有結構、再找素材」。你先想好這篇東西要解決什麼問題、論證的骨架是什麼，再去問 AI「這個論點有沒有相反觀點」「這個區塊我需要三個案例」。AI 從「主角」退到「副駕」，你拿回方向盤。

這層的產出特徵很好認：結構是你的、語氣是你的、案例和數據可能來自 AI 整合，但通過你的篩選。我自己寫文章現在大概 70% 的時間在這層。會先在筆記本（紙本，不騙你）畫一個架構，列出五個主要論點，每個論點下面寫「我要的證據型態」。

等架構穩了再開 Claude 或 ChatGPT。但我問的不是「幫我寫一篇關於 X 的文章」，而是「我想論證 Y，請給我三個反對這個論點的最強論述」「這個數據還有什麼更新的版本」。問題很具體，答案也具體。

整合層最大的進步空間在「篩」。我自己踩過的坑：曾經要 ChatGPT 給十個遠端工作案例，全部塞進文章，長到 6000 字，但讀完最深的印象只剩「資訊很多」。後來才懂——整合不是收集，整合是「為了我的論點，最少需要哪幾個證據」。

身邊一位內容主管說，她團隊新人最大的盲點是「用 AI 之後文章越寫越長，論點越來越淡」。長度跟說服力是兩件事。在這層卡關時，可以看看AI 寫作 7 個常見問題的修補指南，那篇切「修改技巧層」，跟本文的「思維結構層」剛好搭配。

📚 寫到這裡我想停一下——整合層處理的是「怎麼用 AI 不被它牽著走」。但如果你想往更高一階走，需要的不是更多 Prompt 技巧，而是改變你「面對問題的思考方式」。

這個主題我寫成了一本書《思維轉捩點：AI 揭示的七種全新思考方式》，把七種思考切換拆成具體的場景案例。如果你已經感覺自己在第二層撞牆，這本書可能是你需要的下一塊拼圖：

📖 查看《思維轉捩點：AI 揭示的七種全新思考方式》

階梯 3「質詢層」：怎麼逼 AI 對抗自己的答案？

質詢層的核心動作只有一個：你不接受第一個答案。AI 回完問題，下一句不是「謝謝，下一題」，而是「這結論的前提假設有哪些可能不成立？」「換成台灣中小企業脈絡還站得住嗎？」「給我三個反駁這篇答案的角度」。

這層產出的東西，特徵是「有觀點」。觀點不是「我喜歡 X」，而是「在 A、B、C 三個條件下我主張 D，理由是 E、F、G，但 D 在 H 情境下會失靈」。一個完整觀點包含主張、條件、理由、限制——這套結構是 AI 預設不會自己給你的。

MIT Sloan 資深講師 Hal Gregersen 設計的「Question Burst Catalyst」工具有一條反直覺的順序：使用者得先自己快速丟出一連串有挑戰性的問題，AI 才被允許加入。Gregersen 直白解釋這個設計——「把問問題外包給 AI 的團隊，自己的催化式提問能力會萎縮」。他也提醒：LLM 預設給的是「average, meme-type response」（平均、迎合式的答案），要逼出真正的洞察，得先把問題的密度堆起來。

追問類型	典型句型	逼 AI 做什麼
挑戰前提	「這個結論基於哪些假設？哪些假設換掉之後結論會反轉？」	讓 AI 暴露它沒講出來的條件
反向視角	「如果你是反對方，你會怎麼拆解這個論述？」	讓 AI 自己生對立面
脈絡轉移	「換成 X 產業／文化／規模，這套還適用嗎？」	逼 AI 區分通用原則與情境限制
邊界探測	「在什麼情況下，這個建議反而會造成傷害？」	讓 AI 主動列出失效條件

這層最大的成本是耗腦。一篇文章走完三層流程，整合層大概 1 小時、質詢層再花 1-2 小時。但寫出來的東西，三個月後我自己重看還是會點頭——因為觀點是被反覆攻擊過的。

關於不同 AI 在質詢層的表現，三大 AI 分工的實戰場景對照表有更細的拆解。簡單講：Claude 比較願意陪你打回合制辯論，ChatGPT 容易「妥協」改答案，Gemini 適合查資料但反思深度偏淺。

📌 重點整理：質詢層不是每篇都要走，重要的事情才需要。但如果你工作裡「重要的事」一年也沒走過一次質詢層，那你的工作大概在被 AI 蠶食而不是被 AI 放大。

我從階梯 1 爬到階梯 3 踩過的三個坑是什麼？

踩坑一：把「不舒服」誤判為「AI 沒用」。追問之下 AI 會說「這個論點需要更多資料才能確認」「在某些條件下結論不成立」，看起來很弱。那種「弱」才是真實，前面那種「強」是它在配合我的預期。不舒服才是進步的訊號。

踩坑二：把追問當折磨自己。我曾經一小時對 AI 追問 30 次，結果第 7 個追問其實就有了。停手標準是：下一個追問如果出現，會不會改變結論？不會就該收。

踩坑三：以為三個階梯有高下之分。三個階梯是「依任務匹配」，不是「越高越好」。週報、會議記錄、標準客服信留在階梯 1 最有效率。判斷標準是「這件事的失敗成本有多大」——成本越高，越往上走。

從去年到現在我跑過大概 80 次「用 AI 完成一份重要產出」的流程（PRD、提案、用戶研究分析、決策備忘），回頭看，真正讓我在工作上拿到正向反饋的，幾乎都是走到階梯 3 的那 15 次。其他 65 次有用但忘得快。這 80:15 的比例本身就是個提醒——多數人在多數時候，會自然滑回階梯 1。

怎麼把三個階梯放進你的日常工作流？

不用全篇升級，從「分流」開始。把你一週的工作項目列出來，標上「失敗成本高 / 中 / 低」。失敗成本低的（行政、模板、回標準信）就守在階梯 1，速度優先。中等的（內部文件、團隊溝通）走階梯 2，結構優先。失敗成本高的（對外提案、策略文件、決策建議）強制走階梯 3，觀點優先。

建議直接寫在每天開工前的便利貼上——花 1 分鐘決定「今天這 5 件事各在哪一層」。一週下來會發現，原本以為很多事該在階梯 3，其實有一半可以下放。

第二個建議是每週留 90 分鐘的「質詢時段」。固定時間、固定 AI、固定主題，跟 AI 至少走 5 個追問。我自己排在週五下午，週內的事情大致清空，腦袋有空間做這種耗腦的事。大概 6 週後會明顯感覺到「我問問題的角度變不一樣」。

第三個建議是寫「思考日誌」。不是工作日誌，是「今天我有沒有比昨天問出更好的問題」。一句話就夠。三個月後翻回去看，思維形狀真的會有變動。想往「問問題」多走一階，可以接著看設計問題這項元認知能力的拆解。

常見問題 FAQ

AI 思考階梯跟一般 Prompt 教學有什麼不同？

Prompt 教學處理「指令怎麼下」，思考階梯處理「你跟 AI 的分工結構」。同一個 Prompt，在階梯 1 是「給我答案」、在階梯 3 是「對抗我的答案」。Prompt 技巧是戰術，思考階梯是戰略。

新手該從哪一個階梯開始？

新手會自然從階梯 1 起步，先把「會用」做順。大概用滿一個月後刻意往階梯 2 挪——每次發問前花 30 秒寫下「我想得到什麼具體的東西」，光這個動作就會推你從複述層到整合層。階梯 3 不用急，滿三個月再嘗試比較不會卡。

每次都走階梯 3 會不會太累？

會，沒必要。階梯 3 是「重要決策的保險絲」，不是常態。我自己一週走 1-2 次階梯 3，其他時間在階梯 1 跟 2 之間切換。把所有事都當大事處理，反而在真正的大事上沒力氣。

用 AI 久了，思考能力真的會退化嗎？

MIT 的 EEG 研究指出 LLM 重度使用者的大腦連結變弱、停掉 AI 後仍持續一段時間。退化是真的，但退化的不是「能力」而是「肌肉量」——只要刻意在某些情境保留「自己想」的習慣，就能維持思考肌力。

哪些工作不適合走思考階梯這套？

純體力勞動、規格固定的行政工作、即時反應沒空細想的場景（客服、急件處理），走階梯 1 就好。思考階梯適合「需要主觀判斷、需要說服別人、需要在多方案間取捨」的知識工作。如果工作 80% 是固定流程，把那 20% 的判斷型任務練好就夠了。

結論：先決定要不要「變強」，再決定怎麼用 AI

三個 AI 思考階梯本質是把「使用者主體性」這件事說清楚。AI 不會幫你決定在哪一層工作，是你決定的。最近一年我看到太多人陷入「用了 AI 但職場價值沒進步」的困惑——他們以為「用得多」等於「用得好」，沒意識到自己一直停在階梯 1。

速度和深度是兩件事。AI 能讓你變快，但變不變強要看你願不願意花時間在質詢層。不是 AI 讓你變平庸，是你選擇了用 AI 的最低層。

如果你想看到更多「AI 怎麼真正幫你成長」的內容，歡迎訂閱夜羽凌的部落格，訂閱後會不定期收到信，不會塞爆你的信箱。