AI 讓你變快但不會讓你變強:拉開職場差距的三個 AI 思考階梯

目錄

上週朋友傳訊問我:「為什麼我用 AI 一年了,產出的東西速度變快,但老闆對我評價沒有真的變高?」我看完她傳過來的範例,心裡的答案很直接——她爬到了「快」的階梯,卻沒爬上「強」的階梯

AI 思考階梯不是 prompt 技巧,是你跟 AI 之間「誰在主導思考」的分工結構。我自己跌跌撞撞走了快兩年,整理出三個階梯:複述層、整合層、質詢層。今天把這套拆給你看,順便聊一下為什麼大部分人卡在第一層動不了。


AI 真的讓人變聰明嗎?MIT 用 EEG 看了 4 個月給出什麼結論?

結論很直白:用得越多、神經連結越弱。MIT Media Lab 在 2025 年發表的「Your Brain on ChatGPT」研究把參與者分三組(純大腦、搜尋引擎、LLM 輔助)寫作四個月,用腦電圖 EEG 觀察大腦活動。結果是 LLM 組的大腦連結最弱,純大腦組最強,搜尋引擎組落在中間。

更刺眼的是後續實驗:當研究團隊把 LLM 組的人換到純大腦組寫文章,他們的 alpha 和 beta 腦波連結仍然偏低——「認知債」會持續一段時間,停掉 AI 不代表大腦自動回血。LLM 組對自己文章的「擁有感」最低,連自己引用過的內容都背不太出來。

微軟研究院 2025 年初訪談 319 名知識工作者得出類似結論:對 AI 越有信心的人,自己投入的批判性思考越少;對「自己」有信心的人,反而更認真檢查 AI 的輸出。兩個信心走相反方向,值得停下來想一下你站在哪邊。

📌 重點整理:AI 不會自動讓你變聰明。它幫你省下的時間,如果沒拿去做更高層次的思考,會直接轉成「神經連結變弱」的代價。「快」跟「強」不是同一件事。


三個 AI 思考階梯到底是什麼?跟 Prompt 教學差在哪?

Prompt 教學講「怎麼問」,思考階梯講「你站在哪一層問」。大部分網路上的 AI 教學停在「指令格式」層級——加上身份、加上情境、加上範例,這些都對,但都是「同一層裡寫得更好」。階梯是「你跟 AI 的分工結構整個不一樣」。

我用一個比喻:階梯 1 是把 AI 當「會打字的下屬」,階梯 2 是把 AI 當「資料豐富的助理」,階梯 3 是把 AI 當「願意被你挑戰的對手」。三個位置產出的東西,差距不是 10%、20%,是整個層次的差別

階梯

你的角色

AI 的角色

產出特徵

典型卡點

階梯 1|複述層

使用者

會打字的下屬

速度快、跟別人寫的差不多

東西多但沒記憶點

階梯 2|整合層

編輯

素材庫

有結構、能用、但缺新意

觀點不夠尖

階梯 3|質詢層

主導者

對手

有觀點、能撐住反駁

耗腦、不能批量

很多人以為自己在階梯 3,其實在階梯 1。判斷方法很簡單——把你最近一次的 AI 對話從頭到尾讀一遍,看 AI 寫的東西和你「主動補進去的思考」哪個比例高。如果 AI 字數比你多很多、而且你大多在按「接受」,那你在第一層。


階梯 1「複述層」:為什麼大部分人卡在這、自己卻沒發現?

因為複述層在交付速度上「看起來」最有效率。你問 AI 一個問題,它給你答案,你貼到文件裡稍微改幾個字交出去。一週的工作量你三天搞定,剩下兩天滑手機。對個人時間最好、對組織貢獻最低。

我第一次意識到自己在這層,是看了一份我寫的簡報。每張投影片單獨看都還行,但整份拉開來——邏輯結構是 ChatGPT 預設的「五段式論述法」,因為我問它「幫我列五個重點」太多次了。簡報變成 AI 的思考骨架,我只是「翻譯員」。

研究界對這現象有專有名詞,叫「認知卸載」(cognitive offloading)。一份 2025 年發表在 《Societies》期刊的研究調查 666 名使用者,發現 AI 工具使用度跟批判性思考能力呈高度負相關(r = -0.68),中間的中介變項就是認知卸載。

怎麼分辨自己有沒有卡在這層?三個訊號自我檢查:

❶ AI 答案出來,第一反應是「貼進去」而不是「為什麼是這個」。你連看都沒仔細看,直接複製貼上。

❷ 寫完的東西,三天後重看不知道自己寫了什麼。因為那些字本來就不是你想出來的,只是經你的手轉一道。

❸ 換一個 AI 用,發現答案差很多,但說不出哪個比較好。因為你沒在判斷品質,只在收貨。

📌 重點整理:複述層不是壞事,做行政性、模板性的工作很好用。問題是當你重要的產出(策略、提案、決策)也在這層,你的職場價值就在被 AI 反向稀釋。


階梯 2「整合層」:怎麼讓 AI 退到副駕、你拿回方向盤?

整合層的關鍵動作是「先有結構、再找素材」。你先想好這篇東西要解決什麼問題、論證的骨架是什麼,再去問 AI「這個論點有沒有相反觀點」「這個區塊我需要三個案例」。AI 從「主角」退到「副駕」,你拿回方向盤。

這層的產出特徵很好認:結構是你的、語氣是你的、案例和數據可能來自 AI 整合,但通過你的篩選。我自己寫文章現在大概 70% 的時間在這層。會先在筆記本(紙本,不騙你)畫一個架構,列出五個主要論點,每個論點下面寫「我要的證據型態」。

等架構穩了再開 Claude 或 ChatGPT。但我問的不是「幫我寫一篇關於 X 的文章」,而是「我想論證 Y,請給我三個反對這個論點的最強論述」「這個數據還有什麼更新的版本」。問題很具體,答案也具體。

整合層最大的進步空間在「篩」。我自己踩過的坑:曾經要 ChatGPT 給十個遠端工作案例,全部塞進文章,長到 6000 字,但讀完最深的印象只剩「資訊很多」。後來才懂——整合不是收集,整合是「為了我的論點,最少需要哪幾個證據」

身邊一位內容主管說,她團隊新人最大的盲點是「用 AI 之後文章越寫越長,論點越來越淡」。長度跟說服力是兩件事。在這層卡關時,可以看看AI 寫作 7 個常見問題的修補指南,那篇切「修改技巧層」,跟本文的「思維結構層」剛好搭配。

📚 寫到這裡我想停一下——整合層處理的是「怎麼用 AI 不被它牽著走」。但如果你想往更高一階走,需要的不是更多 Prompt 技巧,而是改變你「面對問題的思考方式」。

這個主題我寫成了一本書《思維轉捩點:AI 揭示的七種全新思考方式》,把七種思考切換拆成具體的場景案例。如果你已經感覺自己在第二層撞牆,這本書可能是你需要的下一塊拼圖:

📖 查看《思維轉捩點:AI 揭示的七種全新思考方式》


階梯 3「質詢層」:怎麼逼 AI 對抗自己的答案?

質詢層的核心動作只有一個:你不接受第一個答案。AI 回完問題,下一句不是「謝謝,下一題」,而是「這結論的前提假設有哪些可能不成立?」「換成台灣中小企業脈絡還站得住嗎?」「給我三個反駁這篇答案的角度」。

這層產出的東西,特徵是「有觀點」。觀點不是「我喜歡 X」,而是「在 A、B、C 三個條件下我主張 D,理由是 E、F、G,但 D 在 H 情境下會失靈」。一個完整觀點包含主張、條件、理由、限制——這套結構是 AI 預設不會自己給你的。

MIT Sloan 資深講師 Hal Gregersen 設計的 「Question Burst Catalyst」工具有一條反直覺的順序:使用者得先自己快速丟出一連串有挑戰性的問題,AI 才被允許加入。Gregersen 直白解釋這個設計——「把問問題外包給 AI 的團隊,自己的催化式提問能力會萎縮」。他也提醒:LLM 預設給的是「average, meme-type response」(平均、迎合式的答案),要逼出真正的洞察,得先把問題的密度堆起來。

追問類型

典型句型

逼 AI 做什麼

挑戰前提

「這個結論基於哪些假設?哪些假設換掉之後結論會反轉?」

讓 AI 暴露它沒講出來的條件

反向視角

「如果你是反對方,你會怎麼拆解這個論述?」

讓 AI 自己生對立面

脈絡轉移

「換成 X 產業/文化/規模,這套還適用嗎?」

逼 AI 區分通用原則與情境限制

邊界探測

「在什麼情況下,這個建議反而會造成傷害?」

讓 AI 主動列出失效條件

這層最大的成本是耗腦。一篇文章走完三層流程,整合層大概 1 小時、質詢層再花 1-2 小時。但寫出來的東西,三個月後我自己重看還是會點頭——因為觀點是被反覆攻擊過的

關於不同 AI 在質詢層的表現,三大 AI 分工的實戰場景對照表有更細的拆解。簡單講:Claude 比較願意陪你打回合制辯論,ChatGPT 容易「妥協」改答案,Gemini 適合查資料但反思深度偏淺。

📌 重點整理:質詢層不是每篇都要走,重要的事情才需要。但如果你工作裡「重要的事」一年也沒走過一次質詢層,那你的工作大概在被 AI 蠶食而不是被 AI 放大。


我從階梯 1 爬到階梯 3 踩過的三個坑是什麼?

踩坑一:把「不舒服」誤判為「AI 沒用」。追問之下 AI 會說「這個論點需要更多資料才能確認」「在某些條件下結論不成立」,看起來很弱。那種「弱」才是真實,前面那種「強」是它在配合我的預期。不舒服才是進步的訊號。

踩坑二:把追問當折磨自己。我曾經一小時對 AI 追問 30 次,結果第 7 個追問其實就有了。停手標準是:下一個追問如果出現,會不會改變結論?不會就該收。

踩坑三:以為三個階梯有高下之分。三個階梯是「依任務匹配」,不是「越高越好」。週報、會議記錄、標準客服信留在階梯 1 最有效率。判斷標準是「這件事的失敗成本有多大」——成本越高,越往上走。

從去年到現在我跑過大概 80 次「用 AI 完成一份重要產出」的流程(PRD、提案、用戶研究分析、決策備忘),回頭看,真正讓我在工作上拿到正向反饋的,幾乎都是走到階梯 3 的那 15 次。其他 65 次有用但忘得快。這 80:15 的比例本身就是個提醒——多數人在多數時候,會自然滑回階梯 1。


怎麼把三個階梯放進你的日常工作流?

不用全篇升級,從「分流」開始。把你一週的工作項目列出來,標上「失敗成本高 / 中 / 低」。失敗成本低的(行政、模板、回標準信)就守在階梯 1,速度優先。中等的(內部文件、團隊溝通)走階梯 2,結構優先。失敗成本高的(對外提案、策略文件、決策建議)強制走階梯 3,觀點優先。

建議直接寫在每天開工前的便利貼上——花 1 分鐘決定「今天這 5 件事各在哪一層」。一週下來會發現,原本以為很多事該在階梯 3,其實有一半可以下放。

第二個建議是每週留 90 分鐘的「質詢時段」。固定時間、固定 AI、固定主題,跟 AI 至少走 5 個追問。我自己排在週五下午,週內的事情大致清空,腦袋有空間做這種耗腦的事。大概 6 週後會明顯感覺到「我問問題的角度變不一樣」。

第三個建議是寫「思考日誌」。不是工作日誌,是「今天我有沒有比昨天問出更好的問題」。一句話就夠。三個月後翻回去看,思維形狀真的會有變動。想往「問問題」多走一階,可以接著看設計問題這項元認知能力的拆解


常見問題 FAQ

AI 思考階梯跟一般 Prompt 教學有什麼不同?

Prompt 教學處理「指令怎麼下」,思考階梯處理「你跟 AI 的分工結構」。同一個 Prompt,在階梯 1 是「給我答案」、在階梯 3 是「對抗我的答案」。Prompt 技巧是戰術,思考階梯是戰略。

新手該從哪一個階梯開始?

新手會自然從階梯 1 起步,先把「會用」做順。大概用滿一個月後刻意往階梯 2 挪——每次發問前花 30 秒寫下「我想得到什麼具體的東西」,光這個動作就會推你從複述層到整合層。階梯 3 不用急,滿三個月再嘗試比較不會卡。

每次都走階梯 3 會不會太累?

會,沒必要。階梯 3 是「重要決策的保險絲」,不是常態。我自己一週走 1-2 次階梯 3,其他時間在階梯 1 跟 2 之間切換。把所有事都當大事處理,反而在真正的大事上沒力氣。

用 AI 久了,思考能力真的會退化嗎?

MIT 的 EEG 研究指出 LLM 重度使用者的大腦連結變弱、停掉 AI 後仍持續一段時間。退化是真的,但退化的不是「能力」而是「肌肉量」——只要刻意在某些情境保留「自己想」的習慣,就能維持思考肌力。

哪些工作不適合走思考階梯這套?

純體力勞動、規格固定的行政工作、即時反應沒空細想的場景(客服、急件處理),走階梯 1 就好。思考階梯適合「需要主觀判斷、需要說服別人、需要在多方案間取捨」的知識工作。如果工作 80% 是固定流程,把那 20% 的判斷型任務練好就夠了。


結論:先決定要不要「變強」,再決定怎麼用 AI

三個 AI 思考階梯本質是把「使用者主體性」這件事說清楚。AI 不會幫你決定在哪一層工作,是你決定的。最近一年我看到太多人陷入「用了 AI 但職場價值沒進步」的困惑——他們以為「用得多」等於「用得好」,沒意識到自己一直停在階梯 1。

速度和深度是兩件事。AI 能讓你變快,但變不變強要看你願不願意花時間在質詢層。不是 AI 讓你變平庸,是你選擇了用 AI 的最低層

如果你想看到更多「AI 怎麼真正幫你成長」的內容,歡迎訂閱夜羽凌的部落格,訂閱後會不定期收到信,不會塞爆你的信箱。


延伸閱讀

 

延伸閱讀