不同 AI 的 Prompt 寫法差在哪？Claude、ChatGPT、Gemini 下指令完整攻略

💡 核心結論速覽 (TL;DR)
核心差異：同一句 Prompt 丟三家結果差很多——Claude 偏愛 XML 標籤結構、ChatGPT 吃 Markdown＋格式指令、Gemini 適合「角色＋任務＋情境＋格式」四要素框架。
為什麼重要：搞懂這些差異前，我大概浪費了幾百次無效對話。
怎麼寫：給 Claude 用 XML 包結構、給 ChatGPT 用 Markdown 標重點、給 Gemini 補齊四要素。
行動：把你最常用的那句 Prompt，按目標模型的偏好改寫一次，立刻有感。

同樣一句 Prompt，丟到三家 AI 給出來的結果常常差到像兩個人寫的。核心原因很簡單：Claude 偏愛 XML 標籤結構、ChatGPT 吃 Markdown 與格式指令、Gemini 適合角色＋任務＋情境＋格式的四要素框架。

這篇 AI Prompt 教學會把三家模型官方文件裡寫的偏好、我這一年實測踩過的坑、和同一個任務在三家寫法差多少一次講完。我自己經營 AI 工具部落格第三年，每天同一個問題會丟進三家比一遍。一開始我以為 Prompt 就是 Prompt，頂多換個字。後來發現差別大到離譜。

搞懂這些差異之前，我浪費了大概幾百次無效對話。這篇會告訴你：三家各自的 Prompt 偏好有什麼科學根據、為什麼同一句指令結果會差這麼多、三家的「好用公式」分別長什麼樣，還有我怎麼用同一個寫文章任務去對比它們的表現。

為什麼不同 AI 的 Prompt 效果會差這麼多？

同一句 Prompt 放到不同模型結果差很多（這也是很多人寫 Prompt 最大的誤區），主要是因為訓練資料和格式偏好不同。Anthropic 官方文件明確指出 Claude 是特別被訓練來辨識 XML 標籤。

OpenAI 文件則建議 GPT-5 系列使用 Markdown 與明確的 output contract；Google 官方 Gemini for Workspace 指南主打「角色、任務、情境、格式」四要素。訓練方向不同，你餵給它的結構當然要不一樣。

我第一次意識到 Prompt 要分家寫，是在做一篇長文大綱時。同一個 2000 字的 brief，我用純文字段落丟進 Claude，它處理得亂七八糟。

加了 <context> 和 <task> 標籤後，結果立刻從「可用」變成「幾乎不用改」。後來丟進 ChatGPT 試，反而 Markdown 標題加清單寫得更漂亮。

📌 重點整理：Claude 吃 XML 結構、ChatGPT 吃 Markdown 與明確格式要求、Gemini 吃角色＋任務四要素。理解差異之後，同一個指令換個寫法就能省下一半的往返次數。

還有一個容易被忽略的點：不同模型的預設回應風格不一樣。Gemini 3 系列官方文件直接講明，它預設就是給「直接、效率」的答案，你要它寫得詳細必須明說。ChatGPT 預設比較口語，Claude 預設會主動給結構化的段落。

所以「要不要多解釋一點」這種基本指令，在三家就不該用同一句話。這是 AI Prompt 教學裡最容易被新手忽略的第一課。

Claude 的 Prompt 怎麼寫最有效？XML 標籤是關鍵

Claude Prompt 用 XML 標籤分段，準確度和穩定度會明顯提升。Anthropic 官方 Prompt Engineering 指南直接建議：把指令、範例、上下文、格式要求分別包在各自的標籤裡。

常用標籤名稱像是 <instructions>、<example>、<context>、<formatting>，不需要固定，但同一份 Prompt 裡要保持一致。

Claude 比對訓練分佈後更容易抓到重點。這是 Claude Prompt 和其他模型最大的差異點。

這不是迷信。官方原文寫「Claude was trained specifically to recognize XML tags」，意思就是這模型從訓練階段就被教會 XML 標籤是一種結構信號。

我自己最常用的 Claude 公式是這四步驟：

❶ 用 <context> 放背景。包括讀者、平台、我目前遇到的狀況。Claude 對背景敏感，你給得清楚它就不會亂假設。

❷ 用 <task> 放具體任務。動詞開頭、明確到不能再明確，例如「改寫成口語 FAQ 風格、每題 60 字內」。

❸ 用 <example> 放 1-2 個範例。Claude 對範例的模仿能力非常強，只要給一個合格的樣本，它的輸出就會穩定在那個品質線上。

❹ 用 <constraints> 放禁止事項。我常寫「禁止使用：值得注意的是、綜上所述、不僅⋯還⋯」，Claude 遵守率超過九成。

補充一個實戰心得：Claude 特別擅長抓寫作語氣。你丟一篇你之前的文章進去 <example>，請它模仿你寫下一段，出力的語感精準度是三家裡最高的。這也是為什麼 Claude vs ChatGPT 長文寫作那篇我會說「Claude 寫好字、ChatGPT 整合強」——差別就差在這裡。

ChatGPT 的 Prompt 偏好是什麼？Markdown 與格式優先

ChatGPT 最吃「先講格式、再講任務、最後給內容」這種結構，搭配 Markdown 會輸出得很漂亮。OpenAI 官方 Prompt Engineering Guide 和 GPT-5 Cookbook 反覆強調兩個詞：output contract（輸出契約）和 verbosity（冗長度）。

白話講就是——你要先把「最後希望拿到什麼」寫清楚，ChatGPT 就會穩穩給你。ChatGPT Prompt 的核心邏輯和 Claude 不同，它要的是格式契約，不是語意分段。

我這兩年用下來，歸納 ChatGPT Prompt 的好用公式是這樣四步：

❶ 開頭先寫輸出格式。第一句就寫「請以表格回答，欄位為 X、Y、Z」或「請用條列式，每點不超過 30 字」。ChatGPT 看到格式指令擺前面，配合度比放最後高得多。

❷ 角色設定用 Markdown 標題分段。例如 ## 角色、## 任務、## 限制 這樣寫，效果幾乎等同 Claude 的 XML 標籤。

❸ 長任務要求它先列步驟再執行。「先把你打算怎麼做列成編號清單，我確認後再開始」，這種兩段式做法比一次做到底錯得少很多。

❹ 明講 verbosity。「請寫 300 字以內，不要 500 字」比「請簡短回答」有用。ChatGPT 對具體字數比較願意配合。

有一個小技巧我特別推薦：結構化輸出直接要求 JSON。ChatGPT 的 JSON 格式穩定度在三家裡最高，你告訴它「請輸出為 JSON，鍵為 title、summary、tags」，它會乖乖給。這個在串 API 或自動化時超省事。

但我必須誠實說，ChatGPT 在中文語感和情緒表達上不如 Claude，寫出來的東西容易有「太工整、太樣板」的感覺，這點要有心理準備。

📌 重點整理：Claude 用 XML 標籤分段、ChatGPT 用 Markdown＋格式優先，這兩家的基本公式差很多。同一個任務在 Claude 寫得穩，在 ChatGPT 可能還要多兩輪才到位。

Gemini 的 Prompt 要怎麼下？Persona 四要素是起手式

Google 官方「Gemini for Workspace Prompting Guide」主打四要素：Persona、Task、Context、Format。翻成白話就是「你是誰、要做什麼、背景是什麼、結果長怎樣」。這四個要素不一定要全用，但用到三個以上結果會穩很多。

官方 PDF 裡給的範例是這樣一句話：「我是一個專案經理（Persona），需要建立一份詳細的專案追蹤表（Task），用於網站改版專案（Context），請用簡單表格呈現（Format）。」

這種寫法最大的好處是——你不用去記什麼 XML 或 Markdown，照著這個公式組裝，Gemini 就能吃。我自己實測下來，Gemini 有幾個特別要注意的點：

❶ 預設回答偏短，要顯式要求詳細。Google 官方說明 Gemini 3 預設給「直接、高效」的答案，你想要深度分析就必須寫「請詳細說明，至少 600 字」。

❷ 研究類任務優勢明顯。我需要整理某主題最新新聞或找資料時，Gemini 因為整合 Google 搜尋的關係，拿到的資訊比較新。但它常常不主動附來源連結，要記得寫「請附上資料來源網址」。

❸ 整合 Workspace 是殺手鐧。Gemini 在 Docs、Sheets、Gmail 裡的側邊欄，可以直接讀取你當前文件的內容。我寫文章時把資料整理進 Google Docs，再側邊欄開 Gemini 問它「幫我從這份資料抓出三個重點」，這種流程其他家做不到。

❹ 多模態輸入是強項。丟圖片進去請它分析，Gemini 的回應細節度和準確度在三家裡很前面，尤其是圖表判讀。

同一個任務丟三家，寫法差到什麼程度？

為了讓這件事更具體，我拿「幫我寫一段 300 字的咖啡店開幕文案」當案例，用三家偏好的格式各下一次指令，看結果差多少。

先講結論：三個 Prompt 長得完全不一樣，但核心資訊一樣。差別在於你用什麼「語言」跟模型溝通。

模型	推薦 Prompt 寫法	適合場景	實測感受
Claude	<context>咖啡店...</context><task>寫開幕文案</task><constraints>300字內、口語</constraints>	長文、創作、仿寫語氣	語感自然，幾乎不用改
ChatGPT	## 格式 300 字、口語、帶情緒 ## 任務寫咖啡店開幕文案 ## 背景 ...	結構化輸出、JSON、表格	結構整齊，但情緒較平
Gemini	我是獨立咖啡店主（角色），需要寫開幕文案（任務），主打手沖＋輕食（情境），Instagram 貼文格式、300 字、帶一個 CTA（格式）	研究、多模態、Workspace 整合	資訊準確，但文字偏正式

三家我各跑五次，用同一句開幕文案需求。Claude 有四次直接可用、一次需要小修；ChatGPT 有兩次直接可用、三次需要調口氣；Gemini 有一次直接可用、四次需要重寫。

這個結果跟 Anthropic 官方文件講「Claude 特別擅長寫作風格」是吻合的。但別誤會——Gemini 不是輸。我拿「整理這五篇報導的重點，附來源網址」這種研究任務去比，Gemini 反而是最快最準的。

我之前寫 AI 長尾關鍵字研究那篇就是用 Gemini 找題目、ChatGPT 驗證熱度、Claude 寫出文章，分工清楚後效率高很多。AI 提示詞的正確用法就是分工，不是單打獨鬥。

三家寫法差異講到這裡，但 Prompt 不只是「格式不同」，背後其實是三家 AI 思維機制差異。如果你是用 AI 工作的人、想搞懂為什麼同一個問題給三個 AI 答案差這麼多，這本《AI 產品設計大師：三大 AI 的思維解碼與實戰指南》深入拆解三家的思維底層：
📖 查看《AI 產品設計大師》
如果你已經會用 AI、但想再往「怎麼問」這層升級，《思維轉捩點：AI 揭示的七種全新思考方式》談 AI 時代的問題設計能力：
📖 查看《思維轉捩點》

我自己用 AI 下指令踩過的三大坑

理論講完，來講我真正用了上千次之後的慘痛教訓。這三個坑，我全部踩過，而且第三個直到今年才徹底擺脫。

坑一：以為一個 Prompt 就能在三家通用。這是我最大的誤區，持續了大半年。我把 Claude 寫得很好的 XML 版本直接複製到 ChatGPT，覺得「反正都是 AI」，結果 ChatGPT 回得亂七八糟。

後來發現 ChatGPT 看到大量 XML 標籤時，容易把標籤當內容的一部分，整個出力就歪掉。解法是同一個核心任務，我會存三個版本的 Prompt 模板，對應三家模型。這是 AI Prompt 教學最容易被忽略的實戰細節。

坑二：沒寫明禁止事項。三家 AI 都有自己的「口頭禪」——ChatGPT 愛寫「值得注意的是」、Claude 會塞「不僅⋯還⋯」、Gemini 動不動來一句「總而言之」。我剛開始以為只能事後刪，後來發現在 Prompt 裡明寫「禁止使用這些詞」，遵守率可以到 85% 以上。

這招在 Claude 特別有效，寫在 <constraints> 標籤裡幾乎不會違規。ChatGPT 也適用，但偶爾會溜出來一兩個，建議每次輸出都掃一次。

坑三：給太多背景卻沒標清主次。我以前以為「講越多越好」，結果 Claude 會把所有東西都當平等重要，寫出來失焦；ChatGPT 乾脆忽略一半；Gemini 直接回短版敷衍你。

後來我學會用「優先序」寫法——「最重要的是 A，其次是 B，如果篇幅允許再考慮 C」——三家的準確率都明顯上升。如果你正在經營內容網站，我強烈建議你把 Prompt 當成經營副業的核心資產來累積。

怎麼建立自己的 Prompt 模板庫？四步驟操作指南

講了這麼多差異，很多人會卡在「所以我現在該怎麼開始」。我整理出一個最簡化的四步驟，你今天就能跑一次。

❶ 先挑一個你最常做的任務。例如「寫社群貼文」、「改寫文案」、「整理會議重點」——從高頻任務下手，改善效果才明顯。

❷ 用三家各寫一版 Prompt。Claude 用 XML 標籤、ChatGPT 用 Markdown、Gemini 用 Persona 四要素。同樣的核心內容、三套語法。

❸ 同樣輸入跑五次，記錄哪家最穩。不是跑一次決勝負，五次才看得出穩定性。我自己的 Notion 模板會記錄「可直接用 / 小修 / 重寫」三個欄位。

❹ 把最穩的那版存成模板，下次直接用。我寫 SEO 文章的工作流就是這樣建立起來的——前三個月測試、後來全部模板化，現在每篇文章 Prompt 幾乎不用重寫。

📌 重點整理：Prompt 模板的價值不是第一次用，是第一百次用。前期花兩小時測試調整，後面每篇文章省二十分鐘，一年就是一百小時。

寫 Prompt 只是使用 AI 的一個环節，選對工具也同樣重要。不確定哪些免費 AI 能肩負你的日常需求，可以參考 2026 年最值得試的 8 款免費 AI 工具，都是實測了50+款之後每天都留下來在用的。

選對寫法之前，先把模型選對也很關鍵。這幾家的模型整包怎麼選，我各寫了一篇對比：ChatGPT 模型選型全攻略、Claude 模型怎麼選（Opus、Sonnet、Haiku）、Gemini 模型怎麼選（Pro、Flash、Flash-Lite）。

AI Prompt 教學常見問題 FAQ

同一個 Prompt 在三家 AI 都能用嗎？

可以用，但效果會打折。核心任務可以共用，例如「寫一段 300 字產品介紹」。但如果你想要最佳結果，建議依照各家偏好調整格式——Claude 加 XML、ChatGPT 加 Markdown 標題、Gemini 加角色和情境。

我要學哪家的 Prompt 寫法？

看你主要用哪家。如果你只付費訂一家，就學那一家的官方建議——Anthropic、OpenAI、Google 三家都有公開 Prompt Engineering 指南。如果你三家都用，建議先把「角色＋任務＋情境＋格式」這個四要素框架記熟，這是三家共通的基本盤，剩下再依模型微調。

Prompt 越長越好嗎？

不是。太長反而會稀釋重點。我實測下來，結構化的 300-500 字 Prompt 效果最穩。關鍵不在長度，在「資訊密度」——把重要的事情講到無歧義、不重要的不要塞進來。

Claude 的 XML 標籤名稱有限制嗎？

沒有。Anthropic 官方文件明確講「沒有特定魔法標籤」，你可以用 instructions、context、my_data、xxx 都行。重點是你自己用得一致，同一個 Prompt 裡不要同時用 task 又用 job。Claude 靠一致性識別結構，不是靠特定字串。

免費版和付費版對 Prompt 理解力差很多嗎？

會差，但沒你想的那麼大。付費版主要贏在上下文視窗更長、回應速度更快、功能更完整。Prompt 本身的理解力在同世代模型上差距不算太大。付不付費的判斷標準我另一篇有完整分析。

結論：搞懂三家差異，你才不會浪費訂閱費

寫到這裡，你應該看得出來——AI Prompt 教學不是學一套公式就好，是要理解「每家模型為什麼吃這種寫法」。

Claude 的 XML、ChatGPT 的 Markdown、Gemini 的四要素，都是三家官方文件明講的偏好。你順著它們的訓練方向寫，事半功倍；你逆著寫，就像用錯語言跟人溝通一樣。

我最想給你的建議是：不要想「哪家最強」，要想「哪家最適合這個任務」。我自己的實際工作流是——研究資料用 Gemini、結構化輸出用 ChatGPT、寫作潤稿用 Claude。三家搭配之後，產出效率比死守一家高很多。

如果你還不確定自己主要要用哪一家，建議先看三大付費 AI 的完整比較，再決定訂閱策略。搭配這篇的 Prompt 寫法，你的每一次提問都會更接近你真正要的答案。