同樣一句 Prompt,丟到三家 AI 給出來的結果常常差到像兩個人寫的。核心原因很簡單:Claude 偏愛 XML 標籤結構、ChatGPT 吃 Markdown 與格式指令、Gemini 適合角色+任務+情境+格式的四要素框架。
這篇 AI Prompt 教學會把三家模型官方文件裡寫的偏好、我這一年實測踩過的坑、和同一個任務在三家寫法差多少一次講完。我自己經營 AI 工具部落格第三年,每天同一個問題會丟進三家比一遍。一開始我以為 Prompt 就是 Prompt,頂多換個字。後來發現差別大到離譜。
搞懂這些差異之前,我浪費了大概幾百次無效對話。這篇會告訴你:三家各自的 Prompt 偏好有什麼科學根據、為什麼同一句指令結果會差這麼多、三家的「好用公式」分別長什麼樣,還有我怎麼用同一個寫文章任務去對比它們的表現。
為什麼不同 AI 的 Prompt 效果會差這麼多?
同一句 Prompt 放到不同模型結果差很多(這也是很多人寫 Prompt 最大的誤區),主要是因為訓練資料和格式偏好不同。Anthropic 官方文件明確指出 Claude 是特別被訓練來辨識 XML 標籤。
OpenAI 文件則建議 GPT-5 系列使用 Markdown 與明確的 output contract;Google 官方 Gemini for Workspace 指南主打「角色、任務、情境、格式」四要素。訓練方向不同,你餵給它的結構當然要不一樣。
我第一次意識到 Prompt 要分家寫,是在做一篇長文大綱時。同一個 2000 字的 brief,我用純文字段落丟進 Claude,它處理得亂七八糟。
加了 <context> 和 <task> 標籤後,結果立刻從「可用」變成「幾乎不用改」。後來丟進 ChatGPT 試,反而 Markdown 標題加清單寫得更漂亮。
📌 重點整理:Claude 吃 XML 結構、ChatGPT 吃 Markdown 與明確格式要求、Gemini 吃角色+任務四要素。理解差異之後,同一個指令換個寫法就能省下一半的往返次數。
還有一個容易被忽略的點:不同模型的預設回應風格不一樣。Gemini 3 系列官方文件直接講明,它預設就是給「直接、效率」的答案,你要它寫得詳細必須明說。ChatGPT 預設比較口語,Claude 預設會主動給結構化的段落。
所以「要不要多解釋一點」這種基本指令,在三家就不該用同一句話。這是 AI Prompt 教學裡最容易被新手忽略的第一課。
Claude 的 Prompt 怎麼寫最有效?XML 標籤是關鍵
Claude Prompt 用 XML 標籤分段,準確度和穩定度會明顯提升。Anthropic 官方 Prompt Engineering 指南直接建議:把指令、範例、上下文、格式要求分別包在各自的標籤裡。
常用標籤名稱像是 <instructions>、<example>、<context>、<formatting>,不需要固定,但同一份 Prompt 裡要保持一致。
Claude 比對訓練分佈後更容易抓到重點。這是 Claude Prompt 和其他模型最大的差異點。
這不是迷信。官方原文寫「Claude was trained specifically to recognize XML tags」,意思就是這模型從訓練階段就被教會 XML 標籤是一種結構信號。
我自己最常用的 Claude 公式是這四步驟:
❶ 用 <context> 放背景。包括讀者、平台、我目前遇到的狀況。Claude 對背景敏感,你給得清楚它就不會亂假設。
❷ 用 <task> 放具體任務。動詞開頭、明確到不能再明確,例如「改寫成口語 FAQ 風格、每題 60 字內」。
❸ 用 <example> 放 1-2 個範例。Claude 對範例的模仿能力非常強,只要給一個合格的樣本,它的輸出就會穩定在那個品質線上。
❹ 用 <constraints> 放禁止事項。我常寫「禁止使用:值得注意的是、綜上所述、不僅⋯還⋯」,Claude 遵守率超過九成。
補充一個實戰心得:Claude 特別擅長抓寫作語氣。你丟一篇你之前的文章進去 <example>,請它模仿你寫下一段,出力的語感精準度是三家裡最高的。這也是為什麼 Claude vs ChatGPT 長文寫作那篇我會說「Claude 寫好字、ChatGPT 整合強」——差別就差在這裡。
ChatGPT 的 Prompt 偏好是什麼?Markdown 與格式優先
ChatGPT 最吃「先講格式、再講任務、最後給內容」這種結構,搭配 Markdown 會輸出得很漂亮。OpenAI 官方 Prompt Engineering Guide 和 GPT-5 Cookbook 反覆強調兩個詞:output contract(輸出契約)和 verbosity(冗長度)。
白話講就是——你要先把「最後希望拿到什麼」寫清楚,ChatGPT 就會穩穩給你。ChatGPT Prompt 的核心邏輯和 Claude 不同,它要的是格式契約,不是語意分段。
我這兩年用下來,歸納 ChatGPT Prompt 的好用公式是這樣四步:
❶ 開頭先寫輸出格式。第一句就寫「請以表格回答,欄位為 X、Y、Z」或「請用條列式,每點不超過 30 字」。ChatGPT 看到格式指令擺前面,配合度比放最後高得多。
❷ 角色設定用 Markdown 標題分段。例如 ## 角色、## 任務、## 限制 這樣寫,效果幾乎等同 Claude 的 XML 標籤。
❸ 長任務要求它先列步驟再執行。「先把你打算怎麼做列成編號清單,我確認後再開始」,這種兩段式做法比一次做到底錯得少很多。
❹ 明講 verbosity。「請寫 300 字以內,不要 500 字」比「請簡短回答」有用。ChatGPT 對具體字數比較願意配合。
有一個小技巧我特別推薦:結構化輸出直接要求 JSON。ChatGPT 的 JSON 格式穩定度在三家裡最高,你告訴它「請輸出為 JSON,鍵為 title、summary、tags」,它會乖乖給。這個在串 API 或自動化時超省事。
但我必須誠實說,ChatGPT 在中文語感和情緒表達上不如 Claude,寫出來的東西容易有「太工整、太樣板」的感覺,這點要有心理準備。
📌 重點整理:Claude 用 XML 標籤分段、ChatGPT 用 Markdown+格式優先,這兩家的基本公式差很多。同一個任務在 Claude 寫得穩,在 ChatGPT 可能還要多兩輪才到位。
Gemini 的 Prompt 要怎麼下?Persona 四要素是起手式
Google 官方「Gemini for Workspace Prompting Guide」主打四要素:Persona、Task、Context、Format。翻成白話就是「你是誰、要做什麼、背景是什麼、結果長怎樣」。這四個要素不一定要全用,但用到三個以上結果會穩很多。
官方 PDF 裡給的範例是這樣一句話:「我是一個專案經理(Persona),需要建立一份詳細的專案追蹤表(Task),用於網站改版專案(Context),請用簡單表格呈現(Format)。」
這種寫法最大的好處是——你不用去記什麼 XML 或 Markdown,照著這個公式組裝,Gemini 就能吃。我自己實測下來,Gemini 有幾個特別要注意的點:
❶ 預設回答偏短,要顯式要求詳細。Google 官方說明 Gemini 3 預設給「直接、高效」的答案,你想要深度分析就必須寫「請詳細說明,至少 600 字」。
❷ 研究類任務優勢明顯。我需要整理某主題最新新聞或找資料時,Gemini 因為整合 Google 搜尋的關係,拿到的資訊比較新。但它常常不主動附來源連結,要記得寫「請附上資料來源網址」。
❸ 整合 Workspace 是殺手鐧。Gemini 在 Docs、Sheets、Gmail 裡的側邊欄,可以直接讀取你當前文件的內容。我寫文章時把資料整理進 Google Docs,再側邊欄開 Gemini 問它「幫我從這份資料抓出三個重點」,這種流程其他家做不到。
❹ 多模態輸入是強項。丟圖片進去請它分析,Gemini 的回應細節度和準確度在三家裡很前面,尤其是圖表判讀。
同一個任務丟三家,寫法差到什麼程度?
為了讓這件事更具體,我拿「幫我寫一段 300 字的咖啡店開幕文案」當案例,用三家偏好的格式各下一次指令,看結果差多少。
先講結論:三個 Prompt 長得完全不一樣,但核心資訊一樣。差別在於你用什麼「語言」跟模型溝通。
| 模型 | 推薦 Prompt 寫法 | 適合場景 | 實測感受 |
|---|---|---|---|
| Claude | <context>咖啡店...</context><task>寫開幕文案</task><constraints>300字內、口語</constraints> | 長文、創作、仿寫語氣 | 語感自然,幾乎不用改 |
| ChatGPT | ## 格式 300 字、口語、帶情緒 ## 任務 寫咖啡店開幕文案 ## 背景 ... | 結構化輸出、JSON、表格 | 結構整齊,但情緒較平 |
| Gemini | 我是獨立咖啡店主(角色),需要寫開幕文案(任務),主打手沖+輕食(情境),Instagram 貼文格式、300 字、帶一個 CTA(格式) | 研究、多模態、Workspace 整合 | 資訊準確,但文字偏正式 |
三家我各跑五次,用同一句開幕文案需求。Claude 有四次直接可用、一次需要小修;ChatGPT 有兩次直接可用、三次需要調口氣;Gemini 有一次直接可用、四次需要重寫。
這個結果跟 Anthropic 官方文件講「Claude 特別擅長寫作風格」是吻合的。但別誤會——Gemini 不是輸。我拿「整理這五篇報導的重點,附來源網址」這種研究任務去比,Gemini 反而是最快最準的。
我之前寫 AI 長尾關鍵字研究那篇就是用 Gemini 找題目、ChatGPT 驗證熱度、Claude 寫出文章,分工清楚後效率高很多。AI 提示詞的正確用法就是分工,不是單打獨鬥。
我自己用 AI 下指令踩過的三大坑
理論講完,來講我真正用了上千次之後的慘痛教訓。這三個坑,我全部踩過,而且第三個直到今年才徹底擺脫。
坑一:以為一個 Prompt 就能在三家通用。這是我最大的誤區,持續了大半年。我把 Claude 寫得很好的 XML 版本直接複製到 ChatGPT,覺得「反正都是 AI」,結果 ChatGPT 回得亂七八糟。
後來發現 ChatGPT 看到大量 XML 標籤時,容易把標籤當內容的一部分,整個出力就歪掉。解法是同一個核心任務,我會存三個版本的 Prompt 模板,對應三家模型。這是 AI Prompt 教學最容易被忽略的實戰細節。
坑二:沒寫明禁止事項。三家 AI 都有自己的「口頭禪」——ChatGPT 愛寫「值得注意的是」、Claude 會塞「不僅⋯還⋯」、Gemini 動不動來一句「總而言之」。我剛開始以為只能事後刪,後來發現在 Prompt 裡明寫「禁止使用這些詞」,遵守率可以到 85% 以上。
這招在 Claude 特別有效,寫在 <constraints> 標籤裡幾乎不會違規。ChatGPT 也適用,但偶爾會溜出來一兩個,建議每次輸出都掃一次。
坑三:給太多背景卻沒標清主次。我以前以為「講越多越好」,結果 Claude 會把所有東西都當平等重要,寫出來失焦;ChatGPT 乾脆忽略一半;Gemini 直接回短版敷衍你。
後來我學會用「優先序」寫法——「最重要的是 A,其次是 B,如果篇幅允許再考慮 C」——三家的準確率都明顯上升。如果你正在經營內容網站,我強烈建議你把 Prompt 當成經營副業的核心資產來累積。
怎麼建立自己的 Prompt 模板庫?四步驟操作指南
講了這麼多差異,很多人會卡在「所以我現在該怎麼開始」。我整理出一個最簡化的四步驟,你今天就能跑一次。
❶ 先挑一個你最常做的任務。例如「寫社群貼文」、「改寫文案」、「整理會議重點」——從高頻任務下手,改善效果才明顯。
❷ 用三家各寫一版 Prompt。Claude 用 XML 標籤、ChatGPT 用 Markdown、Gemini 用 Persona 四要素。同樣的核心內容、三套語法。
❸ 同樣輸入跑五次,記錄哪家最穩。不是跑一次決勝負,五次才看得出穩定性。我自己的 Notion 模板會記錄「可直接用 / 小修 / 重寫」三個欄位。
❹ 把最穩的那版存成模板,下次直接用。我寫 SEO 文章的工作流就是這樣建立起來的——前三個月測試、後來全部模板化,現在每篇文章 Prompt 幾乎不用重寫。
📌 重點整理:Prompt 模板的價值不是第一次用,是第一百次用。前期花兩小時測試調整,後面每篇文章省二十分鐘,一年就是一百小時。
AI Prompt 教學常見問題 FAQ
同一個 Prompt 在三家 AI 都能用嗎?
可以用,但效果會打折。核心任務可以共用,例如「寫一段 300 字產品介紹」。但如果你想要最佳結果,建議依照各家偏好調整格式——Claude 加 XML、ChatGPT 加 Markdown 標題、Gemini 加角色和情境。
我要學哪家的 Prompt 寫法?
看你主要用哪家。如果你只付費訂一家,就學那一家的官方建議——Anthropic、OpenAI、Google 三家都有公開 Prompt Engineering 指南。如果你三家都用,建議先把「角色+任務+情境+格式」這個四要素框架記熟,這是三家共通的基本盤,剩下再依模型微調。
Prompt 越長越好嗎?
不是。太長反而會稀釋重點。我實測下來,結構化的 300-500 字 Prompt 效果最穩。關鍵不在長度,在「資訊密度」——把重要的事情講到無歧義、不重要的不要塞進來。
Claude 的 XML 標籤名稱有限制嗎?
沒有。Anthropic 官方文件明確講「沒有特定魔法標籤」,你可以用 instructions、context、my_data、xxx 都行。重點是你自己用得一致,同一個 Prompt 裡不要同時用 task 又用 job。Claude 靠一致性識別結構,不是靠特定字串。
免費版和付費版對 Prompt 理解力差很多嗎?
會差,但沒你想的那麼大。付費版主要贏在上下文視窗更長、回應速度更快、功能更完整。Prompt 本身的理解力在同世代模型上差距不算太大。付不付費的判斷標準我另一篇有完整分析。
結論:搞懂三家差異,你才不會浪費訂閱費
寫到這裡,你應該看得出來——AI Prompt 教學不是學一套公式就好,是要理解「每家模型為什麼吃這種寫法」。
Claude 的 XML、ChatGPT 的 Markdown、Gemini 的四要素,都是三家官方文件明講的偏好。你順著它們的訓練方向寫,事半功倍;你逆著寫,就像用錯語言跟人溝通一樣。
我最想給你的建議是:不要想「哪家最強」,要想「哪家最適合這個任務」。我自己的實際工作流是——研究資料用 Gemini、結構化輸出用 ChatGPT、寫作潤稿用 Claude。三家搭配之後,產出效率比死守一家高很多。
如果你還不確定自己主要要用哪一家,建議先看 三大付費 AI 的完整比較,再決定訂閱策略。搭配這篇的 Prompt 寫法,你的每一次提問都會更接近你真正要的答案。
延伸閱讀
- Anthropic 官方:Use XML tags to structure your prompts
- OpenAI 官方:Prompt engineering best practices for ChatGPT
- Google 官方:Gemini for Workspace Prompting Guide PDF
- Prompt Engineering Guide 中文版