大家以為 AI 工具長得都跟 ChatGPT 差不多,Flipbook 直接把對話框拆掉了。它是 Zain Shah(前 OpenAI 工程師)跟 Eddie Jiao、Drew Carr 三人團隊做的「視覺瀏覽器」,每一頁都是 AI 即時生成的圖像,點任何位置就生成下一張更深的圖。
它不是把 PDF 變翻頁書的工具,被 Fast Company 形容是 Apple HyperCard 的 AI 時代致敬作。
上週我朋友傳來一段 demo 影片,畫面是輸入「日本盆栽」之後,整個螢幕變成一張像繪本的圖,點某棵樹就跳進去看樹幹結構,再點葉子又跳到光合作用。我當下沒看懂,以為是 Vision Pro 的新功能。
後來才知道這是 Flipbook。坐了兩分鐘看完那段演示,我心裡只有一個念頭:「對話框作為 AI 主介面的時代,可能真的要被換掉了。」
這篇我把過去幾天試玩跟研究的東西整理一輪,從它到底是什麼、為什麼大家在討論、跟 ChatGPT 差在哪、技術怎麼運作,到對 AI 發展的真正意義。看完這篇你不用自己排隊,也能判斷這個東西值不值得追。
📌 重點先看
- 是什麼:前 OpenAI 工程師做的「AI 視覺瀏覽器」,每頁都是即時生成的圖,不是 HTML
- 怎麼用:輸入主題 → 系統生成一張視覺頁 → 點任何位置 → 生成下一張更深的內容
- 誰做的:Zain Shah、Eddie Jiao、Drew Carr,算力贊助 Modal、投資人 South Park Commons
- 跟翻頁書工具一樣嗎:不一樣。Issuu、FlipHTML5 是把 PDF 變翻頁,這個是即時生成像素
- 現在能取代 Chrome 嗎:不能,目前是實驗品,慢、文字會變形、資源吃很重
Flipbook AI 是什麼?先把名字搞清楚
它是一個由 AI 模型即時生成整個螢幕畫面的視覺瀏覽器,由 Zain Shah、Eddie Jiao、Drew Carr 三人團隊開發,網址是 flipbook.page。核心不是「整理資料給你看」,而是「把資料畫成一張可以點的圖」。
很多人第一次聽到 Flipbook 會直覺以為是翻頁書工具,這是搜尋上最大的誤會。FlipHTML5、Issuu、Heyzine 這類產品是把 PDF 或 Word 檔轉成可以左右翻頁的電子型錄,本質是檔案展示。
這個工具完全不一樣,它連 HTML、layout、按鈕、固定連結都沒有,整個畫面都是模型畫出來的像素,包括上面看到的文字。
根據官網說法,「畫面上所有文字都是由圖像模型以像素 render 出來,沒有任何文字 overlay」,這是它跟一般網頁的根本差別。資訊來源是「agentic web search」加上模型本身的世界知識,準確度大致跟 ChatGPT 同等級。
| 類別 | Flipbook AI | Issuu / FlipHTML5 |
|---|---|---|
| 產品分類 | AI 視覺瀏覽器 | 翻頁書 / 電子型錄工具 |
| 內容怎麼來 | AI 即時生成像素 | 把 PDF / Word 轉檔 |
| 有 HTML 嗎 | 沒有 | 有 |
| 互動方式 | 點圖深入探索 | 左右翻頁 |
| 適合誰 | AI 早期採用者、研究者 | 行銷人、出版業 |
所以如果你搜這個關鍵字是想找把 PDF 變成翻頁書的工具,這篇看到這裡可以關掉。如果你是看到 X 上 demo 想了解這個新概念,那繼續往下看就對了。
為什麼大家最近在討論 Flipbook?
三個原因疊在一起:團隊背景硬、知名媒體背書、概念夠衝擊。單一條件不會引起討論,但這次三條都打到。
先說團隊。創辦人 Zain Shah 是 Y Combinator S13 校友,做過 OpenAI、Samsung 的研究工程,這個背景在 X 圈內就有號召力。Eddie Jiao 來自 Humane 跟 Slack,Drew Carr 來自 Apple。三人都不是新人。
再來是媒體報導。Fast Company 用了一個很挑釁的標題,把它形容成 Apple HyperCard 在 AI 時代的回歸。HyperCard 是 1987 年蘋果做出來的視覺化資訊探索工具,被很多老一輩開發者視為「網頁該長的樣子但沒走通的另一條路」。
把一個 demo 跟 HyperCard 並列,這是滿大的話題操作。對於每天用 ChatGPT 對話框的人來說,這個比擬打到的不是技術細節,是「AI 介面的下一步在哪」這個更大的問題。
最後是概念衝擊。Zain Shah 在 X 寫得直接:「想像螢幕上的每個像素,都是由模型即時 stream 給你的,沒有 HTML、沒有 layout engine、沒有 code,就只有你想看到的畫面。」這句話本身就是傳播金句。
📌 為什麼引起討論:團隊有 OpenAI / Apple / Humane 背景 + Fast Company 用 HyperCard 比擬 + 對話框之外的 AI 介面方向。三條件疊加,X 跟 Hacker News 都炸了。
Flipbook 跟 ChatGPT、Perplexity 差在哪?
最大的差別是「你怎麼跟資訊互動」。ChatGPT 跟 Perplexity 都是文字進、文字出,差別只在 Perplexity 多了即時搜尋跟引用。Flipbook AI 把整個畫面當畫布,輸入完之後出來的是一張可以點的圖。
用一個生活化的比喻:ChatGPT 像是請一個研究員幫你讀資料、回你一篇文字筆記;Perplexity 像同一個研究員多附了參考書目;這個工具則是請一個插畫家把資料畫成可以點來點去的繪本。三個拿到的東西不一樣,適合的場景也不一樣。
| 面向 | Flipbook AI | ChatGPT | Perplexity |
|---|---|---|---|
| 主要介面 | 視覺圖像 | 文字對話 | 文字 + 引用列表 |
| 互動方式 | 點圖探索 | 打字提問 | 打字提問 |
| 資訊深度 | 逐層點開拓深 | 一次給全部 | 一次給全部 + 來源 |
| 速度 | 慢(生圖) | 快 | 中 |
| 適合任務 | 視覺探索、學習主題 | 對話、寫作 | 查資料、做研究 |
實際試用會發現一個有趣的張力:ChatGPT 適合你已經知道要問什麼;Flipbook 適合你只有一個模糊好奇,想用視覺帶你走。我輸入「中世紀城堡」後,畫面跳出一張剖面圖,點塔樓進到守衛動線,點地下室進到水井系統。整個過程沒有打第二次字。
但缺點也很明顯。文字常會 render 變形或位置跑掉,因為文字是被當成圖像來畫的,不是 HTML 文字層。如果你需要可以複製、可以分享連結、可以搜尋的內容,它目前完全做不到。
這是它「概念新」跟「實用度低」並存的根本原因。對於想理解 AI 對話介面之外可能性的讀者,我之前在自己的部落格寫過 NotebookLM 完整教學,那條工具走的是「結構化文件」這條路;Flipbook 則是另一個極端。
Flipbook AI 背後技術是什麼?
核心由三個系統拼起來:圖像模型、agentic web search、影片串流模型。官網跟 Zain Shah 的 X 貼文都有揭露,技術透明度比一般 AI 產品高。
圖像生成的部分,每次點擊會觸發一次「文字搜尋 + 圖像生成」的組合動作。系統先用 agentic search 抓相關資料,再交給圖像模型把資料畫成一張包含文字像素的視覺頁。
所以你看到的「文字」其實全部都是被畫上去的圖像,這也是為什麼有時候字會變形。
影片模式(live video stream)是進階版,把靜態圖之間的轉場做成動畫,目前是實驗性 toggle。這部分用到 Lightricks 的 LTX-Video,這是一個基於 Diffusion Transformer 的開源影片生成模型。
根據 LTX-Video 的 GitHub README,這個模型可以在 H100 GPU 上以每秒 30 幀生成 1216×704 解析度影片,速度比觀看還快,這也是 Flipbook 能做到「即時 stream」的硬體基礎。
Lightricks 是一家以色列公司,總部在耶路撒冷,2013 年由 5 位希伯來大學的博士生創立,旗下還有 Facetune、Videoleap 這些手機修圖修片 app,員工約 600 人。LTX Studio 是 2024 年推出的 AI 影像創作平台,LTX-Video 模型的開源版本就是從這裡長出來的。
運算資源方面,官網寫明算力由 Modal Labs 贊助,這是一家做 serverless GPU 的公司,可以隨需呼叫 H100 等級的卡。投資端則是 South Park Commons,矽谷一個比較硬派的 founder community fund。整個技術鏈條從研發、算力到資金都不是業餘規格。
📌 技術重點:圖像模型(畫面)+ agentic search(資料)+ LTX-Video(影片串流)+ Modal serverless GPU(算力)。前 OpenAI 工程師組合這些東西做出來的,不是黑魔法,是工程整合。
Flipbook 現在能用嗎?實際試玩感想
能用,但你要有耐心。直接打開 flipbook.page 就可以試,不需要 waitlist、不用註冊、不用付費。但因為太多人擠進來,速度從幾秒到幾分鐘不等,第一次連線常卡個 1 到 2 分鐘。
我自己玩過幾個主題:「貓咪行為學」會先畫一張帶各種姿勢的貓圖,點睡姿跳到體溫調節,點瞳孔跳到光線適應;「太陽系」會先畫一張全景圖,點木星跳到大紅斑,點土星跳到環的成分。
整個探索過程很像在翻一本會生長的科普書,這種體感是 ChatGPT 做不到的。
但真的會卡。不是模型笨,是排隊塞車。Zain Shah 自己在 X 上發過:「我們被回響嚇到了。要先說清楚,Flipbook 是一個小團隊的計劃,這個網站是個窄房子,請大家見諒。」
這個誠實程度在矽谷產品社群算難得,但也代表你打開的時候要有「可能要等」的心理準備。
實用度的話我給三顆星出五顆星。視覺探索本身很有趣,但你不能用它做正經事——要複製文字、要分享連結、要存檔、要轉 PDF,全部做不到。它現在的定位是「概念展示 + 探索玩具」,不是「日常工具」。
📌 試用提醒:直接開 flipbook.page 就能玩,不收錢。但要有耐心,且不要當生產力工具用。當作 AI 介面的未來示範比較合適。
誰會喜歡 Flipbook?誰會嫌?
視覺型學習者跟 AI 早期採用者最會喜歡,效率派跟結構派最會嫌。這是試用一段時間之後的觀察。
會喜歡的有三類人。第一是視覺型學習者,習慣看圖比看文字好吸收,把概念視覺化的方式對這群人很對胃口。第二是AI 早期採用者,每出一個新工具都先去玩過再說,這次更是「能在 AI 介面史上佔個位置」的事件。
第三是UX/設計師、PM、研究者,會把它當作思考「對話框之外的 AI 介面」的素材。
會嫌的也有三類。第一是效率派,覺得「為什麼我要等一張圖才能繼續」,這種人本來就只追求最短輸入到最短答案。第二是結構派,習慣 ChatGPT 那種列點、分段、可以複製的文字輸出,看到「想複製還複製不出來」會抓狂。
第三是需要可分享、可存檔內容的工作者,記者、研究員、寫作者,他們需要的是有 link、有 cite、有 export 的工具。
有趣的是這個分歧本身就反映了一個更大的問題:AI 的最佳介面到底是「省力的對話」還是「沉浸的探索」?這沒有標準答案,但 Flipbook 的存在本身在挑戰一個矽谷主流假設——AI 介面就應該是 chatbot。
對於想做 AI 工具的台灣 PM、設計師、開發者來說,這個 demo 比技術細節更值得認真看。如果你也在思考這類議題,可以看 PM AI 工具的 14 款實測跟 設計 AI 工具的 21 款分用途比較,那兩篇是從「實用」這條軸線看 AI 工具,搭著看會更立體。
Flipbook AI 對 AI 發展有什麼意義?
它不是要取代 ChatGPT,是在問一個更基本的問題:AI 的介面真的就是對話框嗎?這個問題比 Flipbook 本身能不能成功更重要。
過去三年的 AI 主流敘事很單一:聊天框 + 對話歷史 + 引用條 = 標準 AI 介面。從 OpenAI 的 ChatGPT、Google 的 Gemini、Anthropic 的 Claude,介面都長得差不多。Perplexity 多加了引用區,Felo 多加了一鍵生網頁,但骨架還是聊天。
Flipbook 在做的事情,是直接挑戰這個骨架。它說:對話框是繼承自命令列跟即時通訊軟體的歷史包袱,AI 模型本身沒有理由非用對話不可。
如果模型可以即時 render 任何畫面,那為什麼要用文字一個個字輸出?這個提問本身就是價值,不需要它自己做成功才有意義。
實際上 Zain Shah 在 X 上講得很坦白:「今天的 Flipbook 是受限的,所以我們圍繞視覺解釋來設計。隨著模型變得更準確、更 stateful,值得這樣做的事情會越來越多,包括你以為需要結構化 UI 的事,例如寫程式。」
這段話看似自我貶低,其實是在預告下一階段:當 AI 模型本身有狀態、有記憶、生成準確度更高時,整個應用程式介面都可以改成這種模式。
對台灣產品圈的意義是:不要再無腦做 chatbot 包裝。過去半年我看過至少 15 個本地 AI 產品,從健身教練到法律助理,介面九成是聊天框。Flipbook 的存在提醒所有 PM 跟設計師,AI 模型的能力遠遠超過聊天框能呈現的範圍,剩下的是想像力跟工程能力的問題。
📌 對 AI 發展的意義:Flipbook AI 不一定會贏,但它把「AI 介面 = 對話框」這個假設打了一個洞。下一波贏家會是想清楚「AI 模型 × 介面型態」這道題的人,不是只會做 chatbot 包裝的人。
早期試用者怎麼看 Flipbook?
三種聲音最常出現:驚艷、嫌慢、質疑商業可行性。從 X、Hacker News 跟 Reddit 整理下來,可以看到滿明顯的分布。
驚艷派講的話通常是「終於有人挑戰對話框」「視覺探索的體感跟讀文章完全不一樣」「想到我小時候用 HyperCard 的感覺」這類。這群人不太在意現在的限制,把它當作概念藝術品在欣賞。
嫌慢派則是「等了 3 分鐘什麼都沒看到」「文字字都糊了」「點擊延遲超久」。這完全可以理解——目前算力跟模型推理速度確實還跟不上互動需求,這也是為什麼還在 prototype 階段。
質疑商業可行性的聲音也很實在。每生一張圖的成本不低,每點一次都要重生,這個經濟模型怎麼跑得通?是 B2C 訂閱、B2B 內嵌、還是純研究展示?目前團隊還沒給答案。
連他們自己都在 X 上說「這是個 prototype,還很多東西要試」。對投資人來說這是個訊號,但對使用者來說反而是誠實。
常見問題(FAQ)
Flipbook AI 是把 PDF 變翻頁書的工具嗎?
不是。這是搜尋上最大的誤會。它是一個 AI 視覺瀏覽器,每個畫面都是模型即時生成的圖像,沒有 HTML、沒有檔案上傳。如果你要找的是把 PDF 轉成翻頁電子書的工具,那是 Issuu、FlipHTML5、Heyzine 那一類,跟這個產品沒關係。
跟 FlipHTML5 / Issuu / Heyzine 這些翻頁書工具有什麼不同?
產品分類完全不同。翻頁書工具是把既有的 PDF 或 Word 檔案,用網頁特效做出左右翻頁的閱讀體驗,本質是檔案展示。Flipbook 沒有任何輸入檔案,內容由 AI 模型即時根據你輸入的主題畫出來,每一張都是獨一無二的視覺頁,點擊還會繼續生成新內容。
Flipbook AI 取代得了 Chrome 嗎?
短期內不會。它目前只能視覺探索,沒辦法登入帳號、填表、看 YouTube、收信、做任何 Chrome 上你習慣做的事。團隊自己也說這是 prototype,定位是 demo「另一種介面可能性」,不是要取代瀏覽器。長期是不是會走那邊,要看模型成熟度跟成本曲線。
現在試用要錢嗎?要 waitlist 嗎?
都不用。直接打開 flipbook.page 就能玩,不需要註冊帳號、不需要付費、不需要 waitlist。唯一的門檻是擠塞,第一次連線可能要等 1 到 2 分鐘,後續每次點擊也會等幾秒到幾十秒不等。算力由 Modal 贊助,所以使用者不用付費,但服務的可用性會受流量影響。
Flipbook AI 會像 ChatGPT 一樣紅嗎?
機率不大,但這不是失敗。它走的是「概念實驗」這條路,不是「大眾消費級產品」。要打的市場是 AI 介面的方向辯論,不是大眾用戶日常工具。即使最後它沒做成大公司,把「對話框不是 AI 唯一介面」這個想法植入產業意識,也已經是有價值的事。
結論:Flipbook AI 值不值得追?
如果你關心 AI 介面的未來方向,值得花 30 分鐘試一次。就算之後不會再用,光是體驗一次「不是對話框的 AI」這件事,就會改變你看其他 AI 工具的眼光。這跟看 demo 影片是兩種感受,動手玩過才知道差別在哪。
如果你是要找日常生產力工具,那目前還沒到那個階段。慢、不能複製、不能分享連結、文字會變形,這些對日常工作流是硬傷。等個半年到一年,看模型成熟度跟團隊路線圖再決定,比較合理。
對我自己來說,Flipbook 是過去半年最有意思的 AI demo,不是它最強,而是它逼我重新想「AI 介面該長什麼樣」。
我做遊戲、寫部落格、玩 AI 工具,三個身份疊加之下,看到的是一個明確的訊號:對話框不會是 AI 介面的終點。剩下的問題是:下一個介面什麼時候到、誰會做出來。
想看更多這類 AI 工具觀察跟比較的內容,可以訂閱夜羽凌的部落格,訂閱後會不定期收到信。
延伸閱讀
- Google NotebookLM 完整教學:從入門到進階,打造你的 AI 研究助理
- 產品經理 AI 工具怎麼選?2026 實測 14 款,PRD 從 4 小時降到 30 分鐘
- 設計 AI 工具怎麼選?2026 年 21 款分用途、月費、商用版權對照
- 驚!Felo 不只會分析,還能一鍵生成無 Bug 互動網頁?最新 AI 實測