
生成式 AI 正在進入一個關鍵轉折點。過去我們向 AI 提問,它回應一段文字;如今,一線研究已開始讓 AI 以「可操作的應用程式」來回答問題。
Google Research 最新公佈的 Generative UI(生成式 UI) 展示了一種嶄新的互動范式:AI 不是寫答案,而是「做出答案」。
對專業人士而言,這不僅改寫了軟體介面設計的流程,也代表著產品開發、教育科技、知識傳遞方式的徹底轉型。以下將以清晰架構帶你深入理解這場變革的技術核心、應用潛力與限制。
生成式 UI 是什麼?:從文字回答走向「動態應用」
打破傳統 Markdown 的靜態限制
傳統的 AI 回答大多以 Markdown 呈現:可讀、但不可互動。
Google 的研究則提出一個大膽假設:
如果 AI 能直接生成可點擊、可滑動、可運算、可視化的 App,體驗會有何不同?
答案是顛覆性的:
生成式 UI 不再提供靜態資訊,而是現場構建一個小型軟體,如互動實驗室、可視化模擬器、教學工具、遊戲等。

核心架構:虛擬 AI 工程團隊在 1 分鐘內完成開發
Google 的生成式 UI 主要由三大部分組成:
1. 伺服器端工具集:賦予模型「手與眼」
- 搜尋工具:強制查詢 Google Search,以確保內容真實、數據正確。
- 圖像生成工具:自動產生主題圖片或拉取真實影像。
- 其他 API(如地圖):使 UI 能使用真實世界資料。
這讓 LLM 不再只是推理機器,而是能操控外部工具的「具身智能」。
2. 3000 字的系統指令:AI 的企業級工作手冊
這段巨量指令規範 AI 的開發流程,例如:
- 不得僅輸出文字,必須產生完整 UI
- 不得出現任何假按鈕或 placeholder
- 產生前需進行七步思維鏈推理
- HTML、Tailwind CSS、原生 JS 必須正確無誤
這套規範使生成結果兼具 工程品質、敘事能力與資料真確性。
3. 後處理模組:最終質檢
- 注入真實 API key
- 修補 HTML / JS / CSS 錯誤
- 確保安全性(如屬性轉義)
跨領域應用能力:AI 生成的不只是頁面,而是完整體驗
Google 展示多個案例,以下擷取專業人士較關注的代表性應用。
案例 1:分形探索者(Fractal Explorer)—動態數學實驗室
輸入指令:「詳細解釋分形」。
生成結果不是文章,而是一個 可操作的數學可視化工具:
- 互動式 Mandelbrot / Julia 雙畫布
- 迭代可調的 Koch 雪花、Sierpiński 三角形
- 混沌遊戲產生 Barnsley 蕨葉的模擬器
- 內建維度計算器
此案例展現 LLM 不只懂概念,還能寫出複雜的即時運算 JavaScript。

案例 2:Chronos—計時設備的歷史敘事網站
使用者輸入:「計時器的歷史」。
AI 生成:
- 暗色主題、垂直時間軸
- 從方尖碑、水鐘到原子鐘
- 每一節都有 AI 生成的歷史氛圍圖
- 工程突破以資訊框突出呈現
- 整體如博物館導覽般的敘事感

案例 3:Little Ballers Math Academy—客製化幼兒數學遊戲
Prompt:「用打籃球的可愛生物教五歲小孩加減乘除和二進位」。
AI 建立完整遊戲:
- 加法:傳球
- 減法:投籃
- 乘法:團隊演練
- 二進位:外星記分板與互動開關
所有美術資產(人物、場景、特效)由系統即時生成。

模型能力驗證:AI 與人類專家正面交鋒
Google 為此建立 PAGEN 資料集,由專業 Web 工程師花 3–5 小時構建高品質單頁網站,作為評估基準。
關鍵結果
- 生成式 UI Elo 分數:1710.7
- 人類專家:1756.0(僅略高)
- Markdown:1459.6
- 搜尋結果頁:1355.1
更值得注意:
- 與 Markdown 比賽中勝率 82.8%
- 與純文字比賽勝率 97.0%
- 44% 案例評分者認為 AI ≥ 人類工程師

也就是說,AI 用 1 分鐘產出的成果,在近半情況下等級已接近人類專家數小時的成果。
涌現能力(Emergent Capability)
低階模型無法勝任,如:
- Gemini 2.0 Flash:Elo 1332.9、29% 結構錯誤
- Gemini 3:Elo 1706.7、0% 致命錯誤
代表生成式 UI 是 需要 SOTA 推理能力 才能啟動的能力。

挑戰:速度、成本與韌性仍是硬傷
生成式 UI 雖強大,但仍有三大限制。
1. 生成延遲(1–2 分鐘)
對比搜尋引擎的毫秒級反應,這是明顯瓶頸。
Streaming 可降低體感等待,但仍不足。
2. 程式邏輯的細微錯誤仍會發生
即便 Gemini 3 已 0% 結構錯誤,
仍可能出現:
- 特定螢幕斷點 CSS 錯亂
- 少數 JS runtime error
3. 算力成本高
生成動態 UI ≫ 生成一段文字。
對商業化落地而言是現實挑戰。
下一個十年:軟體將從「產品」轉變為「按需生成的服務」
生成式 UI 展示了未來軟體的一種全新形態:
- 不再下載 App,而是由 AI 現場生成
- 不再學工具,而是直接獲得為你量身定做的工具
- 不再是閱讀內容,而是操作內容
舉例:
- 旅行規劃 → AI 生成專屬互動 App(地圖、價格、日程、預訂)
- 科學教育 → 即時生成可調參數的模擬器
- 數據分析 → AI 自動建立可視化儀表板
- 企業流程 → 自動生成工作流工具或小型內部系統
這是一場從「資訊搜尋」走向「功能生成」的革命。
未來趨勢與專業人士建議
1. 開始思考「需求即應用」的新產品邏輯
未來產品經理、工程師、教育者都需要重新審視:
- 使用者需要的是資訊?還是功能?
- 什麼場景適合讓 AI 自動生成 UI?
2. 預備迎接「AI 生成工作流」成為主流能力
企業將需要:
- 能與 AI 協作的 UX / 前端工程師
- 能寫 AI 指令的 Prompt Engineer
- 能定義商業邏輯並交由 AI 實作的 Domain Expert
這會是新時代專業人士的競爭力指標。




