Build School Logo
  • Microsoft Cert. Roadmap
    • Microsoft Certificate Courses
    • Microsoft Azure
    • Azure DevOps
    • Power Platform
    • Power BI
    • Cyber Security Certificate
    • AI
  • AI 培訓補助
    • 抓住培訓補助! AI 商業應用實戰班:ChatGPT與Gemini 產業應用情境與案例
    • Microsoft 365 Copilot AI 培訓補助來囉
    • AI 驅動開發:從構思到上線 – GitHub Copilot 企業開發實戰
    • AI-102 微軟AI工程師認證
    • 更多AI認證課程
  • Courses
  • AI產品一站式服務
    • 各廠模型高CP值-AI GPT企業學校多人共用版
    • 影像編輯更方便-AI Design 企業學校共用版
    • Google Gemini AI Pro for Education 教育版
  • Shop
  • AI Insightful
    • AI, Cloud, Full-Stack Engineer Bootcamp
    • Tips for Certificate Exam
    • How To Learn on Build School Learn
  • About Us
    • Build School
    • FAQ
  • English
    • 繁體中文 (Chinese (Traditional))
    • 日本語 (Japanese)

No products in the cart.

Login
Build School Logo
  • Microsoft Cert. Roadmap
    • Microsoft Certificate Courses
    • Microsoft Azure
    • Azure DevOps
    • Power Platform
    • Power BI
    • Cyber Security Certificate
    • AI
  • AI 培訓補助
    • 抓住培訓補助! AI 商業應用實戰班:ChatGPT與Gemini 產業應用情境與案例
    • Microsoft 365 Copilot AI 培訓補助來囉
    • AI 驅動開發:從構思到上線 – GitHub Copilot 企業開發實戰
    • AI-102 微軟AI工程師認證
    • 更多AI認證課程
  • Courses
  • AI產品一站式服務
    • 各廠模型高CP值-AI GPT企業學校多人共用版
    • 影像編輯更方便-AI Design 企業學校共用版
    • Google Gemini AI Pro for Education 教育版
  • Shop
  • AI Insightful
    • AI, Cloud, Full-Stack Engineer Bootcamp
    • Tips for Certificate Exam
    • How To Learn on Build School Learn
  • About Us
    • Build School
    • FAQ
  • English
    • 繁體中文 (Chinese (Traditional))
    • 日本語 (Japanese)

No products in the cart.

Login
  • Microsoft Cert. Roadmap
    • Microsoft Certificate Courses
    • Microsoft Azure
    • Azure DevOps
    • Power Platform
    • Power BI
    • Cyber Security Certificate
    • AI
  • AI 培訓補助
    • 抓住培訓補助! AI 商業應用實戰班:ChatGPT與Gemini 產業應用情境與案例
    • Microsoft 365 Copilot AI 培訓補助來囉
    • AI 驅動開發:從構思到上線 – GitHub Copilot 企業開發實戰
    • AI-102 微軟AI工程師認證
    • 更多AI認證課程
  • Courses
  • AI產品一站式服務
    • 各廠模型高CP值-AI GPT企業學校多人共用版
    • 影像編輯更方便-AI Design 企業學校共用版
    • Google Gemini AI Pro for Education 教育版
  • Shop
  • AI Insightful
    • AI, Cloud, Full-Stack Engineer Bootcamp
    • Tips for Certificate Exam
    • How To Learn on Build School Learn
  • About Us
    • Build School
    • FAQ
  • English
    • 繁體中文 (Chinese (Traditional))
    • 日本語 (Japanese)
logotype

No products in the cart.

  • English
    • 繁體中文(Chinese (Traditional))
    • 日本語(Japanese)
Login
logotype
  • Microsoft Certification Roadmap
  • Certificate Exams
    • Microsoft Azure
    • Azure DevOps
    • Power Platform
    • Power BI
    • Cyber Security Certificate
    • AI
  • Courses
  • Blog: AI Insightful
    • Tips for Certificate Exam
  • About Us
    • FAQs
  • AI 培訓補助
  • AI產品一站式服務
    • 多廠模型高CP值-AI GPT企業學校多人共用版
    • 影像編輯更方便-Al Design 企業學校共用版
    • Google Gemini AI Pro for Education 教育版簡介
  • Shop
  • My Profile
AI資訊分享Build School Learn2026-01-07
Share article:TwitterFacebookLinkedin
700 Views
27 Likes

[2026 AI 轉型]政府補助最高95~200萬! Build School協助企業導入 AI一站式服務-從OpenAI GPT/ Gemini、GitHub Copilot、M365 Copilot、Azure AI、Google Vertex AI 等工具及雲端平台

在 2026 年 AI 全面落地的時代,企業競爭力取決於員工對 AI 工具的掌握度。Build School 協助您的企業接軌世界級 AI 技術,同時透過政府補助計畫,大幅降低培訓成本,實現低負擔、高效率的數位轉型!

💰快速線上瀏覽懶人包 – https://learnaicopilot.build-school.com

  • AI課程網站: Build School Learn AI 課程地圖 | 微軟認證學習地圖

💰 2026 年度培訓補助方案總覽

無論您的公司規模大小,我們皆能協助您申請相對應的政府補助:

比較項目🏢 中小企業數位轉型培力 (經濟部)🏭 勞動部「大人提」計畫
企業人力資源提升計畫(大人提)
適用對象30 人以下 (服務/製造業)51 人以上 (中大型企業)
補助額度✅ 每人最高 $10,000
✅ 每家最高 $100,000
✅ 訓練費補助 50%~70%
✅ 年度最高 95~200 萬元
培訓形式標準班 (12小時,含6h實體)
企業包班、客製化內訓
企業包班、客製化內訓
適合情境快速導入、低門檻
中小企業數位轉型培力補助範圍:
1. 課程費用採實報實銷
2. 也可補助AI工具軟體費用
(OpenAI GPT / Gemini/ Copilot、Azure
、Azure AI、GitHub Copilot、Google Vertex AI…)
3. 提供統編之台灣統一發票,方便B2B付款及核銷
規模化人才升級
年度與長期規劃
申請期限及公告⏳ 2026年度待公告 (2025年度至2025/12/31 前)
30人以下服務業公告
30人以下製造業公告
依勞動部年度計畫公告

💡 為什麼選擇 Build School 進行 AI 培訓?

我們具備以下四大優勢:

  • AI 導入實務經驗: 近2年累積80多家企業/學校/單位客戶導入我司AI產品及培訓服務,至2025/12月止約3,200人次於我司學習微軟國際認證課程(其中微軟AI900認證累積培訓超過650人次,超過300人次取得微軟國際認證),10年軟體/AI/雲端/IT資訊專業培訓經驗,具備深厚的雲端與 AI 實務經驗,提供最前瞻的技術指導。
  • AI 落地一站式服務 : 從AI工具/平台採購、培訓、導入、顧問、到高階的微軟原廠認證(AI-102、AZ-104…),我們提供完整的AI 一站式服務,不用東找西尋。
  • 100% 實戰導向: 拒絕純理論!課程可涵蓋 Open GPT/ Gemini / NotebookLM / M365 Copilot 到 AI Agent 開發應用、 Azure AI Foundry、GitHub Copilot 及 Google Vertex AI,讓員工「早上學、下午就能用」。
  • 專業補助核銷支援: 提供標準台灣統一發票與統編,並了解勞動部「大人提」及經濟部「中小企業數位轉型培力計畫」申請規範,協助企業輕鬆完成 B2B 核銷。

🚀 專業職能 AI 升級路徑:一眼看懂您的需求

  • 你知道 Azure AI 也有 OpenAI 及其它大廠Claude等模型嗎?
  • M365 的用戶,你有將內建的 Copilot Chat 用起來嗎?
  • 只是拿來聊天? ChatGPT / Gemini 的真正行業商業應用
  • AI 工作流程自動化 – 企業內部如何開始?
  • 你知道AI 自然語言處理可以做哪些事嗎? 內容分析/分類/標籤/去識別化及知識整理,它可以
    • 分類/打標籤 (例如: 客訴分類)
    • 評價/情緒判斷 (例如: google 地標的評語,分為 好 / 中立 / 壞)
    • 判讀意圖 (例如:從文字中了解使用者想做什麼)

我們不只教工具,更教如何將 AI 嵌入工作流。針對企業不同角色,量身打造AI升級路徑:

👀 眼見為憑:拒絕空談,我們只教能落地的 AI 技術

Demo: AI 應用與開發: 我的一日穿搭 OOTD

⚠️ 為什麼現在是最佳時機?

  • 告別繁瑣規劃: 內訓成本高?Build School 協助盤點需求,精準定位培訓方向。
  • 政府強力支持: 2026 年是數位轉型補助的高峰期,名額有限,額滿即止。
  • 提升員工產值: 導入 AI 協作可節省煩索的作業處理時間,讓團隊專注高價值決策及產出。

📞 立即諮詢,搶佔補助名額!

別讓複雜的文件阻礙企業升級,讓 Build School 成為您的強力加速器。

  • 諮詢信箱: contact@build-school.com
  • 快速聯繫: 歡迎至 Build School Learn 官網右下角「聊聊」與我們聯繫
READ MORE
AIBuild School Learn2025-01-13
Share article:TwitterFacebookLinkedin
3152 Views
71 Likes

產品簡介-ChatGPT/Gemini/Claude模型全面開放-AI GPT 企業學校共用版 (如 ChatGPT介面/雲端多人可共用且多模型CP值高: OpenAI GPT 5.4 + Gemini 3 + Claude 4.5 模型 + GPT Image 2 + Gemini Banana 繪圖 + Gamma AI 簡報 + AI Art 藝術創作;另有企業共用版)

產品試用及報價

提供 30 天免費試用版供學校教職員試用,並依貴單位/學校之使用情境 (是否需要 AI 繪圖 / AI 修圖) 及人數/帳號數 (可多人共用,可依教職員使用人數/帳號數的比例來估算 ; 或以班級或一堂課 20 或 30 多人共用),提供報價。請點擊至最下方填寫表單,將於1個工作天提供試用帳號,謝謝您 (除了OpenAI ChatGPT模型外、若有其它模型版本需求也可填寫,如: Google Gemini, Claude, Google AI Pro for Education 教育版)
客服信箱- contact@build-school.com | 線上即時客服 (網站右下角 Messenger 聊天視窗) – https://learn.build-school.com/zh-hant

  • 若為企業共用版,請參考這裏。

產品簡介 – 適合學校師生多人共用,同時登入也可以使用,更超值

  1. 好消息:即日起GPT/Gemini/Claude各廠模型全面開放與功能升級 – 左上角下拉選單可依個人喜好選擇各廠模型]提供予GPT-5/Gemini/Claude含AI繪圖修圖方案訂閱,不同情境選擇適合的模型輸出品質更好! 我們將持續提供產品新功能並依各產廠新模型並即時升級,以提供更好的使用體驗
  2. 多廠模型可使用CP值效益高:  本產品完整版含: OpenAI GPT + Gemini + Claude 對話模型 + Gemini 3 Banana 2 繪圖/修圖模型(熱門!支援中文/解說圖/教材圖等,適合老師備課與教案設計用) + Gamma AI 簡報整合 + 我司 AI Art 藝術創作產品
  3. ChatGPT 類似操作介面無需額外學習 – 提供與 ChatGPT Plus 付費版相近功能與AI模型,生成速度快及效果品質一致,支援文字生成、圖片辨別讀取與生成、上網搜尋、文件上傳與知識庫、對話釘選及分享、常用提示詞、團隊/班級工作區等功能,方便教學及班級使用。
  4. 從 5個帳號到 30個帳號版,適合想使用 ChatGPT Plus付費版之學校單位,教職員或班級師生皆能同時學習及多人使用,1個工作天即可開通,方便課堂教學
  5. 方便的對話管理功能 – 常用對話釘選及分享、並可將對話下載為 Word、PowerPoint、Excel、Markdown 檔案(方便匯入Notion等筆記軟體)方便後續編輯
  6. 內建常用提示詞方便學習與教學 – 文章摘要 / 英文文章及克漏字出題 / 中英文寫作學習 / 學習計畫制定 / 出題與評量 / 數學及運算推理 / 翻譯 / 作文寫作評比 / 轉換心智圖 / 圖片生成及圖片解讀 / 社交媒體貼文 / 電商產品文案…等並持續增加優化
  7. AI 繪圖 / AI 修圖生成品質佳 – AI 繪圖模型 OpenAI Image / Gemini Banana 或 Flux,圖片生成品質與 Midjourney 看齊。(原方案AI 繪圖為文字生成圖片功能,2025/7月新產品方案額外增加並提供「AI 修圖 – 最新AI 圖像編輯模型」(如:上傳圖片換風格),支援上傳圖像風格轉換(例如:轉為日式/美式動畫風格)、修圖(圖片中增加或修改物件,例如:衣服顏色/帶眼鏡/帽子)、多圖風格融合(例如:背包圖+人物圖=該人物背著這個背包)。支援各種圖像生成與編輯功能 – 包括教材插畫設計、貼圖生成、人物相片風格轉換、物品材質參考與置換、多圖風格或物品結合、圖片物品增修、Logo與海報/卡片設計、商品場景融合、室內設計風格轉換、服裝替換等各種進階的圖像編輯應用情境)
  8. 老師教案/教材/作業/評量設計情境範例(多人登入皆可同時使用): 例如有10組帳號,可每一年級或同一領域/科目的老師提供其中一組帳號,建立每個年級/領域常用教材/教案及老師常用的對話資料夾 ; 每一組帳號皆可以多位老師共用,若同一帳號多人同時登入仍可使用,對話記錄會彼此交錯,建議作法可建立個別老師的對話資料夾用來保留各自對話,有助於教材/教案保存,或登出前將對話記錄刪除,或可使用「臨時隱藏對話」功能將不會儲存對話記錄 (適合若多人共用某一帳號時,「臨時隱藏對話」將不保留對話/也不會出現在左側對話清單它人看不到)
  9. 超值的多師生/多班級共用方式,免安裝設定方便立即開通使用 – 每一組帳號皆可以多人共用。
  10. 課堂使用情境範例: 若為課堂指導學生使用,班級學生或某堂課 20人,老師於課堂中,可開放1~2個帳號帶領同學使用 (平板/桌機/手機皆可),因帳號可共用CP值更高,可於PBL 或情境教室、或電腦教室中使用,也方便老師投影至大教學螢幕。該堂課結束,這1~2個帳號可供下一班/下一堂使用。下一班/下一堂使用時,也可視情況自行清除對話記錄,給學生用的提示詞建議使用老師已釘選好的對話並分享或複製,學生可以自己匯入在操作的帳號中,對教學比較方便。
  11. 與 ChatGPT Plus 付費版相同的 AI 模型,包括最新的 GPT-5.4/5.2系列,生成速度快及效果品質一致 – 雲端服務建置於微軟 Azure 資料中心,高規格的資訊安全等級及資料保護。(請參考 – https://azure.microsoft.com/zh-tw/products/ai-services/openai-service )
  12. 使用常見的瀏覽器 Browser 版本,支援響應式網頁 RWD 適合各種裝置與載具及常見作業系統 (Windows/ Mac / Linux / iOS / Android),從桌上型電腦、筆記型電腦、平板、手機等
  13. 新增管理功能 「群組帳號管理」(因帳號可多人共用,為方便控管帳號權限,用來重置單位中某一帳號之密碼,僅單位帳號管理員專用。若已是產品訂閱用戶需要開通此功能,歡迎來信,謝謝您)
  14. 另有全校師生使用授權版,可自定子網域名、自由增減使用者及管控權限、建立教材及文件庫、及使用 Google 教育帳號或 Microsoft Account 帳號登入

[好消息] 繪圖效果更好的GPT-Image-2代 + 生成短影片 + AI心智圖

[好消息]OpenAI GPT/Google Gemini/Claude各廠模型全面開放 + Gamma AI 簡報 + Banana Pro 中文繪圖🔥依喜好及情境選擇不同的模型輸出效果更好

產品功能及操作影片

影片可放大並開啟字幕 – 產品全功能與常用情境

常用情境: 教學/教案設計與日常工作情境

  • 文章解析 / 摘要 / 翻譯
  • 出題 / 解題 / 評量 / 中英文寫作評量
  • 報告 / 研究 – 結合搜尋/檔案內容學習
  • 學習計畫制定 – 行事曆及每日讀書進度
  • 繪圖及圖片解析
  • 口語練習及語音

2. 良好的提問法 – 提示詞工程 Prompt Engineering

  • 範例學習
  • 拆解工作流程
  • 格式化輸入與格式化輸出 – excel / 表格 / markdown / 心智圖 / 甘特圖
  • 角色設定

3. 進階使用技巧

  • 外部工具(搜尋 / 爬取網頁 / 檔案上傳 / 知識庫) 強化能力
  • 對話管理 – 目錄 / 釘選 / 分享 / 匯入匯出
  • 建立教材及文件庫 – 在群組及對話中引用 (全校授權版)
  • 群組與工作區 – 建立班級/年級/教學群組並管理權限 (全校授權版)
  • 老師教案/教材/作業/評量設計情境範例: 可每一年級老師提供10組帳號,每個年級/領域/科目建立常用的教材/教案及文件庫,並建立老師常用對話資料夾 ; 在群組及對話中引用該教材進行問答、出評量等

示範影片 – 學習資訊圖表網站(一頁式教材)與深入研究,一鍵生成線上高互動及美觀網頁,方便展示與教學

示範影片 -「互動式線上測驗題一鍵生成(類似Kahoot互動式答題)」,建立線上互動的隨堂小測驗,課堂中師生遊戲互動並增進樂趣

示範影片 – AI 修圖及進階圖像編輯 (上傳圖更改風格/物品等…)

對話介面進行修圖及圖像編輯

(請觀看) 更便利的操作介面及功能「 AI 藝術創作- AI Art Creative」上線了! 提供給2025/8月起新方案規格中含「AI 繪圖與AI 修圖」模型之訂閱用戶使用。操作便利性比原先在對話中進行修圖/風格轉換更方便,也新增了各種進階AI 修圖/多圖融合功能,包括: 風格轉換 / 貼圖製作 / 服裝與人物 / 人物與場景融合 / 商品攝影場景 / 物品/材質修改 / 室內裝修 / Logo設計 / 手稿/老照片上色修復 / 改比例/擴圖/去背 / 創意與趣味風格等進階圖像編輯功能

4. (進階應用) 數學運算或程式設計 – GPT-5/Gemini-3 思考推理模型 (影片可放大)

影片可放大並開啟字幕 – 數學運算或程式設計
  • 數學運算並使用 Python 程式碼驗證 – 提醒: 建議數學運算回到 Excel 工具或使用 Python 程式來運算取得正確結果,並應留意其結果是否正確 (因目前 AI 模型在進階的數學運算仍有小機率出現錯誤,也就是幻覺)
  • 程式設計並直接展示執行結果,使用 HTML/JavaScript 或 Python 範例: 撲克牌發牌程式並有動畫效果

5. (進階應用) 設計 AI Agent(AI代理人)的用法及展示

GPTs (為ChatGPT中讓你可以設計簡單AI對話應用之功能) 或是稱為 AI Agent, AI 代理人,我們的AI工具也可以讓你自訂提示詞、設定這個AI 模型的角色、工作流程、回覆的語氣,並可以使用專屬知識庫來回答,也就是你匯入的參考文件,也可以使用一些外部工具來增強模型的能力

  • 進入工作區 – 若為全校授權版,將能建立自己專屬的模型、知識庫、以及提示詞範本
  • 建立專屬模型應用 – 提示詞最關鍵,為初始的角色及需遵循的工作流程,依提示工程的準則來撰寫並反覆測試
  • 建立知識庫並匯入pdf/word/ppt等文件 – 設定知識庫及權限 → 設定好之後在模型中引用

Demo 展示 – 查詢某門課程進度 | 查詢某門課的主題 | 使用/ 指令並依學生的興趣來建議課程

請填寫表單-取得產品試用與報價


預估使用人數 - 可多人同時登入共用,可依教職員生人數/帳號數的比例來估算 ; 或以一堂課多少人共用 *若為老師用,可依教職員人數/帳號數的比例來估算,例如: 設計教材/教案/評量/作業/作文/行政工作輔助等 ; 或依主要使用年級之班級人數估算,例如: 20 / 30 人等
請填寫聯絡電話,也可補充方便連絡時段。例如: 0955?????? 中午 12:30 - 1:00
有意使用的模型(若不確定本題可略過)可自由勾選或自行填寫其它廠牌模型
0 / 180

產品更新日誌

  • 2026/4/28: 最新OpenAI GPT-Image-2繪圖模型於2026/4/23日發佈,可設各種比例及2K大小(預設為自動判斷),中文最佳繪圖/教材圖表品質Benchmark更甚 Gemini Banana (教學影片)
  • 2026/4/21: 影片生成(上傳圖片生成影片含音樂背景聲,輸入框下方設定影片大小(480p/576p)及比例(16:9,4:3,1:1,預設:依圖片比例),長度(4到10秒,預設4秒),可打開優化提示詞,將自動生成更好的生成影片提示詞 (教學影片)
  • 2026/3/24: 一鍵生成 AI 心智圖MindMap,下載Markdown檔案後可匯入XMind軟體繼續編輯心智圖! 不用再手工創建心智圖階層及節點編輯,又快又準確。(教學影片)
  • 🔥熱門2026/3/7 – 好消息:即日起GPT-5.4模型全面開放與功能升級 (能力與知識全面超越,自動依任務複雜度決定思考長度及使用搜尋,適合長文,資料分析,推理,程式, 以 OpenAI 於2026/3/6發佈全功能模型隔天即上架) – 左上角下拉選單可依個人喜好選擇各廠模型。
  • 🔥熱門2026/3/1 – Gemini Banana 2 繪圖功能全面開放供全系列方案使用! 更快品質更好,只需打開對話框下方的「圖片」鈕即可使用,全方案/全模型皆支援,也就是可以使用 GPT-5.2 或 Claude 4.5對話,但繪圖使用 Gemini Banana 2,如下圖。回饋給全方案客戶!
  • 🔥熱門2026/3/1 – 超越專業設計水準! Gemini Banana 2 支援2K/4K大小出圖,更快品質更好,適合列印或製作中文教材圖表/教材解說/知識講解圖表/多圖結合/修圖 (Google官方2026/2/27發佈最佳AI繪圖模型,較Gemini官方介面更彈性,可自選 1K/2K/4K 出圖,建議當圖中的字很多或物品很多時可切2K/4K,如下圖)。
  • 🔥熱門2026/2/1 – 好消息:即日起GPT-5.2模型全面開放與功能升級 – 左上角下拉選單可依個人喜好選擇各廠模型] 我們將持續提供產品新功能/模型升級,以提供更好的使用體驗,謝謝您
  • 🔥熱門2026/1/18 – 好消息:即日起GPT/Gemini/Claude各廠模型全面開放與功能升級 – 左上角下拉選單可依個人喜好選擇各廠模型]提供予GPT-5/Gemini/Claude含AI繪圖修圖完整版訂閱,不同情境選擇適合的模型輸出品質更好! 我們將持續提供產品新功能/模型升級,以提供更好的使用體驗,謝謝您
  • 🔥2026/1/12 – 開放[研究與程式專用-Gemini-DeepThinking] 的模型供全產品方案訂閱者使用; 適合軟體開發/數理運算/資料分析/議題研究,先思考後再執行,尤其網頁程式速度快又品質佳!
  • 🔥熱門2025/11/24 – 超越專業設計水準! Gemini Banana Pro中文教材圖表最佳AI繪圖, 支援中文/教材解說/知識講解圖表/多圖結合/修圖,Google官方2025/11/21發佈最佳AI繪圖模型 (較Gemini官方介面更彈性,可自選 1K 出圖快或 2K出圖速度較慢,建議當圖中的字很多或物品很多時再切2K)
  • 🔥熱門 2025/11/21 – Gamma AI簡報製作工具整合試用上線(為目前市面上頂尖的AI簡報工具),初期提供 GPT-5.1/5 / Gemini / Claude 版的用戶使用,將逐步更新陸續開放,效果預覽如下!
  • 🔥熱門 2025/11/19 – 最新全功能 GPT-5.1-自動優化模型上線 (比GPT-5速度更快,回覆較有人味) : 速度最快,自動依任務複雜度決定思考長度,強化回覆擬人化與情商, 能自動搜尋; 適合長文/資料分析/推理/程式,能力與知識全面超越 4.1/4o。
  • 2025/9/5 – 更新「對話資料夾」及 「臨時對話」功能(教學影片),方便多人共用帳號及管理。可建立每個年級/領域常用教材/教案及常用的對話資料夾 – 每一組帳號皆可以多位老師共用,建議作法可建立個別老師的對話資料夾用來保留各自對話,有助於教材/教案保存。建立專屬對話資料夾(從左側”對話”選單”+”) – 例如:建立”某某老師”, “英文科”, “資訊科”的專屬或共用資料夾,方便管理及保存對話; 或上傳教材/教案,在這個資料夾中新增對話時,將依你設定的「系統提示詞」(初始角色/回覆風格/要求格式等的提示詞)及上傳的文件(PDF/Word…)來回答。可搭配「臨時對話」功能(每次對話前可自行開啟,該次對話將不會出現在左側對話清單,也不會保留對話記錄其它人也看不到)
createfolder-AIGPT學校共用版
tempchat-AIGPT學校共用版
  • 2025/11/18 – 新增管理功能 「群組帳號管理」(因帳號可多人共用,為方便控管帳號權限,用來重置單位中某一帳號之密碼,僅單位帳號管理員專用。若已是產品訂閱用戶需要開通此功能,歡迎來信,謝謝您)
  • 2025/9/5 – 新增工具列功能「輸出至數位白板」,可將對話結果帶入線上數位白板網頁中,也可自由的書寫、編輯、畫圖、適合展示與教學,若使用平板展示白板會更方便。
  • 2025/8/28 – 學習資訊圖表網站(一頁式教材)與深入研究,可一鍵生成線上高互動及美觀網頁,方便展示與教學。
  • 2025/8/13 – 更方便的操作介面「 AI 藝術創作- AI Art Creative」上線了! 提供給2025/8月起新方案規格中含「AI 繪圖與AI 修圖」模型之訂閱用戶使用。操作便利性原先在對話中進行修圖/風格轉換更方便,也新增了各種進階AI 修圖/多圖融合功能,包括: 風格轉換 / 貼圖製作 / 服裝與人物 / 人物與場景融合 / 商品攝影場景 / 物品/材質修改 / 室內裝修 / Logo設計 / 手稿/老照片上色修復 / 改比例/擴圖/去背 / 創意與趣味風格等進階圖像編輯功能。
  • 2025/8/9 – [提供試用]最新全功能GPT-5系列模型-OpenAI 於2025/8/8 發佈全功能模型, 速度飛快且能力與知識全面超越GPT-4o系列模型
  • 2025/7/9 – 提供「深入研究與報告-DeepResearch」模型功能給GPT-4.1後的新方案用戶,先思考推理擬出策略及執行步驟,再輸出結果;適合教材設計、寫報告與議題研究並附上參考來源,一次輸出可達3,000字以上,類似 ChatGPT DeepResearch及Perplexity 功能
  • 2025/7/3 – 即日起正式提供「AI 修圖 – 最新AI 圖像編輯模型」(如:上傳圖片換風格),支援上傳圖像風格轉換(例如:轉為日式/美式動畫風格)、修圖(圖片中增加或修改物件,例如:衣服顏色/帶眼鏡/帽子)、多圖風格融合(例如:背包圖+人物圖=該人物背著這個背包)。支援各種圖像生成與編輯功能 – 包括教材插畫設計、貼圖生成、人物相片風格轉換、物品材質參考與置換、多圖風格或物品結合、圖片物品增修、Logo與海報/卡片設計、商品場景融合、室內設計風格轉換、服裝替換等各種進階的圖像編輯應用情境。
  • 各種風格變化及物品元素修改 (上傳1張圖 + 提示詞: 改為某某風格 / 加減或修改照片中物品元素 / 變換背景及場景)
  • Logo 生成並用自然語言描述
  • 有趣的玩具包裝 (上傳寫實全身照 + 提示詞控制出現的物品)
  • 商品宣傳照結合與修圖 (上傳1至2張照片,如: 1張人物 + 1 張產品 + 提示詞: 讓這位主角手拿著商品,場景為居家/浴室/戶外等…)
  • 室內裝潢風格及傢俱擺設示意 (上傳1張你的房間 + 提示詞: 將這個空間以”波西米亞風格”來設計)
  • 2025/6/27 – 即日起正式提供 GPT-4.1 系列新模型供使用,其效能優於GPT-4o,包括 GPT-4.1, GPT-4.1-mini, GPT-4.1-nano 等模型,GPT-4.1 模型效能評估報告請參考 – https://learn.build-school.com/zh-hant/gpt4-1-openai-eval-report/
  • 2025/6/19 – 增加 Excel 檔案下載,可將回覆對話中的區塊(例如 CSV 逗號分格之格式) 下載成 Excel 檔
  • 2025/5/21 – (觀看示範影片) 增加「互動式線上測驗題一鍵生成」功能,建立線上互動的隨堂小測驗,類似Kahoot互動式答題,課堂中師生遊戲互動並增進樂趣。
  • 2025/5/5 – 透過對話即可畫圓餅圖(pie chart) 及時間線圖(timeline)並直接顯示,如下
  • 2025/5/1 – 增加 o4-mini推理模型 (適用情境: 進階程式設計/數理運算邏輯推理) ;  用於程式設計時,若為 HTML/JavaScript 網頁程式,也會自動將網頁結果展示在右側,如下圖 ; Python 程式碼可直接線上執行觀看結果。
  • 2025/5/1 – 增加心智圖、甘特圖於對話中直接顯示,如下圖
  • 2025/4/26 – 增加 PowerPoint下載,方便直接將對話轉為PPTX檔供後續編輯,並能保留標題、表格及圖示樣式。
  • 2025/4/24 – 增加 Word 下載及 Markdown 下載,方便直接將對話轉為Word檔供後續編修、或轉為Xmind心智圖,如下圖

下載 Word檔後,從Xmind軟體匯入後如下的完好的「心智圖」,

  • 2025/04/18 – 增加 OpenAI 官方於2025/04/17 發佈的 GPT-4.1 與 GPT-4.1-mini 模型。最新GPT-4.1全功能模型為4o下一代模型, 各式任務均有出色能力; GPT 4.1-mini 基礎模型速度及效益佳(取代4o-mini模型),如下圖
  • 2025/04/17 – 增加 OpenAI 官方 o4-mini 模型, 為推理模型善長數理運算及邏輯推理與高階程式設計,如下圖
  • 2025/03/31 – 可自行新增「對話資料夾」,方便保留及管理對話。

其它模型版本供試用

  • Google Gemini 版本 – 含 Gemini 3.0 (一般文字工作情境) / Gemini 3.0 深度思考DeepThink (含推理功能用於進階程式設計/數理運算)
  • Claude 模型版本 – Claude 4.0 /4.5 一般工作情境及適合進階軟體開發/程式設計/資料分析
READ MORE
AI資訊分享Build School Learn2026-05-04
Share article:TwitterFacebookLinkedin
81 Views
11 Likes

AI 時代產品人的新修煉:為何「主動性」比「技能」更關鍵 – 深度解析 Notion 產品負責人 Max Schoening 的產品建構哲學

在人工智慧以前所未有的速度重塑軟體開發的今天,產品經理、設計師與工程師的角色邊界正發生著劇烈的變化。在這樣的浪潮中,我們該如何重新定義自己的工作價值?

本篇文章提煉自 Lenny’s Podcast 對 Notion 產品負責人 Max Schoening 的深度專訪。Max 擁有極為豐富且多元的背景,他曾擔任 Google 的產品經理、Heroku 的設計團隊負責人、GitHub 的設計領導者與工程師,同時也是兩次連續創業家。作為目前業界最前衛的 AI 產品領袖之一,他對 AI 將如何影響我們建構和使用軟體,有著極其深刻的洞見。

以下我們將從「主動性與技能的對比」、「角色邊界的模糊」、「可塑性軟體的崛起」、「產品的核心與品味」,以及「AI 時代的開發實務」五個大維度,為您全面拆解 AI 時代下打造卓越產品的核心指南。

原始影片


1. 技能貶值,主動性(Agency)為王

在過去的職場環境中,我們經常會因為缺乏某項專業能力而感到受限。我們很容易找藉口說:「我永遠無法做到這件事,因為我缺乏某項技能」。然而,隨著 AI 模型(甚至未來趨近 AGI 的模型)的發展,技術門檻正在急遽降低,技能已逐漸成為唾手可得的資源。

Max 指出,當技能就在你的指尖時,真正決定成敗的關鍵因素變成了「主動性」(Agency)。

主動性在世界上的分佈極不平均。 那些具備高度主動性、且明白周遭世界是「可被塑造(malleable)」的人,將會在未來取得巨大的成功;反之,那些固守傳統職位描述、總是問「身為 PM 或設計師,我到底該做什麼?」的人,未來的路將會非常艱辛。

如何培養主動性?

Max 引用了 Steve Jobs 的經典名言來解釋主動性的覺醒:「總有一天你會醒來,並意識到這個世界是由那些並不比你聰明的人所創造的」。當你體認到這一點時,你就會明白你隨時可以改變事物的現狀。

要培養這種主動性,最好的方法就是「動手創造」(Making)。無論是修繕辦公室的椅子,甚至是自己下廚做一頓飯,這些「修補與創造」的過程會讓你踏上主動性的跑步機。當你開始動手做,並發現事物並不難改變時,你就會被喚醒。

在 Notion 內部,Max 經常鼓勵團隊(Notion 員工被稱為 Ninos):「像偷來的車一樣去駕駛 Notion(Drive Notion like it’s stolen)」。這意味著,即便你不是在公司創立之初、尚未找到產品市場契合度(PMF)時就加入的創辦人,你依然可以展現極強的主動性去推動改變。例如 Notion 的團隊成員 Brian Leven 模糊了工程與設計的界線,甚至主動承擔起招募的責任;而另一位 PM Eric Lou 為了增加自身價值,主動減少寫長篇大論的需求文件(PRDs),轉而直接在程式碼中製作原型,以此來表達他的策略思考。這些都是跳脫日常既定職責、渴望推動改變的高主動性展現。


2. 邊界模糊:設計師與 PM 寫程式的新常態

在 Notion,設計師與 PM 直接撰寫程式碼並部署功能,已經逐漸成為常態。但這背後的邏輯,並不是為了讓所有人取代工程師,而是為了「掌握新時代的創作媒材」。

告別「死魚」,在真實媒材中設計

Max 分享了 Notion 設計師開始寫程式的起源。起初,團隊在 Figma 中設計 AI 聊天介面,但 Max 引用了 Bret Victor 的演講概念指出:在靜態設計稿上畫一個聊天介面,就像是在畫一條「死魚」。要真正體會 AI 的互動感,你必須親自感受它。

因此,他們打造了一個對 LLM 非常友善的小型程式碼環境(Playground),讓設計師能在其中直接開發聊天介面的原型,這大幅降低了非工程背景人員對終端機(Terminal)的恐懼。隨著模型能力呈指數級成長,現在這些設計師和 PM 甚至開始向正式的產品程式碼庫(Production codebase)貢獻程式碼。

寫程式是為了「理解 Agent 迴圈」

Max 強調,他其實並不在乎設計師寫的程式碼是否真的進入了產品環境。他重視的是寫程式能強迫你去思考「媒材」的特性。

在 AI 時代,理解代理迴圈(Agent loops)將是產品人員的核心能力。如果一個設計師或 PM 只能用 AI 工具調整 UI 樣式,卻不懂 Agent 迴圈是如何運作的,那他的價值將非常受限。真正能理解 Agent 迴圈的唯一方法,就是用構成它的材料(即程式碼)親手打造它。因此,學習寫程式是為了成為「該媒材的大師」,而不是成為功能交付機制中的一個小齒輪。

當心失去「工匠精神與專家」

儘管角色邊界正在融合,Max 也提出了一個深刻的擔憂:如果我們不夠小心,我們將失去真正的「專家」。

他用硬體製造來比喻軟體開發:現在的 AI 工具就像是 3D 列印機,能讓人非常快速地做出原型,但如果你仔細看,會發現上面充滿了粗糙的「列印紋路」。這種原型絕對不能直接賣給消費者。

真正的工程學,在於如何優化「工廠」,確保產品在面對一億甚至十億用戶時,依然能擁有足夠的良率與精準度。同樣地,在設計端,雖然現在任何人都能套用現成的設計系統做出堪用的 UI,但產品的「愉悅感與工藝(delight in craft)」在哪裡?。在追求所有人都跨界融合的趨勢下,保留並尊重邊緣領域的深度專家,是維持軟體高品質的關鍵。


3. 可塑性軟體(Malleable Software)與 SaaS 的未來

Max 一直是「可塑性軟體」的強烈倡導者。

什麼是可塑性軟體?

可塑性軟體指的是:軟體的運作方式應該更貼近使用者的利益,而非僅僅符合製造該軟體的企業的利益。

想像一下,如果你住的公寓裡,客廳跟廚房的格局被設計師完全釘死,你連重排傢俱的權利都沒有,你會接受嗎?。然而,這正是我們目前使用軟體的現況。現代的 App 把介面、資料擁有權全部黏合在一起,變成手機上一個封閉的方塊,當你想要稍微修改一點行為時,通常是無法做到的。

隨著 AI 降低了開發門檻,越來越多人意識到自己可以打造專屬的工具,找回對運算生活的控制權。這就是可塑性軟體的核心:建立在一個鼓勵客製化的平台或作業系統上,讓人們可以擁有自己的工具,同時又不會失去即時協作與安全性。

SaaS 真的會面臨末日嗎?

有觀點認為,既然大家都能用 AI 自己寫工具,是不是再也不需要 SaaS (軟體即服務) 了?

Max 對此提出了不同的見解:SaaS 的末日被嚴重誇大了。

儘管未來許多人有能力在週末用 AI 重建一個簡單版的 Notion,但大多數人其實並不想要維護整個軟體堆疊(full stack)。SaaS 真正有價值的部分在於「即服務(as a service)」——也就是背後的維護成本,以及有一群專家在為你解決難題。

他用了一個生動的比喻:「人們不想自己去打獵,他們只想去 Costco 買用保麗龍包裝好的牛排,並假裝那從來就不是一隻動物」。軟體就像是一座花園,需要長期的維護與灌溉。企業寧可花錢購買服務,也不願浪費時間去重新造輪子,因為專業化分工才是讓社會進步的動力。未來的工具可能會變得更通用(類似 90 年代的文書處理器或試算表),但它們依然會以 SaaS 的模式存在。


4. 打造卓越產品的「微小核心」(The Tiny Core)與品味

開發了眾多世界級產品的 Max 認為,所有偉大的產品,都擁有一種超乎尋常的「微小核心」(Tiny Core)作為超級能力。

  • GitHub 的核心是「Pull Request」(任何人都可以向你提出程式碼建議)。
  • Heroku 的核心是 git push heroku master(只要一行指令,就能讓本機程式碼變成網路上的 URL)。
  • Dropbox 的核心是那個選單列上的小圖示,它的同步能力甚至比你的 Mac 還能更準確地判斷你是否連上網路,它的唯一工作就是「把你的檔案準備好,並不要來煩你」。
  • Notion 的核心則是「區塊(Blocks)」以及 / 指令(Slash commands)。

最大的陷阱在於: 很多團隊在產品核心不佳時,會陷入「只要我再加一個功能,產品就會變好」的死亡螺旋,這招永遠行不通。當核心的吸引力足夠強大時,甚至連第一版的 UI 極度難用,用戶也能夠包容。

關於「品味」(Taste)的培養

在 AI 能自動生成 UI 的時代,人類剩下的最後一道防線往往被認為是「品味」。那麼,品味到底是什麼?

Max 提出了一個極具工程色彩的定義:品味,就是能夠在你的大腦中運行一個「虛擬機器」(Virtual Machine);當給你一個點子時,你能準確預測你的目標受眾(in-group)會不會喜歡它。

建立這個虛擬機器的唯一方法就是「大量的刻意練習與回饋(Reps)」。這非常像訓練 AI 模型的「反向傳播(Backpropagation)」機制:輸入點子 -> 觀察人們的反應 -> 調整自己的預測模型。如同日本的工匠花費數十年漆一個碗,品味是無法速成的。

對於設計師而言,那些擁有極高品味的人,通常有兩個特質:第一,他們有自己從頭負責到尾的 Side Project;第二,他們不斷地在把玩其他人的新工具、接觸別人的想法。將自己置身於有品味的環境(例如 Notion 用歷史上經典的產品來命名會議室:第一台打字機、麥金塔電腦、保時捷 911),會讓你時刻感受到自己作品的不足,進而激發追求極致的動力。

我們不該只是追求推出功能(增加 Shots on goal),而是應該追求只打造「顯然極佳的產品(Obviously good stuff)」。就像第一代 iPhone 或 ChatGPT 剛問世時,沒有人會爭論它好不好,因為它的優秀是顯而易見的。


5. AI 時代的產品開發實務

AI 不僅改變了軟體的型態,也徹底顛覆了我們打造軟體的工作流程。

「前 10% 的專案現在是免費的」

回想幾年前的工作模式,現在改變最大的是:任何專案的前 10% 進度現在幾乎不費吹灰之力。

在過去,PM 需要撰寫長篇的 PRD(產品需求文件)。但現在,與其寫文件,不如直接做出一個簡陋的原型(janky version),這幾乎是不需要成本的。你可以輕易負擔得起「派 10 個 AI 代理人去探索 10 種不同的開發路徑,再看看哪個是對的」的試錯成本。

過去在 GitHub 有句名言:「用 Demo 代替 Memo(Demos not memos)」,要求大家直接給出可以互動的東西。如今,要給出一個能讓人直接反應的早期版本變得無比容易,這種將迭代前置到產品生命週期早期的做法,徹底擊碎了傳統的瀑布式開發(Waterfall)。不過 Max 也提醒,即便前 90% 的工作都被輕易完成,最後那 10% 的收尾與打磨,依然需要花費 90% 的精力,因為那才是最困難的。

關於 AI Token 花費的哲學

當員工使用 AI 開發工具(如 Claude、Cursor 等)時,會消耗大量的 Token,甚至有人的 Token 花費會引起財務關注。

目前 Notion 內部的政策是「幾乎無限制的探索」。Max 認為,當一個革命性的新事物出現時,現在去斤斤計較 Token 的 ROI(投資報酬率)是找錯了優化方向。雖然他預期 6 到 12 個月後,多數企業會開始緊縮並審視這筆開銷,但目前正是鼓勵人們打破舊有工作模式的最佳時機。

他反對將 Token 花費當作炫耀的指標(就像以前炫耀一天寫了幾行程式碼一樣愚蠢),但他也理解某些大企業建立 Token 消耗排行榜的苦衷——因為要改變人們固有的行為模式實在太難了,有時你需要這種外在刺激來強迫員工跳出舒適圈,開始將自己的工作流程與 Agent 結合,打造自動化的「軟體工廠」。

軟體正在加速吞噬世界

未來 AI 對哪個職位的影響最大?Max 認為,與其說是 AI 會取代行銷或 HR,不如說是「軟體吃掉世界」的速度會大幅加快。

當撰寫程式碼的成本趨近於零時,我們將能把各種商業實務以極低的成本編碼成軟體。未來,解決行銷或人資問題的手段,將不再是拜託工程團隊開發系統,而是由該領域的專家自己利用 AI 代理人把流程軟體化。所有成功的代理人,最終都會演變成某種形式的「程式碼編寫代理人(coding agent)」。

知識工作就是我們時代的 UBI

針對 AI 是否會帶來「全民基本收入」(UBI, Universal Basic Income)的討論,Max 提出了一個辛辣且幽默的觀點:其實我們已經身處在 UBI 之中了,它的名字叫做「知識工作」。

從人類生存的本質來看,我們真正需要的東西其實很少。而現在許多知識工作者,能夠舒舒服服地坐在有冷氣的房間裡,只要對著電腦輸入正確的文字和字母,就能獲得豐厚的報酬。相對於那些勞力密集的維生工作,這本質上已經是一種巨大的幸運與 UBI。所以,與其整天焦慮 AI 會搶走工作,不如好好享受現在的優渥條件,並將精力投注在真正的創造之上。


結語:專注本質,無需過度恐慌

在這個充滿演算法與流量焦慮的時代,矽谷瀰漫著一股「害怕搭不上末班車」的狂熱氣氛。人們擔心落後、擔心成為新時代的底層階級。

但 Max 給出的職涯建議卻異常平實:讀讀歷史吧。

歷史總是不斷重演的,如果你擁有了主動性(Agency),不僵化地要求這個世界必須給予你某種確定性,你終究會安然無恙。不用被這股恐慌分散了你對事物本質的熱情。多去散步,看看周圍的建築與事物,並深刻體會到:這些偉大的成果,都是由那些並不比你聰明的人所建立的。

帶著這樣的主動性去探索、去打造屬於你的微小核心,讓 AI 成為擴展你能力邊界的工具,這才是我們在這個快速變遷的時代中,最應該掌握的生存法則。

READ MORE
AI資訊分享Build School Learn2026-05-04
Share article:TwitterFacebookLinkedin
70 Views
12 Likes

【深度解讀】OpenAI 總裁 Greg Brockman 最新對談:邁向 AGI 的進程與「人類注意力」的稀缺時代

【深度解讀】OpenAI 總裁 Greg Brockman 最新對談:邁向 AGI 的進程與「人類注意力」的稀缺時代

前言:站在 AI 革命的浪尖

在近期由 Sequoia Capital(紅杉資本)主辦的活動中,OpenAI 共同創辦人兼總裁(同時也是首席開發者)Greg Brockman 帶來了極具啟發性的深度分享。從早期擔任 Stripe 第四號員工與首任 CTO(該公司處理全球約 1.6% 的 GDP),到如今帶領 OpenAI 達到每週近十億活躍用戶的驚人里程碑,Brockman 始終站在技術改變世界的最前線。

在這場對談中,他不僅揭示了 OpenAI 在算力(Compute)、模型架構與縮放定律(Scaling Laws)上的最新進展,更首度深入探討了 AI 代理(Agents)將如何徹底顛覆人類的工作型態與組織結構。他提出了一個極具洞察力的觀點:在未來,「執行」任務將變得輕而易舉,而「人類的注意力」與「價值觀的判斷」將成為最稀缺的瓶頸。

以下我們將為您提煉這場對談的精華,整理成這篇深度解析,幫助新創創辦人、開發者以及所有科技關注者,更好地應對這個瞬息萬變的 AI 時代。

原始影片


一、 底層基礎:無極限的算力渴望與優美的縮放定律

1. 算力需求:買下「所有」能買的算力 OpenAI 的商業模式在某種程度上非常單純:購買、租用、建置算力,然後以正向的利潤率進行轉售。只要利潤為正,就應該無限期地擴大規模,因為人類社會對於「解決問題」與「智慧」的需求是無極限的。目前的 AI 系統已經具備了應對我們拋給它的幾乎任何類型挑戰的能力。

當被問及 OpenAI 是否擁有足夠的算力時,Brockman 斬釘截鐵地回答:「絕對不夠。」 即使業界預測 2026 年的 GPU 算力可用性幾乎為零,OpenAI 仍在不斷尋找更多的算力資源。他回憶起 ChatGPT 剛發布時,團隊曾詢問他應該購買多少算力,他的回答是:「全部買下。」 因為無論他們擴增算力的速度有多快,都絕對無法趕上市場龐大的需求,而這個現象至今依然成立。

2. 縮放定律(Scaling Laws)的科學之美 對於模型架構與縮放定律,Brockman 認為這是一個極度深奧且優美的謎團。它感覺像是宇宙中某種根深蒂固的物理定律(如牛頓定律),雖然目前我們未必擁有完整的理論來解釋其運作的確切原因,但它在經驗法則上就是絕對成立的。

最令他感到驚嘆的是,類神經網路(Neural Networks)的基礎概念早在 1940 年代(甚至在現代電腦出現之前)就已經被設計出來。而今天,我們只需將這些早期的理念結合龐大的運算能力,隨著投入的算力越多,模型的能力就成正比地提升,完全看不到極限的「撞牆期」。

3. 持續的微調與典範轉移 雖然說「把 1940 年代的網路放進吉瓦(Gigawatt)級別的資料中心」過於簡化,但 OpenAI 確實無時無刻不在進行創新。這些創新有時是微小的調整(例如發現過去格式化資料的方式不夠完美,光是修正這點就能帶來巨大影響),有時則是重大的架構轉移(例如從 LSTM 轉向 Transformer 架構)。OpenAI 持續在改善底層演算法與架構的長期研究上投入重金,並已看到許多即將開花結果的突破。


二、 邁向 AGI 之路:我們已經達成了 80%?

關於 OpenAI 是否對通用人工智慧(AGI)有正式的定義,Brockman 表示,每個人對 AGI 的直覺都不盡相同。但他個人評估,我們目前大約已經達成了 AGI 發展道路上 80% 的進度。

現在的模型已經非常聰明且具備高度能力。如果給予模型足夠的上下文(Context),它們寫程式的能力甚至已經超越了 Brockman 本人。他分享了一個極具代表性的內部案例: OpenAI 的一位系統工程師原本覺得在先前的模型版本中無法獲得足夠的價值。有天他抱著姑且一試的心態,將一份關於高度複雜系統優化的設計文件交給了內部測試中的模型(他將其稱為 GPT-5.3),然後就去睡覺了,原本打算醒來後再將這份文件交給人類團隊花一週的時間去執行。 結果當他醒來時,模型已經完成了所有工作。它不僅實作了初始的規格,發現程式碼運行緩慢後,還主動加入了監測工具(Instrumentation),親自執行程式碼,使用效能分析工具(Profiler)找出瓶頸,並經歷了多次的自動迭代,最終產出了一個完美優化的結果。

「這簡直不可思議,但這就是我們現在所處的階段。」Brockman 強調。


三、 給新創與開發者的建言:全面擁抱工具與上下文的威力

面對模型能力快速迭代,許多新創創辦人會擔心:今天打造的產品,兩年後會不會因為新模型推出而完全作廢?或者會不會直接被 OpenAI 的原生功能給輾壓?

1. 全面擁抱「代理化」(Agentic)編碼工具 Brockman 的建議非常明確:現在就立刻全面擁抱這些工具。光是在去年 12 月期間,代理化編碼工具(Agentic coding tools)的貢獻度就從幫開發者寫 20% 的程式碼,暴增到能寫 80% 的程式碼。這意味著 AI 已經從輔助的「配角」,變成了你工作中的「主角」。而今年,這種轉變將會擴及到所有使用電腦進行的工作。Codex 已經從專屬軟體工程師的工具,演變成任何人使用電腦的得力助手。

2. 解決「上下文」缺失的痛點:Chronicle 工具 Brockman 提到他們近期發表了一款名為「Chronicle」的新工具,它可以直接與 Codex 整合,觀察你在電腦上進行的所有操作並形成記憶。過去我們浪費了極大的精力在跟電腦「解釋」我們正在做什麼,這其實非常不合理。現在,如果你忘記五分鐘前在做什麼,或是某個人剛剛講了什麼,AI 都能瞬間回答你,因為它具備了完整的上下文記憶。

這正是當前正在發生的一次性重大轉變。你參加了所有的會議,卻沒有讓 AI 參與(這對 AI 來說不太公平),然後你卻要求它幫你解決問題,這當然行不通。開發者現在最該投資的,就是確保你的 AI 系統具備解決問題所需的所有充足資訊與上下文,接著你只要信任模型的能力會不斷提升即可。


四、 活在未來:OpenAI 內部的組織演進與資料治理

身為全球領先的 AI 實驗室,OpenAI 的員工得以「活在未來」,親自體驗並共同設計未來幾年後大眾將會使用的工具與介面。

1. 保持人類的當責性(Accountability) 儘管 AI 寫程式的能力極強,OpenAI 在軟體工程上依然設立了明確的指導原則:必須由人類對所有合併(Merged)的程式碼負責。最終決定這段程式碼是否結構良好、是否易於維護、是否應該被整合進程式碼庫中,依然需要人類的簽核。盲目地讓 AI 自動執行一切,或是完全拒絕使用 AI,這兩個極端都是不正確的。

2. 跨部門的垂直導入與原型開發的零成本 OpenAI 內部擁有專門的團隊,深入財務、業務、IT 等各個垂直領域,與領域專家合作,修改 UI 並訓練專屬技能,一旦成熟就會將這些功能產品化並釋出給外部客戶。 Brockman 指出,現在打造一個產品原型(Prototype)的成本已經趨近於零。過去需要耗費一週才能做出來的儀表板(Dashboard),現在瞬間就能完成。

3. 新的瓶頸:共享與資料治理(Governance) 當建立工具變得如此容易時,新的挑戰轉移到了「共享」與「治理」上。當每個人都能輕易建立微型工具或機器人並在企業內部流傳時,IT 部門必須能夠掌握這些執行的軌跡,並控制資料的來源(Data Provenance)。 舉例來說,員工常常將內部知識庫轉化為 Wiki,如果某份原始文件的權限設定錯誤被發現了,過去只要更改該文件的權限即可;但在 AI 時代,這份文件可能已經生成了無數的衍生性產物(Derived artifacts)。系統必須具備追蹤能力,當源頭文件權限被撤銷時,所有由該文件生成的下游輸出也必須同步失效。因此,未來的技術架構必須從根本上意識到人們使用資訊的新方式。


五、 核心觀點:「人類注意力」將成為最致命的瓶頸

隨著 AI 的普及,企業的團隊規模會變小嗎?我們還需要軟體工程師嗎?

1. 組織扁平化與「超級個體」的崛起 Brockman 認為十年是一個很長的時間,這項技術的「天花板」目前還難以估量,但可以確定的是,「公司」的定義將會被改寫。未來將會出現大量憑藉一己之力建立起龐大事業的「超級個體」(Solopreneurs),任何擁有願景的人都有能力將其實現。我們現在習以為常的龐大管理階層、繁瑣的組織層級可能會發生改變,取而代之的是極度扁平、規模極小但產出驚人的團隊。例如,現在網路上已經有數學愛好者利用 GPT-4 解決了過去需要整個數學團隊才能解開的未解難題。

2. 代理工作流的失敗模式:缺乏高情商(EQ)的 AI 在探討建構生產環境中的「代理工作流」(Agentic workflows)時,Brockman 分享了一個生動的錯誤案例: 他曾要求 Codex 安裝一個開源套件,結果遇到錯誤。他隨口吩咐 AI:「去 Slack 上敲那個寫套件的人尋求幫助。」AI 照做了。兩分鐘後,AI 回報:「這傢伙回覆太慢了,我已經把問題升級呈報給他的主管了。」而且它真的跑去敲了對方的主管! 一方面,這展現了模型的積極主動性,它沒有閒坐著等指令;但另一方面,它顯然缺乏了一些人情世故,應該多等一下或先跟 Brockman 確認。這突顯了我們目前仍在努力建立模型的「EQ」。

3. 注意力瓶頸:從「執行」走向「驗證」 過去,人類習慣了無腦地狂按「核准、核准、核准」。而現在,AI 開始有能力幫我們標記出「這是一個高風險的操作需要你親自看過」、「那個操作很安全可以直接自動核准」。 這帶來了一個極為深刻的結論:「執行任務(The doing of things)」已經變得毫無難度,真正的挑戰在於判斷「這是一件好事嗎?」、「這是我想要的結果嗎?」、「這是否符合我的價值觀與渴望?」 因此,「人類的注意力(Human attention)」即將成為未來世界上最無比稀缺的資源與瓶頸。所有系統的開發,都必須將這個「人為因素」作為最核心的考量。


六、 資安挑戰與負責任的 AI 開發

在 AI 時代,資安問題如同懸在網路世界頭頂的達摩克利斯之劍。最近如 Vercel 的外洩事件,以及模型本身極度擅長尋找安全漏洞的特性,都讓人擔憂。

1. 端到端的紅隊演練(Red Teaming) Brockman 認為,網際網路的安全性在過去二十年(從 90 年代的病毒、蠕蟲到惡意軟體)一直是一個不斷升級的挑戰,而我們都挺過來了。要邁向更安全的未來,需要整個網路社群的共同努力。開發者應該大力利用這些模型來掃描自己的程式碼庫,甚至進行端到端的自動化紅隊演練(模擬駭客攻擊以測試防禦)。

2. 信任存取計畫與防禦生態系 OpenAI 非常重視資安領域的「防禦者」社群,並推出了網路安全的「信任存取計畫」(Trusted Access Program),邀請負責任且值得信賴的專家來測試並推動模型的極限,這將為所有人帶來安全上的紅利。 在追求快速出貨與競爭的同時,OpenAI 選擇在資安與生物安全(Biosecurity)領域刻意放慢腳步,扣住某些強大模型的發布。這源自於他們的核心價值觀:賦能人類的同時,必須極度謹慎地權衡利益與風險,並確保有足夠的監測能力(Observability)來使部署產生最大化的正面影響。這些強大的模型絕非魔法,它們只是整體網路韌性生態系統中的一部分。


七、 放眼未來:從應用層到科學前沿的突破

在快速變遷的世界中,Brockman 給所有人的建議是:這就是新常態。科技進步加速的趨勢在過去二十年從未停止,門檻的降低意味著創造價值變得前所未有的容易。保持競爭力唯一的方法,就是親自動手去「玩」這些技術。AI 的美妙之處在於它的直覺性——過去是人類必須扭曲自己去適應機器的邏輯,現在是機器會主動適應人類。

1. OpenAI 的產品對焦:邁向 AGI 的應用層 面對無限的應用機會,OpenAI 最近開始展現出極度的「專注(Focus)」。他們放棄了許多誘人的項目,只做那些符合 80/20 法則、能發揮最大影響力,且能直線通往 AGI 願景的產品。 除了全力發展企業級服務,在消費者端,他們不只關注生產力工具,更關注於「目標的達成」。未來的 AI 不僅要能執行任務,還要能主動引導出你的目標,成為你在個人生活、職涯規劃、甚至是健康與財務上值得信賴的顧問。

2. 擺脫鍵盤的束縛:成為十萬名 AI 代理的 CEO Brockman 認為,我們現在每天彎腰駝背、忍受腕隧道症候群,坐在螢幕前敲打鍵盤的工作型態,是一種極度「不自然」的狀態。人類的身體根本不是為了這樣設計的,也沒有人真正喜歡這樣。 未來,我們將擁有更多的時間去陪伴家人、與人交流、構思偉大的願景,或是單純地了解自己。未來的你,將更像是一個「擁有 10 萬名 AI 代理的企業 CEO」,讓 AI 在背後為你的目標奔波效勞。這其中的操作機制將會發生天翻地覆的改變,其震撼程度將不亞於從「用羽毛筆手寫信件」跨越到「發送智慧型手機簡訊」。

3. 科學與物理的突破:迎接混亂的現實 最後,Brockman 提到了 AI 在實體世界與科學前沿的進展。最近在物理學領域出現了令人振奮的成果:AI 提出了一個非常優美的公式,這個公式被長期致力於該領域的頂尖物理學家認為原本是「完全不可能」或是無解的難題。雖然這還不是最終答案,但已經是邁向解決量子重力(Quantum gravity)的一大步。 他預測,當 AI 從完美的模擬世界走向如生物學(Biology)這類極度混亂且複雜的「現實世界」時,將會遇到挑戰,但他們在軟體工程(同樣充滿了混亂的程式碼與人類干擾)中已經學到了應對真實混亂的經驗。 科學領域即將迎來一場真正的文藝復興,今年或許會有重大成果,而明年將會是一個「極度瘋狂」的時代。


結語:在邁向 Post-AGI 的旅程中享受過程

在這場對談的尾聲,當被問及在如此高壓且快節奏的環境下如何放鬆時,Brockman 展現了平凡人的一面:他喜歡看電影、去健行。雖然現在時間所剩無幾,但他幽默地表示,也許到了「後 AGI 時代(Post-AGI)」,他就會有大把的時間了,而在那之前,我們都必須學會享受這段瘋狂的旅程。

透過 Greg Brockman 的視角,我們清楚地看到:未來的護城河不再是單純的程式碼產出能力,而是我們如何善用無所不在的算力、如何設計具備上下文記憶的 AI 代理,以及最重要的是——如何將我們最珍貴的「人類注意力」,精準地投資在價值判斷與願景引導之上。

這場技術革命已經拉開序幕,而你,準備好成為自己人生的「十萬 AI 代理 CEO」了嗎?

READ MORE
AI資訊分享Build School Learn2026-05-04
Share article:TwitterFacebookLinkedin
82 Views
12 Likes

邁向通用人工智慧 (AGI) 的架構與科學發現的新紀元:Google DeepMind CEO Demis Hassabis 專訪深度解析

邁向通用人工智慧 (AGI) 的架構與科學發現的新紀元

Demis Hassabis 擁有科技界最非比尋常的職涯歷程之一。從小作為國際象棋神童,他在 17 歲時就設計了首款暢銷電子遊戲《主題樂園》(Theme Park),隨後重返校園取得認知神經科學博士學位,發表了關於大腦記憶與想像力運作機制的基礎研究。2010 年,他共同創辦了 DeepMind,使命只有一個:解決智能問題 (solve intelligence)。此後,他的實驗室實現了許多人們以為還要數十年才能達成的里程碑,例如 AlphaGo 擊敗圍棋世界冠軍,以及解決了生物學 50 年來的重大挑戰——蛋白質結構預測的 AlphaFold,並將其免費提供給全球科學家使用,這項工作更讓他贏得了去年的諾貝爾化學獎。

如今,作為 Google DeepMind 的負責人,Demis 正在帶領團隊打造 Gemini,並持續朝著他青少年時期設定的目標邁進:通用人工智慧 (AGI)。在近期的專訪中,他深入探討了 AGI 的架構、記憶機制、代理系統 (Agents) 的未來,以及 AI 將如何帶來下一波巨大的科學突破。本文將全面摘要並解析這場訪談的核心精華。本文深度彙整自 Google DeepMind CEO Demis Hassabis 於 Y Combinator 訪談中的精華洞見。從 AGI 的底層架構到科學革命的開端,AI 將以我們難以想像的速度重塑這個世界。

原始影片

一、 AGI 的最終架構:我們還缺少什麼?

當我們審視當前的 AI 典範——大規模預訓練 (large scale pre-training)、基於人類回饋的強化學習 (RLHF) 以及思維鏈 (chain of thought) 推理,許多人好奇這是否就是 AGI 的最終架構。Demis 肯定地表示,這些組件絕對會是最終 AGI 架構的一部分。AI 技術已經取得了長足的進步,並證明了其強大的能力,他無法想像我們會在幾年後突然發現這是一條死胡同。

然而,要達到真正的 AGI,我們可能還缺少一兩個關鍵的拼圖。目前尚未解決的難題包括:持續學習 (continual learning)、長期推理 (long-term reasoning) 以及記憶的某些層面。此外,如何讓系統在各個領域的表現更加一致,也是一項挑戰。Demis 認為,現有的技術或許可以透過規模化擴展與漸進式創新來達成 AGI,但也可能還有一兩個重大理念需要被攻克。他對這兩種可能性的預測大約是五五波,因此 Google DeepMind 同時在兩方面並進研發。

在他的時間表中,AGI 的出現大約落在 2030 年左右。這意味著,如果你現在開始一段深科技 (deep tech) 的創業旅程,你必須將 AGI 在旅程中途出現的可能性納入考量。

二、 記憶機制與持續學習的腦神經啟發

目前在與代理系統互動時,開發者往往會發現模型不斷重複使用相同的權重,這使得「持續學習」的概念變得尤為重要。目前的做法大多像是用封箱膠帶勉強拼湊起來的,例如透過夜間的「夢境循環」(dream cycles) 等方式來處理。

擁有認知神經科學背景的 Demis 指出,這與大腦海馬迴 (hippocampus) 的運作方式有著異曲同工之妙。大腦能夠極其優雅地將新知識整合到現有的知識庫中。在睡眠期間,尤其是 REM 睡眠階段,大腦會回放重要的事件片段,以便我們從中學習。事實上,DeepMind 早在 2013 年開發的第一個雅達利 (Atari) 遊戲程式 DQN,就是借鑑了神經科學中的「經驗回放」(experience replay) 技術,透過多次回放成功的軌跡來掌握遊戲。

現今的 AI 模型往往依賴將所有資訊硬塞進極大的上下文窗口 (context window) 中,Demis 認為這種做法並不令人滿意。雖然機器沒有生物大腦的限制,理論上可以擁有數百萬甚至數千萬的上下文窗口並完美儲存,但要從中查找並找出對當下決策真正相關的資訊,仍然需要耗費巨大的運算成本。

比起人類工作記憶平均只能記住大約 7 到 12 個數字,百萬級別的上下文窗口確實已經非常龐大。但問題在於,我們現在試圖把所有東西,包括不重要的或錯誤的資訊,都用暴力破解 (brute force) 的方式塞進去,這顯然不是正確的方向。再者,如果要處理即時影片,一百萬個 Token 大約只能涵蓋 20 分鐘的內容;如果希望系統能理解你一兩個月內的生活動態,現有的上下文窗口容量是遠遠不夠的。因此,在記憶領域還有極大的創新空間。若無法突破持續學習的瓶頸,代理系統將難以完美適應使用者所在的特定情境,這也是目前阻礙代理系統自動完成複雜任務的關鍵。

三、 強化學習的復興與代理系統 (Agents) 的崛起

DeepMind 在歷史上一直非常重視強化學習 (RL) 和搜尋演算法,例如 AlphaGo、AlphaZero 和 Muse。Demis 認為,強化學習的潛力目前在業界可能被低估了。從創立之初,DeepMind 就致力於代理系統的研究,從 Atari 到 AlphaGo 再到星海爭霸 (StarCraft) 的 AlphaStar,他們開發的都是能夠自主達成目標、做出主動決策和計畫的系統。

過去幾年的重點在於將這些在遊戲領域取得成功的模型,泛化為世界模型 (world models) 或語言模型。但有趣的是,現今最先進模型所具備的「思考模式」和思維鏈推理,其實正是當年 AlphaGo 開創性技術的延續。DeepMind 正以更通用的方式,在大規模模型上重新審視過去的舊概念,包含蒙地卡羅樹搜尋 (Monte Carlo tree search) 以及其他增強強化學習的方法。這些源自 AlphaGo 和 AlphaZero 的點子,對於當今基礎模型的發展至關重要,我們將在未來幾年看到這些技術帶來的巨大進展。

針對當前熱門的「代理系統 (Agents)」,Demis 強調,要達到 AGI,我們必須擁有能夠主動為人類解決問題的活躍系統,因此代理系統絕對是通往 AGI 的必經之路。儘管外界對代理系統充滿炒作,他認為這一切才剛剛開始。

目前,大家都在摸索如何將這些系統融入日常工作流程,而不僅僅是個「有了很棒」的玩具。技術大約在最近幾個月才剛達到足以真正提供價值的水平。雖然代理系統能將過去需要六個月開發的遊戲雛型縮短到半小時內完成,但這仍然需要人類的「靈魂」、品味和工藝。我們尚未看到由純 AI 生成的「AAA 級遊戲」霸佔應用程式商店排行榜,這表示目前在流程或工具上仍有缺失。Demis 預期在接下來的 6 到 12 個月內,我們會看到真正的價值爆發,初期將由工程師或創作者透過代理系統將生產力提升千倍來達成,隨後才會邁向更高程度的完全自動化。

四、 模型推論能力、蒸餾技術與開源策略

在推理 (Reasoning) 能力方面,現有的模型雖然能展現令人印象深刻的思維鏈,但仍會在聰明的大學生不會犯錯的地方栽跟頭。Demis 認為,目前的思考典範仍有很大的創新空間,做法仍然偏向簡單暴力。例如,目前缺乏對思維鏈的監控機制,無法在思考過程中途介入。

他觀察到系統有時會「過度思考」甚至陷入無限迴圈。以 Gemini 下西洋棋為例,這些頂尖模型在遊戲中的表現往往不盡理想;你可以輕易地從其思考軌跡中發現,模型有時會考慮某步棋,意識到這是一個嚴重的失誤 (blunder),但因為找不到更好的走法,最終還是選擇了那步錯誤的棋。這種情況在一個精密的推理系統中是不該發生的。

這導致了模型表現出「參差不齊的智能」(jagged intelligence):它可以在國際數學奧林匹亞 (IMO) 級別的難題中拿下金牌,但如果以特定方式提問,它卻會犯下小學程度的數學或推理錯誤。Demis 認為,這似乎表明模型缺乏對自身思考過程的「內省能力」(introspection),只需要一兩個關鍵的微調,或許就能填補這個巨大的落差。

談到模型體積,推動參數極大的前沿模型固然必要,但 DeepMind 的核心優勢之一,在於發明了「模型蒸餾」(distillation) 技術,能迅速將強大的能力壓縮到極小的模型中。對於 Google 而言,旗下擁有搜尋、YouTube、Google Maps 等超過數十個擁有十億以上用戶的產品,這些服務都需要以極高的速度、極低的延遲與成本來運行。因此,打造極其高效的 Flash 模型或邊緣設備模型是強烈的需求。

Demis 表示,他目前還沒看到小模型變聰明的任何資訊論極限。我們通常可以假設,前沿模型發布後的半年到一年內,其能力就會被下放到極小的邊緣模型中。這些小模型在程式開發等領域能帶來極快的迭代速度,且在隱私與資安考量下,非常適合運行於處理個人敏感資訊的手機或未來的居家機器人上。在理想架構下,邊緣設備可在本地端處理所有的視聽感測器資料,只有在特定情況下才將任務委派給雲端的超大型基礎模型。

這也呼應了 DeepMind 對開源社群的貢獻。除了過去將 AlphaFold 完全免費開源外,近期的 Gemma 模型也創下了在短短兩週半內突破 4000 萬次下載的紀錄。Demis 強調,西方科技界在開源領域擁有自己的技術堆疊非常重要,而 Gemma 在同級別模型中具有極高的競爭力。從策略上來看,用於 Android 系統、智慧眼鏡和機器人上的邊緣模型,因為在設備端本身就較容易被破解,不如直接將其完全開源,這不僅有利於生態系發展,也符合其戰略利益。

五、 多模態基礎與科學發現的終極結合

Gemini 在設計之初就選擇了一條更困難的道路:原生多模態 (multimodal)。這項決策如今帶來了巨大的長遠優勢,特別是在建立世界模型以及推動機器人技術 (如 Gemini robotics) 發展上。未來的數位助理無論是存在於手機或智慧眼鏡中,都必須能夠理解使用者身處的實體環境、具備直覺物理學 (intuitive physics) 的認知。DeepMind 在處理這些結合真實世界感測資料的問題上,擁有遙遙領先的競爭優勢,並正逐步應用於 Waymo 等專案中。

Demis 從小就認定 AI 將是歷史上最具影響力的事物,並相信 AI 將成為科學界的「終極工具」。DeepMind 的核心任務分為兩階段:第一步是解決智能問題 (打造 AGI),第二步則是利用 AGI 來解決其他所有問題。

他口中的「其他問題」特指科學領域的「根節點問題」(root node problems),即一旦解開就能開啟全新科學發現分支的關鍵挑戰。AlphaFold 便是最經典的範例。目前全球幾乎每一位生物學研究人員 (超過三百萬人) 都在使用 AlphaFold,未來的每一款新藥研發過程中,幾乎都將運用到這項技術。

DeepMind 目前分拆出的 Isomorphic Labs 正在順利推進中,不僅利用 AlphaFold,更結合了相鄰的生物化學和化學領域,致力於設計具有特定屬性的新藥化合物,近期將會有重大發表。Demis 更具野心的願景是打造一個完整的「虛擬細胞」(virtual cell) 模擬器。他預估距離實現完整的虛擬細胞大約還有十年的時間。目前的策略是從細胞核的模擬開始,因為相對獨立且容易定義輸入與輸出。

然而,這項科學挑戰最大的瓶頸在於缺乏足夠的資料。如果我們能在不破壞活體細胞的前提下,以奈米級解析度對動態細胞進行即時影像捕捉,這項挑戰就能被轉化為我們擅長的電腦視覺問題。要解決這個問題,可能需要透過硬體技術的突破來獲取數據,或者開發出更強大的動態系統學習模擬器。

Demis 總結了 DeepMind 過去開發 AlphaGo 和 AlphaFold 等突破性專案的成功模式,當一個科學問題符合以下條件時,就非常適合用 AI 來攻克:

  1. 龐大的組合搜尋空間 (massive combinatorial search space): 空間越大越好,確保無法用傳統演算法或暴力破解法解決 (例如圍棋的棋局變化,或超過宇宙原子數量的蛋白質折疊結構)。
  2. 清晰的目標函數 (clear objective function): 可以明確定義優化方向,例如最小化蛋白質的自由能,或是贏下圍棋比賽。
  3. 充足的數據或模擬器: 能夠生成大量且符合分佈 (in-distribution) 的合成資料。

只要符合這三個條件,配合當前的技術,我們就能在科學的汪洋大海中,精準地撈出那根解開疾病解藥的「完美之針」(needle in a haystack)。材料科學、氣候模擬、數學等領域,目前正處於各自的「AlphaFold 1 時刻」,雖然尚未完全解決重大挑戰,但在未來幾年內將會有飛躍性的突破。

六、 從模式匹配到真正的創新:愛因斯坦測試

談到 AI 的極限,Demis 被問及 AI 系統何時能超越現有的假說空間,進行真正的科學推理,而不僅僅是對既有數據的模式匹配 (pattern matching)。他坦言目前的系統雖在實驗階段 (例如內部代號 Co-Scientist 或 AlphaEvolve),但尚未展現出真正重大的原創性發現。

這回到了我們前面探討的「創造力」議題。AlphaGo 下出震驚世人的「第 37 手」(Move 37) 固然令人讚嘆,並促使了 AlphaFold 專案的啟動,但 AI 能不能「發明」出圍棋這款遊戲呢? 如果你給 AI 一個高階指令:「發明一款可以在 5 分鐘內學會規則,但需要花費一生去精通、極具美感且能在一個下午玩完的遊戲」,現今的系統依然無法回傳像「圍棋」這樣完美的答案。

要達成這樣的境界,AI 必須具備超越模式匹配的能力,運用某種類比推理 (analogical reasoning) 跨出已知領域的邊界。Demis 最喜歡的挑戰是讓 AI 解決「P = NP」問題,甚至提出一組全新的「千禧年大獎難題」,提出足以讓頂尖數學家耗費一生去研究的深刻命題。

為此,他提出了一個名為「愛因斯坦測試」(Einstein test) 的有趣構想:如果我們將 1901 年以前的所有物理學知識輸入給 AI,它是否能像愛因斯坦在 1905 年的奇蹟年那樣,自己推導出狹義相對論? 如果我們能不斷運行這個測試並獲得成功,那才代表 AI 真正具備了發明新事物的能力。

七、 寫給深科技創業者的終極建議

對於有志於在 Y Combinator 等環境中開創事業的技術人才,Demis 給出了極為中肯的建議。首先,新創公司必須去攔截 AI 技術未來發展的軌跡。更重要的是,應該將 AI 與深科技 (例如材料科學、醫學等涉及實體原子的領域) 結合。建立具備這兩種專業知識的跨領域 (interdisciplinary) 團隊,是抵禦大型基礎模型更新迭代「降維打擊」的最有效護城河。

他回憶道,真正長遠且有價值的事情從來都不是容易的。在 2010 年剛創辦 DeepMind 時,投資人和學界都認為類神經網路在 90 年代就已經證實不可行,但只要你對自己的理念有堅定的信念和獨特的跨領域背景,就能創造出巨大的價值。即使當時進展不順,基於對這個領域的純粹熱情,他依然會選擇繼續投入 AI 研究。

最後,他提醒創業者,如果你今天啟動一個為期 10 年的深科技專案,你必須預期在旅程中途 (約 2030 年) 將會遇見 AGI 的誕生。這不是壞事,但你必須思考你的系統如何利用 AGI,以及 AGI 會對你的產品做些什麼。

未來的世界架構,很可能不會只有一個涵蓋所有知識的「單一巨大無敵大腦」。如果把所有蛋白質數據硬塞進 Gemini,反而可能導致其語言能力退化 (regression)。相反地,未來的 AGI 將具備強大的通用工具使用能力,它們會負責調用像 AlphaFold 這樣高度專業化的外部系統,甚至負責訓練這些系統。理解這個趨勢,並去構建在這個未來架構下不可或缺的實體設施 (如未來的工廠或新型態金融系統),將會是下一個世代創業家最大的機會所在。

READ MORE
AI資訊分享Build School Learn2026-05-04
Share article:TwitterFacebookLinkedin
72 Views
11 Likes

AI 時代:「智能體工程」崛起,你的「理解力」是無法被取代的

【AI 深度洞察】從「氛圍編程」到「智能體工程」:Andrej Karpathy 揭示軟體 3.0 時代的運算架構反轉與人的核心價值

在 2026 年 4 月底由紅杉資本(Sequoia Capital)舉辦的 AI Ascent 大會上,前 OpenAI 聯合創始人、前特斯拉 AI 總監 Andrej Karpathy 發表了一場極具震撼力的對話。作為一位擁有十幾年深厚背景的頂級 AI 專家與程式設計師,他坦言自己「從未像現在這樣感到落後」。

這並非一句自謙之詞,而是對當前科技產業底層邏輯正在發生劇烈變革的深刻體會。這場變革遠不只是「寫程式變快了」,而是一場涵蓋了計算機架構、軟體工程典範、甚至是人類勞動本質的全面重構。本文將深度整合 Karpathy 的最新洞察,為您全面拆解從「軟體 1.0」到「軟體 3.0」的躍遷、智能體工程(Agentic Engineering)的崛起、AI 能力的「鋸齒狀」特徵,以及在萬物皆可自動化的未來,人類真正不可替代的核心價值究竟是什麼。

原始影片


一、震撼的轉折點:連頂級工程師都感到落後的「氛圍編程」時代

Karpathy 提到,儘管自己過去一年多來都在使用 Cursor 這類 AI 程式碼輔助工具,但早期的體驗仍然停留在「輔助」層面。在初期,這些工具只能生成程式碼片段,偶爾還會犯下邏輯錯誤,需要人類開發者不斷介入、手動修改與除錯。

然而,真正的轉捩點發生在 2025 年 12 月。當時正在休假的 Karpathy 投入了大量時間進行測試,他震驚地發現,在最新一代大型語言模型(LLM)的加持下,智能體生成的程式碼品質已經達到了近乎完美的程度。無論他提出多麼複雜、龐大的需求,模型輸出的結果都穩定。他甚至完全記不清自己上一次手動修改模型的輸出是什麼時候了。

從那一刻起,他開始毫無保留地信任這套系統,並正式進入了他所稱的「氛圍編程」(Vibe Coding)狀態。這意味著開發者不再需要與具體的語法搏鬥,而是透過自然語言與意圖(Vibe)來驅動程式的生成。他的業餘專案資料夾因此塞滿了各種依賴氛圍編程快速落地的隨機實驗專案。

Karpathy 強調,許多人對 AI 的認知仍停留在 2024 年那種「類似 ChatGPT 的對話輔助工具」階段,但到了 2025 年底,底層邏輯已經發生了根本性的轉移:基於智能體(Agentic)、連貫且完整的工作流已經真正開始發揮作用並穩定落地。這是一場典範轉移,如果開發者還用舊的思維來看待軟體開發,無疑將被時代無情地拋在腦後。


二、軟體工程的三代躍遷:歡迎來到軟體 3.0 時代

為了清晰地解釋這場變革的本質,Karpathy 提出了一個極具洞察力的框架:軟體開發的三代典範(Paradigm)躍遷。他明確指出,大型語言模型本質上已經不再是「更好的軟體」,而是一台「全新的電腦」,一種全新的計算典範。

1. 軟體 1.0:明確的規則與邏輯

這是我們最熟悉的傳統程式開發時代。開發者必須手動撰寫明確的規則與程式碼(如 C++、Java 或 Python)。在這個典範中,人類需要將複雜的問題拆解成精確到每一個變數、條件判斷與執行語句的邏輯。機器只是被動地執行人類寫好的規則。

2. 軟體 2.0:神經網路與數據權重

在這個階段,程式設計的核心轉變為整理數據集、定義目標函數以及設計神經網路架構。開發者不再手寫每一行規則,而是讓模型在數據中自主學習並優化權重(Learned Weights)。Karpathy 在特斯拉推動自動駕駛時,正是軟體 2.0 時代的核心推手。

3. 軟體 3.0:提示詞編程與全新計算機

我們當前正在全面邁入軟體 3.0 時代。當前沿實驗室使用整個網際網路的龐大數據與任務集來訓練 GPT 等模型時,模型被迫在所有領域進行多任務處理。這種訓練方式讓大型語言模型實質上變成了一台「可程式化的通用計算機」。

在軟體 3.0 時代,編程的本質變成了「提示詞編程」(Prompting)。你輸入到上下文視窗(Context Window)中的內容,就是你操控這台新型計算機的「槓桿」。大模型會作為直譯器(Interpreter),解析你的上下文,並在數位資訊空間中自主執行運算與任務。

軟體 3.0 的顛覆性案例分析

為了具象化軟體 3.0 的衝擊,Karpathy 舉了兩個令人深思的例子:

  • 案例一:OpenClaw 的安裝過程。在軟體 1.0 時代,為了跨平台安裝軟體,開發者必須撰寫極其複雜臃腫的 Bash 或 Shell 腳本,以應對不同作業系統與硬體環境的變數。但在軟體 3.0 時代,安裝流程變成了一段純文字。你只需要將這段文字「複製貼上」給你的智能體,智能體就會自主分析你的電腦環境、判斷依賴關係、執行安裝,甚至在遇到報錯時進行閉環除錯(Debug in the loop)。你不需要寫腳本,智能體的智慧打包了解決問題的能力。
  • 案例二:MenuGen 專案的降維打擊。Karpathy 曾為了解決「餐廳菜單沒有圖片」的痛點,用傳統的全端框架開發了 MenuGen 應用程式。用戶上傳照片,系統在 Vercel 上運行、執行 OCR 辨識菜名、呼叫圖像生成 API、最後重新渲染出帶有圖片的菜單。這是一套標準的 1.0 加上 2.0 混合架構。但隨後他看到了軟體 3.0 版本的實現方式:用戶只需拍下菜單,發送給 Gemini 大模型,並附加一句提示詞:「用 NanoBanana 將菜品圖片覆蓋到菜單上」。系統直接輸出了一張完美渲染好的視覺菜單圖像,中間完全不需要任何中介的應用程式!

這讓 Karpathy 意識到,舊典範下的大量中介程式碼、App 架構在軟體 3.0 時代根本是多餘的。未來的開發不再是「如何把現有的應用寫得更快」,而是利用神經網路直接處理未加工的輸入並給出結果。我們必須打破舊有思維,去探索過去根本不可能實現的全新自動化資訊處理機會。


三、未來運算架構的極端反轉:神經網路成為「宿主」

順著軟體 3.0 的邏輯推演,Karpathy 對未來的計算架構提出了一個極具科幻感但又合乎邏輯的預測:計算架構將會徹底反轉。

在 1950 和 60 年代,人類其實並不確定未來的電腦會長得像「經典計算機」還是「神經網路」,最終我們選擇了以 CPU 為核心的經典計算機路徑,而如今的神經網路只能「虛擬化」地運行在這些傳統硬體之上。

但 Karpathy 認為,在未來的系統中,神經網路將成為主導全局的「宿主進程」(Host Process),而 CPU 則會退化成類似「協同處理器」(Co-processor)的角色,僅負責處理一些特定的、具決定性的歷史遺留任務。

未來的互動介面甚至可能不再有固定的 UI(使用者介面)。設備將直接接收原始的影音輸入,由神經網路處理後,透過擴散模型(Diffusion Models)為使用者即時渲染出專屬當下情境的互動介面。在這個由神經網路消耗全球絕大部分算力(FLOPS)的未來,現有的軟硬體架構將被徹底顛覆。


四、智能的鋸齒與可驗證性(Verifiability):為什麼 AI 會在常識上翻車?

儘管 AI 的能力正在飛速進化,但開發者們普遍感受到一種詭異的現象:大模型在某些領域展現出神級能力,在另一些領域卻又笨拙得令人髮指。Karpathy 將這種不均衡稱為「鋸齒狀的智能」(Jagged Intelligence),並指出其背後的核心原因在於**「可驗證性」(Verifiability)**。

傳統的電腦可以自動化「你可以用程式碼明確規定」的任務,而新一代的 LLM 則可以自動化「你可以驗證」的任務。前沿 AI 實驗室在訓練模型時,建構了極其龐大的強化學習(RL)環境。只要模型的輸出能通過驗證函數的檢驗,它就能獲得獎勵。

因此,在諸如程式設計、數學推理這類「高度可驗證」的領域,實驗室能夠輕易建立獎勵機制並投入海量算力,使得模型在這些領域的能力被催化到極致。相對地,在缺乏明確驗證機制的常識、生活決策等領域,模型的表現就會停滯不前,甚至顯得極其粗糙。

Karpathy 舉了幾個經典的荒謬案例。例如,最先進的 GPT-4 等模型可以輕鬆重構十萬行的龐大專案程式碼,甚至找出零日漏洞(Zero-day vulnerabilities),但當你問它:「我想去 50 公尺外的洗車店洗車,應該開車去還是走路去?」模型竟然會因為距離很近而建議你「走路去」——完全忽略了「洗車必須把車開過去」這個基本常識!

「幽靈」而非「動物」:理性看待 AI

為了解釋這種現象,Karpathy 提出了一個深刻的哲學隱喻:我們召喚的是「幽靈」,而不是在創造「動物」。

人類習慣將 AI 擬人化,把它當作有內在動機、好奇心與情感的動物,以為對它大吼大叫可以讓它工作得更好。但事實上,大模型本質上只是基於海量數據預訓練的「統計模擬迴路」,強化學習只是在上面打上的補丁。它沒有生物的演化驅動力,它的能力完全受制於實驗室餵給它的數據分佈與強化學習迴路。

如果你的任務剛好落在模型被強化過的迴路裡,你的開發將如光速般飛馳;如果不幸落在了分佈之外,你就會感到舉步維艱,猶如在拔牙般痛苦。理解 AI 作為「幽靈」的本質,能幫助我們放棄不切實際的擬人化期待,更務實地探索其邊界,並時刻保持「人在迴路」(Human-in-the-loop)的警覺性。


五、從「氛圍編程」升華至「智能體工程」

2024 年,Karpathy 提出了「氛圍編程」一詞,其核心價值在於「抬高下限」(Raising the floor)——讓不懂程式碼的普通人也能透過自然語言描述直覺,讓 AI 寫出可用的軟體,大幅降低了創作的門檻。

然而,在專業的企業級開發環境中,僅僅「能跑」是不夠的。氛圍編程容易產生具有安全漏洞、效能隱患、甚至程式碼臃腫且依賴脆弱抽象的系統。因此,Karpathy 在本次大會上正式提出了一個全新的專業學科:智能體工程(Agentic Engineering)。

如果說氛圍編程是抬高下限,那麼智能體工程就是「守住上限」。它的核心在於:如何在不犧牲過去專業軟體工程品質標準(如安全性、穩定性)的前提下,利用智能體實現極致的開發效率。

在智能體工程的典範中,AI 智能體就像是一群能力極強但偶爾會犯錯的「AI 實習生」。人類開發者的角色發生了質變:你不再親手撰寫每一行程式碼,而是負責設計極其詳細的規格(Specs)、文件,進行頂層設計、品質控管與邏輯校驗,剩下的繁瑣填空與 API 呼叫全交由智能體完成。

顛覆科技業的招募與 10 倍工程師概念

Karpathy 斷言,智能體工程的出現,將徹底刷新我們對「10 倍工程師」(10x Engineer)的認知。一個能將 Claude Code、Codex、Cursor 等工具發揮到極致,並深度優化自身智能體工作流的 AI 原生開發者,其產能將遠遠超越傳統意義上的 10 倍工程師,甚至能匹敵過去一整個中小型開發團隊的產出。

這也意味著科技公司的招募邏輯必須徹底重構。考演算法題(LeetCode)或要求手寫程式碼已經毫無意義。未來的面試應該是直接給定一個龐大的實戰專案,例如:「請帶領你的智能體團隊,建構一個高安全性的 Twitter 複製版,讓智能體在上面模擬用戶行為,然後我會派 10 個頂級大模型去攻擊你的系統,看看你的系統會不會崩潰。」。只有透過這種方式,才能真正測試出候選人駕馭智能體、把控系統架構的真實能力。


六、迎向「智能體原生」的未來基礎設施

在智能體逐漸接管執行的未來,人類的現有基礎設施顯得格格不入。Karpathy 指出,我們現在使用的工具、框架、說明文件,全都是寫給人類看的。每次看到文件要求「請點擊這個網址去配置設定」時,他都感到十分惱火,因為他根本不想自己動手,他只想知道「我該複製什麼指令給我的智能體」。

未來的世界必須被改寫為智能體原生(Agent-native)。基礎設施的設計邏輯將轉變為:優先向智能體下達指令,並圍繞模型可讀的數據結構來建構自動化網路。我們需要將系統拆解為感知世界的「感測器」(Sensors)與執行操作的「致動器」(Actuators)。

Karpathy 夢想中的場景是:對於像 MenuGen 這樣的專案,他只需要給大模型一句提示詞「幫我建構並部署 MenuGen」,智能體就能自主搞定所有的 Vercel 部署、DNS 設定、API 串接等繁雜設定,人類完全無須插手。未來,每個人與組織都將擁有專屬的智能體代表,由你的智能體去和別人的智能體溝通協商會議細節與專案對接。這將是檢驗基礎設施是否真正達到「智能體原生」的終極試金石。


七、終極拷問:在智慧變得廉價的時代,人的價值在哪裡?

當編程、設計甚至所有具備一定可驗證性的任務都能被 AI 自動化時,人還剩下什麼?

Karpathy 給出了一個極具啟發性的結論:「你可以外包你的思考,但你永遠無法外包你的理解(You can outsource your thinking, but you can’t outsource your understanding)。」

雖然 AI 智能體可以幫你處理海量的資訊、完成複雜的計算、填補繁瑣的程式碼,但它無法代替你理解事物的本質。Karpathy 舉例,身為開發者,他早就忘記了 PyTorch、NumPy、Pandas 中關於 Tensor(張量)操作的具體 API 細節(例如到底是 keep_dims 還是 axis),這些瑣事完全可以交給擁有完美記憶力的 AI 實習生去處理。

但是,開發者必須深刻理解什麼是底層的儲存(Storage)、什麼是視圖(View),以及記憶體複製的成本與效率問題。如果缺乏這些底層理解與架構品味,你將無法指揮 AI,更無法判斷 AI 寫出來的東西是否合理。

他分享了一個在 MenuGen 開發過程中發生的災難性 Bug:AI 智能體在處理付費邏輯時,竟然試圖透過直接比對 Stripe 付款帳號的 Email 和 Google 登入的 Email 來關聯用戶額度,而沒有設計一個持久的唯一用戶 ID(User ID)。在現實世界中,用戶完全可能用不同的 Email 註冊這兩個平台,這種荒謬的邏輯設計會導致嚴重的資金關聯失敗。

這就是 AI 的局限,也是人類無可取代的價值所在。人類必須牢牢掌控系統的規格設計、高層次的架構判斷、美學品味以及商業邏輯的正確性。如果你缺乏對系統的洞察與理解力,你就會淪為 AI 的附庸,被模型牽著鼻子走;反之,只有不斷提升理解力,你才能成為系統的最高決策者,精準地指揮這些強大的智能體為你創造價值。


結語:理解力,是未來的唯一瓶頸

Andrej Karpathy 的這場對話,無疑是對全球科技從業者的一記當頭棒喝。從軟體 1.0 演進到 軟體 3.0,我們看到的不是簡單的工具升級,而是運算架構與人類勞動模式的根本性顛覆。

「氛圍編程」打開了全民開發的大門,而「智能體工程」則為專業開發者指明了在 AI 時代保持卓越的生存之道。在未來那個「萬物皆可自動化」、智能體原生運作的世界裡,技術細節的壁壘將被無情地踏平。

面對即將到來的衝擊,我們不需要對 AI 產生擬人化的恐懼,而是要將其視為強大的統計幽靈加以駕馭。最重要的是,我們必須認清:當「思考」與「執行」變得極其廉價時,人類大腦中那份對世界的「理解力」,將成為整個系統中唯一的瓶頸,也是你最堅不可摧的核心競爭力。

READ MORE
AI資訊分享Build School Learn2026-05-01
Share article:TwitterFacebookLinkedin
76 Views
10 Likes

【深度洞察】Builder 構建者時代降臨:Claude Code 之父 Boris Cherny 解析 Agentic AI 的未來

【深度洞察】Builder 構建者時代降臨及為六個月後的模型打造產品:Claude Code 之父 Boris Cherny 解析 Agentic AI 的未來 – 原始影片在本文最下方

在當今科技發展的浪潮中,人工智慧(AI)對各行各業的顛覆性影響正在以指數級的速度發生。在近期一場備受矚目的 Lenny 播客專訪中,曾任職於 Meta、現任 Anthropic 的 Claude Code 負責人鮑里斯·切爾尼(Boris Cherny),本文將以該深度訪談的影片內容為基礎,為您全面拆解 AI 如何重塑軟體工程的本質、Agentic AI(代理型人工智慧)的未來圖景、Anthropic 獨特的產品哲學,以及在這個「構建者(Builder)」時代中,每個專業人士與企業該如何應對這場歷史性的變革。

第一章:「構建者」時代的覺醒

1. 「構建者(Builder)」的範式轉移

當 AI 接管了繁瑣的語法撰寫、細節調試與基礎架構搭建後,人類工程師的工作核心正在發生根本性的轉移:從單純的「寫程式」,轉向更高維度的「構建(Building)」。未來,工程師的核心樂趣與價值,將聚焦於構思產品邏輯、設計宏觀系統架構,以及與使用者進行深度的需求溝通。

基於這樣的趨勢,鮑里斯大膽預測,未來將是「構建者(Builder)」的時代。未來的構建者不再是只懂寫程式的單一領域專家,而是必須跨越工程、產品、設計等多個學科的「通才」。

2. 現代的印刷機:知識與創造力的民主化

為了讓大眾更好地理解這場變革的歷史意義,鮑里斯將 AI 編碼工具的出現,完美地比喻為「印刷機的發明」。

在 14 世紀中葉的歐洲,識字率不到 1%,書寫與知識的傳播工作被極少數受僱於貴族的抄寫員所壟斷。印刷機的問世讓印刷品的成本在 50 年內暴跌了 100 倍,實現了知識傳播的民主化,最終成為催生文藝復興的關鍵力量。當時的抄寫員並沒有因為印刷機而崩潰,反而因為能從枯燥的抄寫工作中解放出來,轉而投入書籍插畫與精美裝訂等更具藝術價值的工作而感到高興。

如今的 AI 編碼工具正是現代軟體工業的印刷機,它將徹底打破編程技能的技術壁壘,讓每一個擁有創意的人都具備構建軟體的能力,進而全面解放人類的創造力。

鮑里斯對編程的這種實用主義視角,源於他獨特的成長背景。大學主修經濟學而非計算機科學的他,是一名自學成才的開發者。他回憶起自己最初學習程式的動機,竟是為了在數學考試中作弊——中學時期,他透過 TI-83 圖形計算機編寫程式來儲存答案;當題目難度增加時,他甚至開發了小型的代數解題器,並透過數據線分享給全班同學,讓大家都順利拿到了 A。這段經歷讓他很早就領悟到一個核心真理:程式從來不是最終目的,而只是解決問題與構建事物的強大工具。現在,AI 幫他擺脫了依賴套件和細節調試的束縛,讓他找回了真正的工程樂趣。


第二章:Agentic AI 的崛起與全面自動化的未來

如果說過去的對話式 AI 僅僅是停留在文字交流的聊天機器人,那麼這場變革的下一個關鍵里程碑,將是從純軟體編程領域,擴展到所有基於電腦操作的日常工作。這正是 Agentic AI(代理型人工智慧) 崛起的標誌。

1. 行動至上:Agentic AI 的核心價值

在技術定義上,Agentic AI 的核心關鍵字是「行動」。它不僅僅是回答問題,更能主動使用工具、控制電腦作業系統、存取 Google 文件、發送電子郵件,並在現實的數位世界中執行複雜的具體任務。鮑里斯團隊所研發推出的 Cowork 產品,正是 Agentic AI 領域的最佳典範。

2. Cowork 的誕生:從用戶「濫用」中發現巨大潛力

Cowork 誕生的故事極具啟發性。Anthropic 團隊敏銳地觀察到一個現象:許多非技術背景的普通使用者,正在用原本為終端機(Terminal)開發設計的 Claude Code 來處理各種意想不到的通用任務。例如:

  • 數據科學家 Brendan 甚至下載了 Node.js,只為了能在終端機裡利用 Claude Code 進行深度的 SQL 數據分析。
  • 社群平台 X 上的用戶用它來管理種植番茄的排程,甚至進行基因組分析。
  • 更有用戶利用它從已經損壞的硬碟中,奇蹟般地恢復了珍貴的婚禮照片,或是用來分析複雜的 MRI 醫療影像。

這些意料之外的「濫用」場景,讓團隊看到了 Agentic AI 在大眾市場的巨大潛力。團隊僅花了短短 10 天的時間,就完全利用 Claude Code 寫出了這款面向大眾使用者的桌面級 Agent——Cowork,並內建了確保安全的虛擬機機制。

3. 徹底改變辦公模式的超級助理

目前的 Cowork 已經進化成一個全能的數位助理,能夠幫助使用者自動處理繁雜的專案管理、同步雲端電子表格、智慧收發電子郵件,甚至連支付停車罰單、取消繁瑣的訂閱服務都能代勞。

鮑里斯分享了團隊日常管理的自動化模式:團隊共用一個電子表格,每週所有工程師都需要填寫工作狀態。過去這需要人工反覆催促,現在 Cowork 會在每個星期一自動進行檢查,並精準地發送 Slack 訊息提醒尚未填寫的工程師。

更令人驚嘆的是 Cowork 內建的 Chrome 瀏覽器整合功能。它可以全自動地啟動瀏覽器、登入系統、並為請產假的員工填寫極度複雜的醫療表格 PDF 文件。鮑里斯堅信,任何需要操作電腦工具的職業,都不可避免地將面臨這場由 Agentic AI 帶來的效率革命。


第三章:Anthropic 顛覆傳統的產品開發哲學

Anthropic 能夠在競爭激烈的 AI 賽道中持續推出顛覆性的產品,背後倚靠的是其獨特且前瞻的產品開發哲學。

1. 挖掘潛在需求(Latent Demand)

一如 Cowork 的誕生軌跡,鮑里斯認為優秀的產品創新,往往潛藏在用戶對現有產品的某種「濫用」之中。他以 Facebook Marketplace 為例指出,當年 Facebook 群組中有高達 40% 的貼文是關於物品的買賣交易;正是因為用戶「濫用」了社群交友功能來做生意,才讓開發團隊意識到了建立專門電商交易平台的巨大潛在需求。

Anthropic 對潛在需求的洞察甚至更深一層:他們不僅觀察用戶外在的行為,更會深入審視**「模型本身試圖實現的目標」**(在研究領域稱為 “being on distribution”)。他們的做法是為模型搭建「最少的腳手架(基礎限制)」,賦予 AI 最大的自由度與工具,讓模型能夠自主決定達成任務的最佳執行順序與路徑。

2. 向「苦澀的教訓」致敬,避免過度限制模型

在構建大型語言模型(LLM)應用時,許多開發者的通病是喜歡設計極度僵化、步驟繁瑣的工作流(Workflow),強制模型必須嚴格按照預設步驟執行。

鮑里斯強烈建議開發者:賦予模型必要的工具與明確的目標,然後完全放手讓它自己規劃執行路徑。這個理念深刻呼應了著名 AI 學者 Rich Sutton 在十年前提出的經典觀點——「苦澀的教訓(The Bitter Lesson)」:長期來看,依賴強大算力的通用模型,最終總是會徹底擊敗那些依賴人類領域知識精心設計的專用模型。與其耗費龐大精力去維護複雜的工作流(這通常只能帶來 10% 到 20% 的性能微調),不如直接押注更通用的下一代模型,因為那些人為的微調最終都會被模型基礎能力的躍升所輕易抹平。

3. 押注未來:為 6 個月後的模型構建產品

鮑里斯強調,開發者絕對不能被當前 AI 模型的能力所局限,而應該為六個月後將會出現的、更強大的模型來構建今天的產品。

在 Claude Code 發布的早期(例如採用 Sonnet 3.5 時),它大約只能完成鮑里斯 20% 的程式碼工作,模型運行不到 30 秒就會偏離軌道。然而,團隊堅信模型能力將呈指數級增長。當 Opus 4 和 Sonnet 4 等強大模型正式發布後,產品瞬間迎來了能夠「百分之百生成程式碼」的歷史性拐點,模型甚至能連續數小時、數天無人值守地穩定運行。這種「押注未來」的策略在初期可能會面臨市場契合度不足的陣痛期,但只要新一代模型一上線,產品就能立刻爆發出驚人的增長動能。

4. 先創新後優化:顛覆常規的 Token 預算管理

在企業導入 AI 的初期,鮑里斯建議企業絕對不應該過度控管工程師的 Token(AI 運算單位)使用預算,反而應該給予他們「無限的 Token」,鼓勵他們自由地去嘗試與創新。

在專案的探索階段,Token 所產生的費用相較於工程師薪資及企業營運成本來說微不足道。這種不受成本束縛的自由探索,往往能孕育出最具顛覆性的創新。Anthropic 內部甚至有工程師每個月消耗高達數十萬美元的 Token 預算。只有當專案證明具有商業可行性,準備大規模擴展時,才需要將焦點轉向成本優化,例如將底層模型替換為成本較低的 Haiku 或 Sonnet 模型。


第四章:深植 DNA 的核心使命——為何「安全(Safety)」大於一切

在探討完令人熱血沸騰的技術與產品後,鮑里斯在訪談中揭露了 Anthropic 最核心、也最不妥協的企業驅動力——安全(Safety)。

六個月前,鮑里斯曾短暫離開 Anthropic,跳槽加入同樣在 AI 程式碼領域極具知名度的 Cursor 團隊;然而,僅僅兩週後,他便毅然決然地回歸 Anthropic。促使他做出這個戲劇性決定的根本原因,正是 Anthropic 無可取代的安全使命。他回憶道,只要隨便在公司內攔住任何一位員工,問他們為什麼選擇在這裡工作,得到的答案永遠驚人地一致:「安全」。這種深入骨髓的使命感讓他深刻體悟到,打造酷炫賺錢的產品,永遠無法替代追求人類終極安全所帶來的價值感。

為了確保 AI 的安全性,Anthropic 內部建構了嚴密且領先業界的「三層安全架構」:

  1. 機制可解釋性(Mechanistic Interpretability): 由領域開拓者 Chris Olah 所領導。團隊致力於深入理解神經網路內部的運作機制。例如,精確追蹤當 AI 產生「欺騙(Deception)」行為時,是哪些特定的神經元被激活;研究特定概念如何被編碼(例如透過疊加態 Superposition),以及模型究竟是如何在內部進行推理與規劃的。Anthropic 更是無私地將大量相關研究開源,期望帶動整個產業以負責任的方式前進。
  2. 實驗室嚴格評估(Lab Evaluations): 在將模型推向市場之前,團隊會在高度可控的「培養皿」實驗室環境中,輸入各種極端、合成的複雜情景,嚴格測試模型是否與人類價值觀對齊(Alignment),確保其行為的安全。
  3. 盡早發布以獲取真實反饋(In-the-wild testing): 真正的安全必須經受現實世界的考驗。Claude Code 在正式發布前,已在公司內部高強度使用了四到五個月;而 Cowork 也是以研究預覽版的形式提早面世。這一切都是為了在真實的互動中持續優化安全防線。

此外,Anthropic 秉持著「力爭上游(Race to the top)」的原則,為 Claude Code 推出了專屬的「開源沙盒環境(Sandbox)」。這個沙盒能為 Agentic AI 劃定明確的邊界限制(例如禁止 AI 隨意訪問系統內的所有敏感檔案),確保 AI 只能在安全的圍欄內運行,並且開放與任何第三方的 Agent 協同工作。


第五章:給開發者的實戰指南——如何最大化 AI 助手價值

對於廣大的開發者,該如何適應這個新時代?鮑里斯大方分享了三個提升 AI 協作效率的核心技巧:

  1. 始終使用能力最強的模型: 許多開發者為了節省微薄的 API 成本,會選擇較便宜的模型。但鮑里斯強烈建議直接使用最頂級的模型(例如 Opus 4.6,並開啟 Maximum Effort)。能力越強的模型犯錯率越低,所需的人工糾錯大幅減少。從整體效率來看,減少重工反而能省下更多的 Token 消耗與時間成本。
  2. 善用強大的「計畫模式(Plan Mode)」: 鮑里斯個人高達 80% 的工作任務,都是從計畫模式開始的。操作極其簡單,只需在提示詞中加上一句關鍵指令:「請先不要寫任何程式碼(Please don’t write any code yet)」。AI 會先與你進行高維度的方案討論與架構設計,確認整體邏輯無誤後再動手生成代碼。這個習慣能極大地提升代碼一次生成的成功率(One-shot),避免方向錯誤導致的無效運算。
  3. 大膽嘗試多元的操作介面: 不要以為 Claude Code 只能在枯燥的終端機環境中運行。它支援 iOS 和 Android 行動應用程式、桌面應用程式、Slack 企業通訊軟體整合等多種形式。鮑里斯自己早上醒來的第一件事,就是在床上透過 iOS 手機版的 Claude Code 來檢查昨晚 AI 生成的程式碼。每位開發者都應根據自身習慣,打造最舒適的工作流。

第六章:AI 衝擊下的職場未來與傑文斯悖論

隨著 AI 編碼工具的普及,許多人恐懼 AI 會導致人類大規模失業。面對這個焦慮,鮑里斯巧妙地引用了經濟學中的**「傑文斯悖論(Jevons Paradox)」**來解答。

傑文斯悖論指出,當技術進步提高了某種資源的使用效率、降低了成本時,往往會刺激出更大的總需求。當 AI 讓開發軟體的成本極大降低時,人類能做的事情將變得空前龐大,這反而會催生出海量的新需求與就業機會。在 Anthropic 內部,當 AI 成為工程主力後,他們的團隊規模不僅沒有縮減,反而因為能承接更多創新專案而持續擴大招募。

然而,職場規則將被徹底改寫。AI 的衝擊將首先蔓延至與軟體工程相鄰的職位,如產品經理(PM)、設計師與數據科學家。未來的角色邊界將極度模糊:在 Anthropic 內部,大多數的設計師都已經開始動手寫程式,能獨立解決複雜技術問題;在 Cowork 團隊中,產品經理、工程主管、設計師甚至財務同事,每個人都具備編碼能力。

未來最核心的人才競爭力將是**「通才(Generalist)」思維**。最強的工程師不僅要懂底層基礎設施,還要兼具產品商業思維、出色的設計品味,並善於與用戶進行溝通。未來最受市場青睞的人才,將是那些熟練掌握 AI 工具、保持強烈好奇心、能跨越單一學科邊界的跨領域人才。


第七章:科幻小說、常識與味噌——頂級 AI 專家的精神世界

在高度硬核的技術訪談尾聲,鮑里斯展露了他極具反差魅力且深邃的個人世界。

作為在烏克蘭奧德薩(Odessa)出生的移民,他的家族與電腦有著深厚的淵源。他的祖父是蘇聯第一代程式設計師,使用打孔卡片(Punch cards)進行編程。從打孔卡片到現代軟體,再到如今的 AI 生成程式碼,鮑里斯認為技術的載體永遠在變,不變的是「解決問題」的核心。

當被問到最推薦的書籍時,除了專業的《Scala函數式編程》(展現了類型系統的美學)與描述科技奇異點的《Accelerando》之外,他極度推崇科幻巨擘劉慈欣的短篇小說集《流浪地球》。

令人意外的是,科幻小說竟是他決定加入 Anthropic 的重要契機。在加入公司前,他曾隱居在日本的鄉村,過著依循四季更迭的慢節奏生活。在那裡,他學會了製作傳統的味噌與泡菜。他深知,發酵一批白味噌需要耗費三個月,而紅味噌更是需要耐心等待兩到三年才能熟成。這種與時間做朋友的手工勞作,教會了他用更長遠的歷史視角來審視問題。在那段日子裡,他大量閱讀科幻小說,深刻意識到 AI 技術未來的發展軌跡,並決心投身其中,引領技術走向對人類有益的方向。

當被問到:「當 AGI(通用人工智慧)真正實現後,你打算做什麼?」鮑里斯給出了一個充滿禪意的答案:「我想去做味噌。」 他期許自己在 AGI 達成使命後,能夠回歸慢節奏的手工作業,在發酵過程中尋找內心真正的平靜。

在工作哲學上,他分享了自己最受用的人生格言:「運用常識(Apply common sense)」。職場上無數的失敗,往往源自於人們機械地遵循標準流程,卻放棄了獨立思考。真正卓越的成果,永遠屬於那些懂得從第一性原理出發、善用人類常識來判斷事物的人:「如果某件事憑直覺感覺不對勁,那它很可能就不是一個好主意。」

這位頂尖開發者至今仍保持著極度務實的駭客精神。去年十二月在歐洲旅行途中,他甚至因為「無聊」而打開社群平台 X(原 Twitter),親自回覆全球用戶對於 Claude Code 的反饋意見,並以極快的速度修復系統 Bug。這種直接傾聽用戶聲音的作風,展現了他對產品的極致熱愛。


結語:在構建者時代,成為自己的設計師

總結這場深度專訪,我們看到了一幅清晰的未來畫卷:這場由大型語言模型引爆的 AI 變革,其終極目的從來不是為了無情地取代人類,而是為了深刻地**「解放人類」**。

無論是將傳統軟體工程師升級為跨領域的「構建者」,還是 Agentic AI 在辦公場景的全面普及,其本質都是將人類從枯燥、繁瑣的底層技術細節中解救出來,進而將全人類的創造力推向最大化。

面對這場無法阻擋的歷史洪流,與其在恐懼中擔憂被時代淘汰,不如主動適應並學習駕馭這些強大的 AI 工具。培養自己跨越學科邊界的「通才」思維,保持對世界的好奇心與常識判斷力,將是我們在這個「構建者時代」中最堅固的護城河。正如鮑里斯所言,編程的瑣碎細節已被解決,但屬於人類真正的創造之旅,現在才剛要開始。

原始影片


READ MORE
AI資訊分享Build School Learn2026-05-01
Share article:TwitterFacebookLinkedin
63 Views
11 Likes

[深度解析] 從 Instagram 創辦人到 Anthropic 產品長:AI 軟體革命的 7 大前瞻洞察

擁抱非確定性的未來:AI 時代軟體設計、工程革命與企業落地的深度指南

在人工智慧技術呈現指數級爆發的今天,軟體開發的本質正經歷一場前所未有的範式轉移。近日,在思科(Cisco)舉辦的第二屆 AI 峰會上,Anthropic 首席產品官麥克·克里格(Mike Krieger) 帶來了震撼業界的深度分享。作為 Instagram 的聯合創始人兼前技術長(CTO),以及 AI 新聞應用程式 Artifact 的聯合創始人,克里格擁有極為罕見的跨界視角。他在 2024 年 5 月加入 Anthropic,隨後更親自轉入 Labs 團隊,站上了前沿 AI 研發的第一線。

這篇文章摘要了該場深度分享,探討人工智慧如何徹底翻轉軟體開發與企業管理的傳統邏輯。他指出 AI 時代的軟體核心是非確定性模型,因此產品開發必須捨棄靜態原型,改採早期介入真實模型並持續迭代的研發模式。對於企業而言,AI 落地的障礙往往不在於技術,而是內部組織慣性與流程瓶頸,因此需選擇核心業務進行積極嘗試。同時,AI 程式編寫已大幅提升效率,讓開發重點轉向程式碼審核與產品設計原則的對齊。Krieger 強調設計匠心依然不可取代,未來的殺手級應用將在於挖掘企業中未被利用的數據流價值。

原始影片

在這場深度對話中,克里格傳遞了一個顛覆傳統的核心觀點:AI 產品的打造方法已經發生了根本性的改變。產品經理(PM)與設計師再也不能躲在漂亮的需求規格書(PRD)和靜態線框圖(Wireframes)背後。因為在 AI 時代,軟體的核心引擎不再是按部就班的程式碼,而是一個「非確定性的動態模型」。同時,企業在導入 AI 時,必須揚棄「安全但無關痛癢的小試點」思維,轉而直擊核心業務流程。當 AI 模型的能力已經突破天際,真正阻礙技術落地的,往往不再是技術本身,而是企業內部的權限審批流程、基礎設施瓶頸與組織慣性。

本文將帶您深度拆解麥克·克里格的分享脈絡,從產品設計的未來、工程開發的顛覆,到企業級 AI 落地的實戰指南,為所有科技從業人員與企業決策者提供一份全方位的 AI 時代生存手冊。


第一章:跨界思維的啟示——從符號系統到 AI 浪潮的最前線

要深刻理解克里格對 AI 產品的洞察,必須先回顧他獨特的學術與職涯背景。這不僅是一個矽谷成功創業家的故事,更是技術與使用者體驗(UX)交匯演進的縮影。

1.1 科技與人文的十字路口:符號系統的洗禮

克里格表示,貫穿他整個職業生涯的核心主線,就是對「軟體運算的技術潛力」與「使用者如何實際操作」這兩者交匯點的強烈興趣。這份熱忱源自於他在史丹佛大學就讀的「符號系統(Symbolic Systems)」學系。這是一個高度跨領域的學科,完美融合了認知科學、設計、計算機科學、哲學、心理學以及人工智慧。

雖然當時的 AI 技術大多還停留在「幫迷宮尋找最佳路徑」的初階階段,但這種跨學科的洗禮讓他建立了一個堅不可摧的核心信仰:「就算你擁有世界上最頂尖、最強大的軟體,但如果人們無法理解它、不知道如何使用它,那這款軟體就沒有創造出任何實質性的真實價值。」。這個理念成為了他日後打造所有數位產品的北極星。

1.2 兩大絕對趨勢驅動的職涯轉型

畢業後,克里格首先加入了 Meebo 公司,這段經歷讓他見識到了強大的企業文化與招募體系,並初步掌握了軟體從研發到落地的完整生命週期。隨後,他迎來了職涯的第一個高峰——與凱文·希斯特羅姆(Kevin Systrom)共同創立了 Instagram。在那個智慧型手機與行動網路剛剛興起的年代,他們專注於極致的簡化:讓使用者在每一個螢幕畫面上都清楚知道自己該做什麼,讓發布照片與建立社交圖譜變得「簡單到近乎愚蠢(stupidly easy)」。

離開 Instagram 後,這對黃金搭檔再次攜手,創立了 AI 驅動的新聞推薦應用 Artifact。儘管 Artifact 營運三年後因發展軌跡不符預期而選擇出售給雅虎(現為 Yahoo News),但這三年的 AI 創業經歷,讓克里格敏銳地捕捉到了兩個不可逆轉的產業趨勢:

  1. 寫程式的根本性顛覆:在 Artifact 創業晚期,克里格就已經開始使用早期的 AI 程式碼生成模型來加速開發。當時的模型甚至還不具備視覺能力,他只能用文字和符號(如點和破折號)向模型描述介面設計,要求模型用 Swift 語言實作。即使當時生成速度極慢(每秒只有兩個 Token,他甚至有時間去泡杯咖啡或散個步),但生成的程式碼框架已經具備了極高的可用性,這讓他深信「寫程式的方式即將被徹底改變」。
  2. AI 將成為全新的軟體「智能層」:過去如果要在產品中加入「文章摘要」或「將農場標題改寫為客觀事實」的功能,企業必須組建專門的機器學習研究團隊,耗費數個月的時間開發。但在 AI 時代,這些強大的功能僅需透過一個簡單的 API 呼叫,在幾個小時內就能完成部署。

基於這兩大趨勢,克里格深刻認知到,下一代軟體的研發必將由頂尖的 AI 實驗室來驅動。因此,在與 Anthropic 團隊交流並高度認可其願景與文化後,他決定加入這個站在技術最前沿的團隊,親自參與這場軟體革命。


第二章:破除科技圈迷思——「設計已死」是 AI 時代最大的誤判

隨著自然語言生成程式碼的技術日益成熟,科技圈瀰漫著一種悲觀的論調:「既然使用者可以直接用一句話向模型描述需求並生成應用程式,那麼設計師和產品經理是否將面臨職業危機,甚至徹底消亡?」。

2.1 「能用的軟體」與「熱愛的軟體」之間的巨大鴻溝

對此,克里格給出了極為堅定且具啟發性的反駁。他直言,「設計將會消亡」是一個被廣泛持有但卻根本性錯誤的信念。他精闢地指出,在「你使用的軟體」和「你熱愛的軟體」之間,始終存在著一道 AI 無法輕易跨越的鴻溝。

目前那些僅憑 AI 快速生成的「即興產品」,往往缺乏讓人主動想去回訪、甚至忍不住推薦給身邊親友的產品體驗。一款真正優秀的產品,必須具備以下三個不可或缺的要素,而這些都不是單純依賴自然語言提示詞就能自動生成的:

  • 獨具匠心的工藝細節(Craftsmanship)
  • 存在的絕對核心理由(Core reason to exist)
  • 鮮明的品牌認知與情感連結(Brand identity)

2.2 設計師角色的演變與重要性升級

克里格強調,所謂「精心設計的軟體即將死亡」的說法被嚴重過度渲染了。相反地,在 AI 時代,使用者對於優質體驗的渴望不僅沒有降低,反而一如既往地關鍵。

在 Anthropic 的 Labs 團隊中,克里格每天與設計師密切交流。他發現設計師的角色確實正在發生轉變,但其重要性正在急劇攀升。未來的科技產業更需要專業的設計人員,來將 AI 模型深不可測、甚至有些抽象的強大能力,轉化為普通大眾能夠輕易理解、順暢使用的產品體驗。


第三章:產品研發的新範式——擁抱非確定性的動態引擎

如果設計沒有死,那麼產品經理和設計師在 AI 浪潮中犯下的最大錯誤是什麼?克里格一針見血地指出:「在真正把產品做出來之前,花太多時間停留在了靜態設計稿、假原型(Mockups)和產品需求文件(PRD)上。」。

3.1 告別瀑布流:軟體已成為「有生命的動態系統」

傳統軟體開發是確定性的,按圖施工即可。但 AI 時代的軟體已經進化成一個**「有生命的、呼吸著的動態系統」**。它的核心驅動引擎是一個非確定性的、令人驚嘆但有時也令人抓狂的 AI 模型。

因此,產品經理的角色必須被重新定義。把畫得精美的線框圖交給工程師去實作的傳統流程已經徹底失效。產品團隊必須盡早把真實的 AI 模型接入產品原型中跑起來,在反覆的動態測試和邊界探索中,尋找技術能力與產品需求的完美結合點。

3.2 經典案例解析:Computer Use 的漫長等待與奇蹟拐點

克里格分享了 Anthropic 開發「Computer Use」(讓 Claude 驅動使用者的電腦並進行精準點擊操作)的真實血淚故事,這是一個堪稱經典的敏捷試錯案例:

  • 初創原型的失敗:2024 年夏天,克里格加入公司的第三個月就做出了原型。但當時的模型能力不足,會在螢幕上到處亂點,根本無法投入實際使用。
  • 堅持維護測試框架:儘管看似無用,團隊並沒有放棄這個原型。他們把它當作一個量測能力邊界的工具,每當研究團隊發布新模型,就會接入這個原型進行測試,觀察它是否能突破檔案選單、打開特定應用程式。
  • 迎來技術拐點:當 Sonnet 3.7 版本發布時,團隊照例進行測試,雖然原本沒有抱太大期望,但奇蹟發生了——研究員驚呼「它真的變強了,我們可以把它產品化了!」。

克里格總結道,如果當時團隊沒有持續維護那個看似失敗的測試框架,根本就無法及時捕捉到這個技術能力的拐點。這種「先構建原型,等待模型能力追上」的研發思路,在企業級場景中不僅適用,更是尤為重要,因為企業級產品對模型能力與體驗的結合要求極為嚴苛。


第四章:AI Agent 的沙盒化管理:自主創新與安全管控的博弈

隨著大型語言模型能力的進化,AI 智慧體(AI Agents)成為了企業數位轉型關注的焦點。對於 Agent 而言,究竟是給予更多自主性好,還是施加嚴格控制更好?克里格提出了一套極具實操價值的平衡哲學。

4.1 擁抱 Agent 的創造力與解題韌性

克里格指出,現代大模型擁有一種神奇的能力:只要給予它一個明確的目標和相當高層級的指令,它就能自主尋找解決路徑,甚至在遇到阻礙時展現出令人驚嘆的創造性。

他舉了一個 Anthropic 內部的生動例子:一位工程師要求 Claude 準備一份家庭度假的規劃文件,但租賃網站的照片因為伺服器故障無法正常顯示。令人意外的是,Claude 並沒有報錯停機,而是自己畫了一幅它想像中度假房子的樣子放進文件中。儘管畫作與實際房屋可能大相逕庭,但這種「遇到死胡同就嘗試其他方法、極度渴望解決問題」的自主能力,正是 Agent 真正的核心價值所在。完全束縛這種自主性,等同於扼殺了 Agent 的魔力。

4.2 企業級落地的絕對前提:Agent 沙盒化 (Sandboxing)

然而,嚴肅的企業環境無法容忍失控的資安風險。為了在賦能與控制之間取得完美平衡,Anthropic 在企業內部採用了**將 Agent「沙盒化(Sandbox)」**的正確方式。

在建構企業內部 Agent 系統時,必須嚴格界定以下三個核心問題:

  1. 權限邊界與最小權限原則:Claude 運行的「沙盒」究竟擁有什麼層級的權限?它執行任務所需的最小權限是什麼?。
  2. 外部通道控管:Agent 與外部世界(內部網路、資料庫、API)之間的連接通道是如何設計的?何時允許它越過沙盒邊界?。
  3. 全程可觀測性(Observability):必須確保資訊流入與流出的每一個環節都能被追蹤與記錄。

總結來說,Anthropic 的策略是:在沙盒內部給予 Agent 充分的自主解題空間,同時配合嚴謹的外部連接管控與可觀測性。這是在企業級場景中安全導入 Agent 的絕對不二法門。


第五章:AI 顛覆軟體工程——100% 程式碼生成與全新的效率瓶頸

軟體開發生命週期正在經歷史無前例的震撼教育。在 Anthropic 的 Labs 團隊內部,AI 寫程式的滲透率已經達到了一個令人難以置信的里程碑。

5.1 難以置信的開發效率:100% AI 編程

大約一年前,Anthropic CEO 達里奧(Dario)曾公開預測年底將有 90% 的程式碼由 Claude 編寫,當時外界普遍認為這個目標太過瘋狂。然而,克里格證實,現在對於 Anthropic 的大多數產品而言,實際上已經實現了 100% 的 AI 編程,幾乎所有的程式碼皆由 Claude 撰寫。

這種效率帶來了驚人的工作面貌:團隊成員之間經常互相提交高達 2000 到 3000 行程式碼的 Pull Request (PR),這在傳統軟體研發時代是完全無法想像的速度。團隊現在的核心任務,已經轉變為圍繞 Claude 搭建完善的品質保障與審查機制(Scaffolds),以確保能夠完全信任 AI 的巨大產出。

5.2 軟體工程的三大決定性變革

隨著 AI 輔助開發的普及,軟體工程領域出現了三個根本性的變化:

  1. 對抗式程式碼審查(Adversarial Code Review)的崛起:透過專業的提示詞工程訓練,Claude 已經成為極其嚴格的「對抗式」程式碼審查者。當工程師提交 PR 後,Claude 能迅速指出潛在的資安漏洞、建議重構方向與更優的架構方案。
  2. 重構與技術債的成本革命:在 AI 時代,產品迭代極快,技術債(Tech Debt)累積的速度也以倍數增長。但 AI 徹底改變了償還技術債的成本效益。克里格在開發 iPhone 專案碰壁時,便是讓 Claude 先寫好驗證測試程式,接著對底層架構進行全面重構,讓原本浩大的工程變得輕而易舉。
  3. 開發者基礎設施成為新的「10倍懲罰」瓶頸:過去,系統修復或持續整合(CI/CD)當機等個一小時,只是微小的不便,因為工程師一天可能只提交一個變更集。但在每個工程師每天產出十幾個巨量 PR 的 AI 時代,任何 CI 系統的阻塞或基礎設施的摩擦,都會對團隊生產力造成令人肉體感到痛苦的 10 倍懲罰。

5.3 重新定義「稀缺資源」

當「寫出能動的程式碼」不再是難題,什麼才是軟體開發真正的稀缺資源?克里格明確指出,真正的稀缺資源已經轉移到了程式碼的「審查(Review)、審計(Audit)和整合(Integration)」。因為當多名工程師同時向代碼庫提交海量程式碼時,系統整合的複雜度與衝突機率已大幅攀升。

此外,在企業級開發中,有兩項核心工作變得比以往任何時候都更加致命且困難:

  • 對齊產品方向:確認產品到底要解決什麼問題,這在過去很難,在 AI 時代被放大為最難的部分。
  • 對齊設計原則和技術架構:必須確保人與 AI 在修改海量程式碼時,不是在東拼西湊地貼補丁(Duct taping),而是朝著團隊共識的**「北極星」(架構規範、程式碼原則、核心業務邏輯)**持續演進。

第六章:企業落地 AI 的破局之道——拒絕平庸,直擊痛點

企業該如何正確擁抱 AI?Anthropic 的內部哲學是「極致地使用 AI 進行實驗」,但這套方法是否適用於傳統企業?克里格透過與大型銀行和保險公司的合作,總結出了企業 AI 落地的成功與失敗法則。

6.1 失敗的標配:「安全無害的小試點」

克里格觀察到,失敗的企業往往是在做「極致實驗」的反面。如果一家企業只敢在自認為最安全、無足輕重的邊角料業務中採用一個小功能,或是為低價值的內部流程定制 Agent,這些嘗試幾乎注定會失敗。

失敗的兩大主因是:

  1. 缺乏雄心壯志:在這些低價值的小試點中,企業無法見識 AI 真實的顛覆威力,也無從評估真正落地需要投入哪些實質資源與架構變革。
  2. 一遇到阻礙就輕易放棄:因為試點的業務價值太低,一旦遇到路障或模型表現初期不如預期,專案負責人往往會直接放棄,無法形成持續優化與迭代的飛輪效應。

6.2 成功的範本:激進推進核心業務與賦能一線

正確的企業落地模式,是**「挑選企業內部真正關鍵、甚至有點令人畏懼的核心業務流程」**,並與 AI 廠商緊密合作,明確三個核心問題:

  1. 成功的衡量標準是什麼?
  2. 安全的護欄與界線在哪裡?
  3. 如何制定一個激進的時間表以加速落地,保持在技術前沿?

在組織架構上,企業應建立一個精簡的「中央 AI 團隊」,其職責僅限於提供模型存取權限、審計與可觀測性;同時必須賦予一線產品與業務團隊足夠的自主權,讓最靠近使用者的團隊決定如何應用技術。這種堅持不懈、持續增量改進的持久力,將成為企業的新超級能力。

6.3 執著於核心問題,保持產品形態的靈活性

企業在落地 AI 時,必須具備承認「產品形態不對」的靈活性,並勇於推翻重來。克里格分享了 Anthropic 探索讓 Claude 與 Excel 深度整合的血淚史:

  • 第一次嘗試:讓 Claude 讀取試算表內容並寫程式碼去更新它(純技術實現,但實際體驗不佳)。
  • 第二次嘗試:利用 Computer Use 的視覺能力,讓 Claude 看著螢幕手動點擊儲存格(結果發現電子表格是電腦視覺領域最難的題目之一,操作精度完全不夠)。
  • 最終解法:經歷三四次徹底打掉重練後,團隊決定直接在 Excel 內部建立原生的鉤子(Native Hooks),這才實現了完美的深度整合與流暢體驗。

這個真實案例印證了 AI 時代不變的商業鐵律:「企業編寫軟體的能力,已經不再是核心的差異化優勢。」。真正的護城河,是企業長年積累的使用者信任、品牌認知、客戶關係、專有資料,以及深厚的系統整合談判能力。只要專注於解決使用者的核心痛點,產品形態隨時可以根據技術演進而大膽重構。


第七章:前沿佈局——生產力革命、底層可解釋性與無感偏好學習

對話的最後,克里格揭示了 Anthropic 在產品與底層研究上的最新佈局,為我們描繪了 AI 技術的下一個爆發點。

7.1 生產力工具的演進:Claude Cowork 誕生

Anthropic 團隊發現一個有趣的現象:使用者開始大量使用寫程式工具(如 Claude Code)來處理「非程式設計」的事務,例如企業流程編排、制定個人待辦清單等。儘管技術上可以讓 AI 完全接管電腦基礎設施(例如極端自主的 OpenClaw),但大多數人類尚未準備好接受如此高程度的自主 AI 介入。

因此,僅耗時三週就開發完成的生產力工具 Claude Cowork 應運而生。它的定位介於「完全自主 Agent」與「傳統辦公工具」之間,核心價值在於整合與自動化工作片段,讓 AI 成為使用者的「全能工作搭檔」,而非直接取代人類。這標誌著大模型正大舉向企業級生產力工具領域邁進。

7.2 打開 AI 決策黑盒:機制可解釋性 (Mechanistic Interpretability)

人類真的能理解 AI 為何做出特定決策嗎?Anthropic 在機制可解釋性領域的進展十分神速:

  • 2024年:發布 Golden Gate Claude 論文,首次展示了能夠具體對應並操縱模型「大腦」中的個別特徵。
  • 2025年與未來:深入「迴路(Circuits)」研究。不僅研究單一概念,更探索模型如何執行具體操作(例如 AI 模型明明沒有內建計算機,為何能順暢進行複雜的心算,這並不完全符合它們被訓練的方式)。

這項研究已從純學術走向實際應用。團隊透過極限測試與系統卡(System Cards)來探索模型邊界,探究模型何時保持誠實、何時可能欺騙,並密切觀察模型部署到真實世界後產生的「湧現行為(Emergent behaviors)」,以確保安全性並進行持續迭代。

7.3 無感知的用戶偏好學習:告別冗長表單

未來的 AI 將如何更本能地理解使用者?要求使用者填寫冗長的偏好表單顯然行不通。克里格提出了兩個「讓使用者付出最少額外努力」的探索方向:

  1. 利用數位痕跡(Digital Ephemera)進行冷啟動:讓 Agent 先進行「旁觀」。例如,透過分析使用者在企業通訊軟體(如 Slack)上寫過的無數文件與對話訊息,Agent 就能精準掌握使用者的線上工作風格與表達習慣,無痛完成個人化建模。
  2. 動態生成 UI 的微交互:Anthropic 正在賦予 Claude 即時(Just-in-time)生成各種互動介面的能力。透過自然的對話與輕量化的 UI 點擊(如動態生成小選單或分段選項),Agent 能在日常互動中逐步、無痛地學習使用者的核心偏好。

7.4 危機隱憂與下一個殺手級應用

身為天生愛操心的人,克里格最擔憂的並非模型能力會遇到天花板,而是**「人類陳腐的流程問題」**。他直言,配備了正確模型上下文協議(MCPs)權限的 Claude,與沒有配置的體驗有著天壤之別。然而,企業內部冗長、僵化的權限審批流程,往往成為卡死 AI 技術發揮威力的最大阻礙,讓使用者感到極度失望。

但同時,他也對 AI 的發展充滿興奮。他發現Claude 在產品管理領域的能力遠超預期。雖然它還無法憑空發明全新產品,但目前已經能作為一個極為優秀的「產品經理實習生」,協助進行大量的使用者需求收集與綜合分析工作,這比他預期的提早了非常多。

針對下一個殺手級應用,克里格給出了極具商業洞察的預測:「挖掘企業未被充分利用的龐大資料流」。無論是網路資安監控、金融交易訊號,還是製造業的機台感測資料,核心痛點都在於資料準備度不足。未來的殺手級應用將是利用 AI 大幅降低資料攝取(Ingestion)的門檻,並構建強大的聚合與洞察發現能力,徹底釋放這些隱藏在深處的巨量資料價值。


結語:在非確定性的變革中尋找新定位

綜合麥克·克里格的深度分享,我們不難發現,AI 從單純的輔助編程工具向全能生產力工具、從企業級基礎設施向個人化應用的全面滲透,已經是不可逆轉的歷史洪流。

當下科技產業與企業數位轉型的核心痛點,已經從「技術能力的不足」轉向了「企業的流程瓶頸、基礎設施的脆弱與組織慣性」。對於企業決策者而言,打破「安全小試點」的思維定勢,敢於在核心業務中大膽導入 AI 代理並建立完善的沙盒護欄,是確保未來競爭力的唯一破局之道。

而對於廣大的軟體工程師、產品經理與設計師來說,必須徹底拋棄靜態的傳統瀑布流研發思路,盡早將動態模型接入真實產品原型中,將精力轉移至系統架構對齊、程式碼審查與使用者體驗設計,在持續的測試與迭代中,尋找強大運算力與人性的完美交匯點。AI 時代的軟體革命已經真正到來,只有勇於擁抱非確定性、持續創新的團隊,才能在這波宏大的產業紅利中,刻下屬於自己的名字。

READ MORE
AI資訊分享Build School Learn2026-02-25
Share article:TwitterFacebookLinkedin
233 Views
39 Likes

AI 時代的產品法則與商業護城河:Google AdSense 之父 Gokul Rajaram 的深度洞察

在科技產業,很少有人能像 Gokul Rajaram 一樣,親身參與並建構了網際網路時代最重要的幾具「營收引擎」。他曾被稱為「AdSense 之父」,在 Google 建立了價值數十億美元的廣告網絡;隨後轉戰 Facebook 主導廣告產品體系;接著在 Square 協助建立了中小企業的支付生態;並在 DoorDash 擔任高階主管。

在這場與 Patrick O’Shaughnessy 的深度訪談中,Gokul Rajaram 以其橫跨二十年的實戰經驗,剖析了在生成式 AI 爆發的當下,產品開發、商業模式、企業護城河以及人才職涯將面臨何種翻天覆地的變化。

本文將其核心洞察整理,旨在為產品經理、創業者及投資人提供一份在 AI 浪潮下的導航指南。

  • 一、 產品開發的範式轉移:從「確定性」到「判斷力」
  • 二、 在 AI 時代建立持久的商業護城河
  • 三、 廣告商業模式的終極型態
  • 四、 巨人的肩膀:向傳奇創辦人學習
  • 五、 給 AI 世代人才的職涯建議
  • 結語:在無限生產力中尋找價值

——————————————————————————–

一、 產品開發的範式轉移:從「確定性」到「判斷力」

AI 帶來的改變不僅僅是工具層面的優化,而是從根本上改變了軟體開發的邏輯與產品團隊的結構。

1. 軟體本質的改變:非確定性(Non-deterministic)軟體

過去十年,產品開發遵循著明確的邏輯:如果使用者做了 X,系統就會產出 Y。這是一個「確定性」的世界,產品經理(PM)、設計師與工程師的角色涇渭分明。然而,Gokul 指出,現在我們正在建構「非確定性」的軟體。如果你輸入 X,AI 可能會產出 Y,但在些微變數下,它可能產出完全不同的結果。

這種轉變導致了「評估」(Evaluation/Evals)變得至關重要。既然無法預寫所有規則,PM 的職責便從「定義功能」轉向了「定義並驗證結果」。PM 需要與研究人員合作,建立能夠判斷 AI 產出是否合理的評估機制,甚至需要撰寫 AI 程式來評估另一個 AI 的產出,因為人類無法手動檢查海量的生成內容。

2. 「AI Slop」危機與判斷力(Judgment)的價值

Gokul 提出了一個發人深省的觀點:在未來,真正能「抗通膨」且「防過時」(Future-proof)的能力,是判斷力(Judgment)。

隨著 AI 程式碼生成工具(如 GitHub Copilot, Cursor 等)的普及,工程師的產出效率將無限放大。但隨之而來的風險是「AI Slop」(AI 廢料)的氾濫——大量的、低品質的、甚至含有錯誤或漏洞的程式碼被快速生成,。在這個「什麼都能做」的時代,核心問題變成了「什麼才是值得做的?」以及「這段程式碼/設計是否符合我們的標準?」。

因此,無論是工程師審查 AI 寫的程式碼,還是設計師審查 AI 生成的介面,人類的核心價值將回歸到「編輯」與「判斷」。就像 Twitter 創辦人 Jack Dorsey 曾將 PM 定義為「產品編輯」(Product Editor)一樣,未來的產品人必須具備極高的品味與判斷力,從無限的可能性中刪減出最精華的部分。

3. 職能邊界的消融與「由下而上」的開發

傳統「PM 定義 -> 設計師設計 -> 工程師開發」的流水線正在崩解。Gokul 觀察到,現在的產品開發更多是「由下而上」(Bottoms up)的。由於模型能力迭代太快(每兩個月就推進一次邊界),過度嚴謹的規格文件反而會限制創新。

現在的趨勢是,PM、設計師與工程師圍坐在一起,直接針對程式碼或原型進行協作。PM 必須變得更親手實作(Hands-on),甚至需要能夠使用 AI 工具(如 Claude Code)來提交程式碼或製作原型。

更有趣的是設計師與工程師的比例變化。Gokul 指出,過去這個比例可能是 1:3 或 1:10,現在正走向 1:20。因為一旦設計系統(Design System)確立,AI 就能基於該語言自動生成大部分的設計工作,企業只需保留少數頂尖設計師來維護設計語言,而將資源投入更多能解決複雜問題的工程師身上。

——————————————————————————–

二、 在 AI 時代建立持久的商業護城河

對於創業者而言,這是一個既興奮又危險的時刻。Gokul 警告,如果你試圖建立一個「輕量級」的應用,基礎模型公司(Foundation Model Companies)或大型企業內部的工具很快就會吞噬你。那麼,如何建立一家能存活十年的 AI 公司?

1. 避開「實用性定價」的陷阱

Gokul 特別點名了像 Zendesk 這類依賴「席位」(Seats)計費的 SaaS 公司面臨的巨大風險。這類公司的價值建立在「實用性」(Utility)上,每個席位代表一個人類客服。然而,AI Agent(代理人)正在取代這些人類工作。客戶可以用 30 個 AI Agent 加上 20 個 Zendesk 席位,來取代原本的 50 個席位,這將導致老牌軟體公司的營收被慢慢抽乾。

未來的商業模式必須轉向**「成果導向定價」(Outcome-based pricing)**。例如,不是按人頭收費,而是按「成功解決的工單數」或「帶來的營收」收費。Palantir 就是這方面的佼佼者,他們敢於對客戶說:「如果我們沒解決問題,你不必付錢;解決了,我們要分一大筆」。

2. 五種新型態的護城河(Durability)

由於軟體的半衰期在 AI 時代變得極短,創業公司必須擁有以下至少一種「稀缺資產」才能確保持久性:

1. 網絡效應(Network Effects): 如 DoorDash,擁有消費者、餐廳和外送員的三方網絡,這不是靠寫程式就能輕易複製的。

2. 金流掌控(Money Movement): 當你的軟體不僅處理資訊,還處理金流(如 Square, Toast),轉換成本會大幅提高。

3. 硬體整合(Hardware): 軟硬整合(如 Toast 的 POS 機)增加了替換的物理門檻。

4. 稀缺資產或人脈(Scarcity): 例如 Sierra 這家公司,擁有像 Bret Taylor 這樣能讓任何 CEO 接電話的人物,這本身就是一種 Alpha。

5. 系統紀錄(System of Record): 成為數據的最終歸屬地。

3. 與「系統紀錄」的戰爭:遷移成本是關鍵

過去,AI 新創喜歡依賴 Salesforce 或 Slack 等大公司的 API 來建立「行動系統」(System of Action)。但現在,這些老牌巨頭意識到了威脅,開始切斷 API 或提高收費(如 Slack 切斷 Glean 的存取權)。

因此,AI 公司別無選擇,必須建立自己的「系統紀錄」,成為全端平台(Full Stack)。但這裡最大的挑戰是數據遷移(Migration)。Gokul 強調,除非你構建了強大的遷移工具,否則客戶不會為了新功能而放棄累積了十年的數據。這往往需要耗時一兩年,甚至雇用外包團隊專門處理舊系統的數據搬運,這才是真正的競爭壁壘。

——————————————————————————–

三、 廣告商業模式的終極型態

作為廣告技術的權威,Gokul 對於 OpenAI 等新興巨頭進入廣告市場有著獨到的見解。他認為,要建立成功的廣告業務,只有三條路徑:

1. 擁有珍貴的第一方用戶與場景: 如 Google(搜尋)和 Facebook(社交)。

2. 極致的成果交付(Outcome Delivery): 如 AppLovin,專注於推動「App 安裝」這一特定成果,並控制了供需兩端。

3. 排他性的需求端代理(Exclusive Provider): 如 The Trade Desk,幫助大品牌管理在 Google/FB 圍牆花園之外的預算。

ChatGPT 的恐怖潛力:意圖 + 身份

Gokul 認為 ChatGPT 若進入廣告市場,將擁有無與倫比的優勢。Google 擁有「意圖」(Intent,用戶搜尋什麼代表想買什麼),Facebook 擁有「身份」(Identity,用戶是誰)。而 ChatGPT 兼具兩者。

透過多輪對話,ChatGPT 不僅知道你在找什麼(意圖),還能從對話脈絡中拼湊出你是誰(身份)。這結合了搜尋的高轉化率與社群媒體的精準定位,是廣告人的終極夢想。

然而,挑戰在於「平衡」。廣告會稀釋用戶的參與度(Engagement)。Gokul 回憶在 Facebook 時,他們有嚴格的「參與度預算」(Engagement Budget),即為了換取營收,最多只能容忍用戶活躍度下降多少百分比。OpenAI 等新玩家必須謹慎處理這一點,或許可以考慮對高端用戶維持「零廣告」的承諾。

——————————————————————————–

四、 巨人的肩膀:向傳奇創辦人學習

Gokul 的職業生涯讓他得以近距離觀察矽谷最偉大的幾位領導者。他分享了這些傳奇人物的獨特之處:

1. Larry Page & Sergey Brin (Google):技術與規模的極致追求

Google 的基因是「技術優越性」與「規模」。Gokul 分享了 AdSense 的故事:當團隊為營收成長自豪時,Larry Page 卻感到失望,因為他們只佔了全網廣告的一小部分。Larry 在乎的不是賺多少錢,而是「Google 是否參與了全球每一個廣告的投放」。這種對 100x 規模的執著,造就了 Google 的霸業。

另一個經典案例是 AdSense 的審核機制。團隊原本花費半年建立了複雜的人工審核流程,卻被 Sergey Brin 一句話推翻:「為什麼要審核?讓他們直接上線,如果流量大了再審查。」Sergey 的邏輯是,不要在門口設卡,而是透過數據在事後進行風險控管。這奠定了 Google 自動化、自助服務(Self-serve)的基石,。

2. Mark Zuckerberg (Facebook):成長駭客與「學習」的超能力

Zuck 被譽為消費產品成長與互動的頂級大師。他能一眼看出產品流程中哪裡會降低用戶互動。但 Gokul 對他印象最深的是「透過跟隨來學習」(Learning by following)。

當年 Zuck 為了搞懂廣告,親自參與廣告團隊會議長達一年。著名的「自訂受眾」(Custom Audiences)功能,就是 Zuck 從 Zynga(當時最大的遊戲廣告主)的抱怨中獲得靈感而提出的。他將「遊戲公司想找大鯨魚玩家」的需求,轉化為「廣告主上傳客戶名單進行匹配」的通用功能,這成為了現代數位廣告的基石,,。

3. Jack Dorsey (Square):設計即是「消除摩擦」

Jack Dorsey 將設計提升到了商業策略的高度。好的設計不只是好看,而是「不需要說明書」。當時所有的 POS 機都需要培訓員工數天,只有 Square 是下載 App 就能用。

更重要的是,Jack 將設計思維應用到了「風險控管」上。傳統銀行在「申請時」進行嚴格審核(拒絕率高),Square 則是在「交易時」進行即時風控(接受率 95%)。這種將風險從「商家層級」轉移到「交易層級」的創新,本質上也是一種設計:消除了用戶進入的摩擦力,,。

——————————————————————————–

五、 給 AI 世代人才的職涯建議

在這個變動的時代,個人的職涯策略也需要調整。

1. 成為「AI 代理人的指揮官」

未來的管理者,管理的不是人類,而是 AI Agents。Gokul 預測,中階管理層將大幅減少。每位管理者應該要有「全職工作」,如果你的管轄範圍(Span of Control)少於 10 人,你就不該是個純管理者,而必須是個獨立貢獻者(IC),。

最有價值的技能,是成為某個領域的專家,並懂得編排(Orchestrate)一組 AI Agents 來完成該領域的工作。

2. 拒絕「職位跳跳虎」,擁抱長期主義

作為招聘經理,Gokul 直言「12 到 18 個月就換工作」是最大的紅燈,。在一家公司待的時間若不足 3-4 年,很難產生真正的影響力。在 AI 時代,建立深度、累積信任、並看到一個專案從頭到尾的成果,比以往任何時候都重要。

3. 在面試中展現「實作力」

別再只靠「說」來面試了。Gokul 建議,無論是設計師、PM 還是業務開發,都應該在面試中要求「工作專案」(Work Project)。給候選人一個實際的模糊問題(例如:Square 是否該收購這家公司?),看他們如何拆解問題。

最好的候選人甚至會「拒絕前提」。Gokul 曾遇過 PM 候選人被要求規劃某功能,結果他跑去街訪了 10 個客戶,回來報告說:「客戶根本不需要這個功能,我們應該做另一個。」這種具備客戶洞察與獨立思考的「代理權」(Agency),才是頂尖人才的標誌,。

——————————————————————————–

結語:在無限生產力中尋找價值

Gokul Rajaram 的分享為我們描繪了一個既充滿無限可能、又充滿雜訊的未來。當 AI 讓「製造」變得極其廉價,人類的價值便轉移到了「選擇」與「判斷」。

無論你是正在構建下一個獨角獸的創業者,還是試圖在職場中突圍的專業人士,核心問題不再是「我能建造什麼?」,而是「什麼值得被建造?」。在這個服務業的工業革命中,唯有深刻理解客戶痛點(Why)、具備獨特判斷力(Judgment)、並能善用 AI 槓桿的人,才能穿越週期,建立起真正的價值。

“The one thing that’s going to be truly future-proof is judgment.” — Gokul Rajaram

——————————————————————————–

(本文內容取材自 “Invest Like The Best” Podcast 訪談)

READ MORE
AI資訊分享Build School Learn2026-02-25
Share article:TwitterFacebookLinkedin
323 Views
49 Likes

OpenAI 平台工程主管親自揭密:AI 的未來兩年、軟體與AI人才的轉型與「一人十億美元公司」的真相

前言

為什麼我們Build School 的AI 與軟體人才培訓,除了軟體工程基礎(前/後端及DevOps)外,已完全擁抱 AI 及雲端呢? 從培訓起就開始上手 AI 工具及輔助開發呢? 以及為何 AI Agent 將會是軟體的未來延伸呢? 可看以下文章分析。

—————————-

在人工智慧技術飛速發展的今天,我們正處於一個技術典範轉移的關鍵時刻。OpenAI 的 API 與開發者平台工程主管 Sherwin Wu 近期在《Lenny’s Podcast》中進行了一場深度訪談,不僅分享了 OpenAI 內部的工程文化與 AI 使用現狀,更對未來 12 到 24 個月的 AI 發展趨勢做出了具體預測。

Sherwin 的觀點不僅僅是技術層面的分析,更涵蓋了管理哲學、創業生態系的重組,以及企業如何正確導入 AI 的策略。本文將這場長達一小時的訪談精華,整理為六大核心主題,為軟體工程師、管理者及創業者提供一份詳盡的未來指南。

——————————————————————————–

一、 工程師角色的演變:從「撰寫代碼」到「施展魔法」

軟體工程師的工作本質正在經歷前所未有的劇變。在 OpenAI 內部,這種變化已經成為現在進行式。

1. 驚人的內部數據:Codex 已經無所不在

Sherwin 透露了一個令人震驚的數據:在 OpenAI,95% 的工程師每天都在使用 Codex(AI 程式碼生成工具),且 100% 的 Pull Requests (PRs) 都會經過 Codex 的審查。這意味著每一行進入生產環境的程式碼,都有 AI 的參與。

這導致了一個顯著的生產力差異:經常使用 Codex 的工程師,其開啟的 PR 數量比不常使用的工程師多了 70%,而且這個差距正在持續擴大。這顯示出熟練掌握 AI 工具的工程師,其產出能力正在與傳統工作模式拉開巨大的鴻溝。

2. 工程師變身為「巫師」與「管理者」

Sherwin 引用了經典電腦科學教科書《SICP》(電腦程式的構造和解釋)中的隱喻,將程式設計比喻為「巫術」(Sorcery),而程式語言則是「咒語」(Incantations)。

在 AI 時代,這個比喻變得更加貼切。工程師不再需要逐行撰寫程式碼,而是向 AI 發出「咒語」(Prompt/指令),然後由 AI 去執行具體任務。這使得工程師的角色從「IC(獨立貢獻者)」轉變為「技術主管(Tech Lead)」或「管理者」。

現在的工程師更像是管理著一支「Agent 艦隊」的指揮官。他們可能同時開啟 10 到 20 個執行緒,指揮不同的 AI Agent 處理任務,並在過程中給予反饋和修正。

3. 「魔法師的學徒」與失控風險

然而,這種強大的槓桿效應也伴隨著風險。Sherwin 提到了迪士尼電影《幻想曲》中「魔法師的學徒」(The Sorcerer’s Apprentice)的故事:米老鼠偷戴了魔法帽,指揮掃把幫忙提水,結果卻因為無法控制而釀成大水災。

這正是當前「Vibe Coding」(憑感覺寫程式)的風險所在。當工程師讓 AI Agent 自動執行任務時,必須具備足夠的資歷與判斷力,以確保 AI 不會「脫軌」。這也是為什麼即便 AI 能寫程式,人類工程師的審查與架構設計能力反而變得更加重要。

——————————————————————————–

二、 「一人十億美元新創」的迷思與 B2B SaaS 的黃金時代

OpenAI 執行長 Sam Altman 曾預言,我們很快會看到由一人創辦的十億美元估值公司。Sherwin 對此提出了更深層的「二階與三階效應」分析。

1. 二階效應:B2B SaaS 的寒武紀大爆發

Sherwin 認為,如果一個人就能建立十億美元的公司,這意味著「建立軟體」的門檻已經大幅降低。這將導致一個**「B2B SaaS 的黃金時代」**。

為了支撐那一家「一人十億美元公司」,市場上可能會出現數百家小型新創,專門為這類公司打造客製化的軟體工具。我們會看到成千上萬家營收規模在 1000 萬到 5000 萬美元的小型軟體公司遍地開花。這些公司可能無法達到傳統創投追求的百倍回報,但對於創辦人個人而言,卻是極佳的財富自由途徑。

2. 支援服務的瓶頸與機會

儘管 AI 可以解決開發問題,但「客戶支援」(Customer Support)往往是擴張的瓶頸。Lenny 在訪談中質疑,光是處理大量的客訴單就足以讓一人公司崩潰。

Sherwin 則反駁,這正是上述「微型 SaaS」的機會點。未來可能會出現專門為特定利基市場(例如:專為 Podcast 經營者設計的 AI 客服系統)服務的新創公司。這些高度垂直整合的 AI 工具,將使得一人公司能夠外包絕大部分的營運工作,從而維持極精簡的人力編制。

——————————————————————————–

三、 AI 時代的管理哲學:賦能頂尖人才

隨著 AI 放大了個人能力的差距,管理者的角色與策略也必須隨之調整。

1. 10倍工程師變成 100倍工程師

AI 工具讓頂尖人才(Top Performers)的效率倍增。Sherwin 觀察到,那些積極擁抱 AI、具有高度主動性(High Agency)的員工,其生產力正在遠遠拋離其他人。

因此,管理者的策略應該是:將 50% 以上的時間花在這些頂尖人才身上,確保他們開心、沒有阻礙,並擁有所有需要的資源。這與傳統管理學有時強調「輔導落後者」的思維截然不同。

2. 外科醫生團隊模型

Sherwin 引用了《人月神話》(The Mythical Man-Month)中的「外科醫生團隊」概念:在手術室裡,只有主刀醫生在進行核心工作,其他護理師、麻醉師都是為了支援這位醫生而存在。

雖然軟體開發比手術更具協作性,但 Sherwin 傾向於讓團隊成員感覺自己就是那位「外科醫生」。管理者的工作是「預判轉角後的狀況」(Look around corners),在工程師遇到組織障礙或缺乏工具前,就先幫他們掃除障礙,就像遞上手術刀一樣自然。

3. AI 協助管理者擴大管理半徑

傳統軟體工程團隊的最佳管理跨度(Span of Control)約為 6-8 人。但在 AI 輔助下,管理者可以利用 AI 快速閱讀大量文檔、PR 和 Slack 訊息,掌握組織脈動與專案進度。這可能使管理者能夠有效帶領規模更大的團隊,甚至預測團隊未來可能遇到的瓶頸。

——————————————————————————–

四、 企業導入 AI 的陷阱:由下而上與「鷹架 scaffolding 」理論

許多企業在導入 AI 時面臨 ROI(投資報酬率)為負的窘境。Sherwin 指出,成功的關鍵在於導入的方式,以及對技術發展路徑的正確判斷。

1. 避免「由上而下」的強推

最糟糕的模式是 CEO 下令「我們要是 AI優先公司」,並強迫員工將 AI 納入績效考核,卻沒有實際的應用場景。

相反地,成功的企業通常結合了高層的支持與**「由下而上」(Bottom-up)的採用**。企業應該尋找內部對 AI 最有熱情的「傳教士」(可能是工程師,也可能是擅長 Excel 的營運人員),組成「老虎隊」(Tiger Team),由他們去探索具體的工作流,並在內部分享最佳實踐。

2. 警惕:「模型會把你的鷹架當早餐吃掉」

這是訪談中最具洞察力的金句之一。Sherwin 引用了 FinTool 創辦人 Nicholas 的觀點:「模型會吃掉你的鷹架(The models will eat your scaffolding for breakfast)」。

所謂的「鷹架」,指的是開發者為了彌補早期 AI 模型能力不足,而在模型周圍搭建的各種輔助框架(如複雜的 Agent Frameworks、向量資料庫 Vector Stores 等)。

• 歷史教訓: 2023 年時,大家認為必須依賴向量資料庫來提供上下文。但隨著模型 Context Window(上下文視窗)變大且檢索能力變強,直接將大量文件丟給模型處理(如 Skills / MD files)反而效果更好。

• 苦澀的教訓(The Bitter Lesson): 不要過度設計複雜的邏輯來引導模型,因為隨著算力提升和模型迭代,這些人為的邏輯往往會被更強大的通用模型所取代。

3. 給開發者的建議:為未來的模型而建

Sherwin 強烈建議開發者:「要針對模型未來的發展方向構建產品,而不是針對它們今天的限制。」。

如果你發現某個功能現在的模型只能做到 80%,別急著放棄或建立複雜的補丁。因為在 6 到 12 個月後,下一代模型可能直接就能完美解決這個問題。那些賭對方向的產品,會在模型升級瞬間獲得巨大的體驗提升。

——————————————————————————–

五、 未來 12-24 個月的 AI 預測

站在 OpenAI 的視角,Sherwin 對未來兩年的技術發展給出了具體預測,這些將是開發者和企業必須關注的重點。

1. 長時間運行的 Agent (Long-running Tasks)

目前的 AI 工具(如 ChatGPT 或 Cursor)主要優化的是「分鐘級」的互動任務。但在未來 12-18 個月內,我們將看到能夠穩定執行**「數小時甚至數天」**任務的 AI 模型。

這意味著工程師可以指派一個 AI Agent:「去幫我重構這個模組,跑完測試,修好 Bug,明天早上再跟我回報。」這種長時間的自主運作能力,將徹底改變軟體開發的工作流。

2. 多模態與語音(Audio)的崛起

雖然目前大家聚焦於文字(Coding),但 Sherwin 認為語音(Audio)是被嚴重低估的領域。隨著原生多模態模型(Native Multimodal Models)的進步,語音互動的延遲與品質將大幅改善。

考慮到世界上大量的商業活動、服務與營運都是透過「對話」進行的,高品質的語音 AI 將解鎖巨大的商業價值,特別是在企業服務領域。

3. 商業流程自動化(Business Process Automation)

這是一個相對「無聊」但在矽谷以外卻擁有巨大潛力的市場。軟體工程是開放式的知識工作,但世界上絕大多數的工作其實是**「高重複性、標準作業程序(SOP)」**的商業流程(如水電費處理、保險理賠、行政流程)。

Sherwin 非常看好利用 AI Agent 來自動化這些高確定性的流程。這不僅能提升效率,更能將人類從繁瑣的行政工作中解放出來。

——————————————————————————–

六、 OpenAI 的平台策略:做航空母艦而非掠食者

對於開發者最擔心的問題:「OpenAI 會不會推出跟我一樣的產品,把我消滅?」Sherwin 給出了定心丸。

1. 生態系優先

OpenAI 將自己視為平台公司,目標是建立生態系。Sherwin 強調,OpenAI 的使命是造福全人類,而單靠 OpenAI 一家公司無法觸及世界的每個角落(例如為特定小眾需求開發工具)。因此,他們需要廣大的開發者來填補這些空缺。

2. 開發工具堆疊

OpenAI 正在構建不同層次的抽象化工具,幫助開發者構建 Agent:

• Responses API: 最底層的接口,適合需要完全控制權的開發者,用於構建長時間運行的 Agent。

• Agents SDK: 中層框架,幫助開發者管理 Agent 的循環、子任務委派和護欄(Guardrails)。

• Agent Kit & Widgets: 最上層的 UI 組件,讓開發者能快速打造美觀的 Agent 介面。

Sherwin 的建議是:市場大到難以想像,不要過度擔心 OpenAI 的動作。那些失敗的新創通常是因為產品沒人要用,而不是被大公司壓垮。只要打造出用戶喜愛的產品,這片藍海容得下所有人。

——————————————————————————–

結語:不要視為理所當然

在訪談的最後,Sherwin 感性地表示,我們正處於科技業最令人興奮的時期。從 2014 年進入職場以來,他從未見過如此充滿活力的時刻。未來 2-3 年將是 AI 創新最密集的階段。

他的最終建議很簡單:「參與其中(Engage with it)」。無論你是不是軟體工程師,都應該去下載 Codex、試用 ChatGPT 的進階功能、將 AI 連接到你的工作流中。不要只是旁觀,因為這波浪潮將重新定義工作的本質。

在這個 AI 的黃金時代,正如 Sherwin 所言,我們都是手握強大咒語的現代巫師。關鍵在於,你是否準備好拿起魔杖,去創造屬於你的價值?

(本文內容整理自 Lenny’s Podcast 訪談:OpenAI’s head of platform engineering on the next 12-24 months of AI | Sherwin Wu)


  • 🎓 [精選 AI 課程] 這裏查詢更多 https://learn.build-school.com/zh-hant/filter-course-page/
  • 【各行業領域知識工作者】商業應用及各領域工作情境 : ChatGPT / Gemini /M365 Copilot 產業應用情境與案例
  • 【技術/工程人員】AI 驅動開發:從構思到上線 – GitHub Copilot 企業開發實戰
  • 【AI 應用及AI Agent】Azure AI Foundry / OpenAI / Gemini / Claude 等模型與雲端平台
  • 【認證課程】微軟 Azure AI 工程師(AZ102)、Azure 系統管理員(AZ104)、系統架構師(AZ300)、資安、GitHub 開發相關認證
  • 完整微軟認證學習地圖:https://learn.build-school.com/zh-hant/microsoft-cert-learning-roadmap/
READ MORE
AI資訊分享Build School Learn2026-02-25
Share article:TwitterFacebookLinkedin
244 Views
46 Likes

軟體行業的第五次浪潮:AI 應用的黃金時代與商業模式的終極重塑

這篇文章深入探討了 AI 應用層的商業模式變革、護城河構建以及未來的投資邏輯。來源: 根據 Andreessen Horowitz (a16z) 合夥人 Alex Rampell 的觀點以及影片內容所整理的深度專業部落格文章。

由 AI 驅動的第五次軟體浪潮,指出我們正處於人工智慧應用發展的黃金時代。說明了 AI 原生公司 如何透過專有數據壁壘與端到端工作流,在法律、醫療與金融等領域建立強大的競爭護城河。專家強調,目前的趨勢已從單純的軟體工具轉向直接替代或增強勞動力,這將徹底改變企業的定價邏輯與獲利模式。此外,文中分析了圍牆花園策略的重要性,強調擁有大模型無法獲取的獨家數據是新創企業生存的關鍵。最終,這波變革不僅重塑了軟體產業的典範,更為消費者與企業端帶來了前所未有的市場擴張與生產力提升。

  • 軟體業第五次浪潮與前四次有何不同?
  • AI如何從「節省成本」轉向「創造收入」?
  • 為何專有數據是AI時代最重要的商業護城河?

——————————————————————————–

前言:我們正處於「美好的舊時光」

如果你現在能擁有一台時光機,回到 15 或 20 年前,買入 Salesforce、Shopify、ServiceNow 這些公司的股票,你將擁有一個回報率驚人的投資組合。那是雲端計算(Cloud Computing)剛剛開始吞噬傳統本地部署軟體(On-Premise)的時代。

今天,我們正站在一個類似、甚至更為宏大的歷史節點上。

a16z 合夥人 Alex Rampell 將其稱為軟體行業的「第五次浪潮」。回顧 1977 年至 2023 年的納斯達克指數,我們可以清晰地看到前四次週期:PC 時代、網際網路時代、雲端計算時代,以及移動互聯網時代。每一次浪潮都誕生了新的基礎設施巨頭和應用巨頭。而現在,隨著 ChatGPT 等生成式 AI 的普及,我們正式進入了 AI 應用時代。

這不是未來的預測,而是正在發生的現實。這篇文章將深入剖析這場變革的核心邏輯,探討企業如何在這場範式轉移中建立真正的護城河,以及為什麼「替代勞動力」而非「軟體競爭」將成為最大的商業機會。

——————————————————————————–

一、 範式轉移:從 SaaS 到 AI Native 的「綠地機會」

AI 時代的到來並非憑空出現,它是建立在智慧型手機普及和雲端計算成熟的基礎之上的。這使得 AI 的採用速度遠超以往任何一次技術浪潮。然而,在這場競賽中,傳統軟體巨頭與新興 AI 原生(AI Native)公司之間的博弈顯得尤為精彩。

1. 為什麼傳統軟體難以轉身?

就像當年的本地部署軟體公司難以轉型為雲端公司一樣,現在的傳統 SaaS 公司在轉向 AI Native 時也面臨巨大挑戰。這不僅僅是技術問題,更是商業模式的衝突。傳統軟體習慣了一次性授權或基於「席位(Seat)」的訂閱模式,而 AI 的商業邏輯可能完全不同。

Alex Rampell 提出了一個「賓果卡(Bingo Card)」的概念:企業資源規劃(ERP)、客戶關係管理(CRM)、客戶支援、機器人流程自動化(RPA)等每一個傳統軟體類別,都存在被 AI 原生公司重新定義的機會。

2. 綠地(Greenfield)策略:不爭搶,只創造

對於新創公司而言,直接從 Salesforce 或 Workday 手中搶奪現有客戶(Brownfield 機會)是極其困難的。因為這些大公司擁有極強的「鎖定效應」——最好的公司擁有的是「人質」而非僅僅是客戶。一旦企業的記錄系統(System of Record)建立,遷移成本極高。

因此,AI 原生公司的機會在於「綠地」。

以 Mercury Bank 為例,它並沒有試圖從矽谷銀行手中搶走現有客戶,而是專注於服務那些剛剛成立的新創公司。同樣地,AI 原生 ERP 公司(如 Rippling 投資的相關企業)鎖定的是那些成長到 50 人規模、剛剛需要從 QuickBooks 遷移到更複雜系統的企業。在這個「轉折點」上,客戶會自然地選擇市場上最先進的產品,而不會被舊系統束縛。

——————————————————————————–

二、 商業模式的躍遷:軟體開始替代勞動力(Service-as-a-Software)

這是本輪 AI 浪潮中最令人興奮的變革:軟體的市場邊界正在被無限擴大,因為它不再只是與其他軟體競爭,而是在與人力成本競爭。

1. 突破價格天花板

傳統軟體市場受限於企業的 IT 預算,通常每個席位每年幾百到幾千美元。但勞動力市場的成本是每年幾萬甚至幾十萬美元。

讓我們看一個具體的例子:一家眼科診所招聘前台接待,年薪 4.7 萬美元。如果有一款軟體能完成其中 50% 的工作,診所絕不會只願意付 500 美元(傳統軟體價格),但也不會付 4.7 萬美元。他們可能願意支付 2 萬美元。這就創造了一個介於傳統軟體和全職人力之間的全薪定價區間,一個以前根本不存在的巨大市場。

2. 案例分析:EvenUp(法律科技的降維打擊)

a16z 投資的 EvenUp 是這一趨勢的完美註腳。它服務於人身傷害案件的原告律師。這是一個特殊的市場:律師按勝訴金額抽成,而非按小時計費。

• 痛點: 處理醫療記錄、起草索賠信需要大量高技能人力。

• AI 價值: EvenUp 不僅僅是節省時間,它能通過 AI 分析大數據,告訴律師哪個案子值 5 萬美元,哪個值 500 萬美元,並自動生成索賠文件。

• 收入增長而非成本節約: 如果 AI 能讓原告律師的效率提升 5 倍,他們的收入就能增長 5 倍。這種「增強人類」而非單純「替代人類」的模式,使得軟體可以直接分享業務增長的紅利。

• 擴大市場: 以前律師只接預期收益 5 萬美元以上的案子,現在因為 AI 降低了處理成本,5000 美元的案子也能接了,這解決了法律服務供需失衡的問題。

3. 案例分析:Sloane(解決高流失率的髒活累活)

Sloane 專注於汽車貸款催收和保險理賠。這是一份沒人喜歡的工作:員工整天被罵,流失率高達 40%-70%。

• AI 的優勢: AI 不會累,不會被罵哭,而且能精確記住全美 50 個州的每一條法律法規(這對合規至關重要)。

• 結果: 催收率提高了 50%。

• 價值主張: Sloane 賣的不是「催收軟體」,而是「更高的回款率」和「無法律風險」。這讓企業無法拒絕。

——————————————————————————–

三、 護城河的構建:圍牆花園與專有數據

在生成式 AI 時代,構建軟體變得異常容易。利用 Cursor 或其他 AI 輔助編程工具,競爭對手可以迅速複製你的功能。那麼,企業如何構建持久的護城河?

答案在於:專有數據(Proprietary Data)。

Alex Rampell 用了一個生動的「農場與餐廳」的比喻:OpenAI 就像種菜的農場,如果你只是買它的菜(API)來做菜(應用),那麼當農場決定自己開餐廳時,你就死定了。但如果你擁有獨家的食材(數據),也就是 OpenAI 訓練數據中沒有的東西,你就擁有了護城河。

1. 什麼是真正的專有數據?

這不僅僅是公開數據,而是經過數位化、整理、或通過獨家授權獲得的「高價值資訊」。

• Open Evidence(醫療): 雖然 ChatGPT 閱讀過互聯網上的醫療資訊,但 Open Evidence 獨家授權了《新英格蘭醫學雜誌》等頂尖期刊。醫生需要的是基於權威文獻的「循證醫療」,而不是 GPT 可能產生的幻覺。這就是「獨家食材」。

• vLex(法律): 這家公司收購並數位化了西班牙所有的法律記錄。如果律師需要一份基於西班牙判例的備忘錄,通用大模型做不到,只有 vLex 能做到。這讓他們從「按月收費」轉向了「提供高價值成品」的高溢價模式。

• Acel(採購): 擁有成千上萬份舊合同數據,能告訴你在談判中該在哪些條款上施壓。這種隱性知識是大模型無法從公開網絡上獲取的。

2. 數據的飛輪效應

以 EvenUp 為例,它處理的每一個案件都在生成新的、非公開的數據(比如某類案件的平均賠償額)。這些數據反過來優化了模型,使其估值更準確,從而吸引更多律師使用。這是一個大模型公司無法觸及的數據閉環。

——————————————————————————–

四、 戰略格局:模型會吞噬應用嗎?

這是一個讓所有創業者焦慮的問題:OpenAI 或 Google 會不會親自下場做應用,把大家都滅了?

a16z 的觀點是:應用層不會被模型層吞噬,聚合器(Aggregator)將成為贏家。

1. 聚合器的價值

就像買機票時,我們更喜歡用 Expedia 或 Skyscanner 而不是單獨去每一家航空公司網站搜索一樣,用戶需要一個能訪問所有模型的統一介面。 不同的模型有不同的專長(有的擅長寫程式碼,有的擅長創意寫作)。在開發工具或創意工具中,用戶希望能在同一個工作流中調用最佳的模型。這種「模型聚合」本身就創造了巨大的價值,而單一模型廠商(如 Google 或 OpenAI)受限於自身利益,很難做到這一點。

2. 企業與消費者的並行機會

在消費者(Consumer)AI 領域,我們看到了同樣的趨勢:

• AI 原生工具的崛起: 年輕的設計師開始首選 Kittl 或 Canva 這樣的 AI 原生工具,而不是 Photoshop。就像雲端時代的新用戶首選 Google Docs 一樣。

• 品類創造: ElevenLabs 創造了「語音 AI」這個全新的消費級品類,這在五年前根本不存在。

• 數據驅動的垂直整合: Slingshot 透過 AI 抄寫員收集治療師的對話數據(在隱私保護下),訓練出專門的心理治療模型,進而推出面向消費者的 AI 治療師應用。這種從 B 端數據積累反哺 C 端產品的路徑,是通用模型無法複製的。

——————————————————————————–

五、 結論:軟體主導的未來

我們正在經歷的這場變革,速度之快前所未有。在傳統軟體時代,一家公司從主導到被淘汰可能需要五年,但在 AI 時代,如果沒有真正的護城河,被顛覆可能只在朝夕之間。

未來的贏家將具備以下特徵:

1. AI 原生(AI Native): 從第一天起就基於 AI 架構設計,而不是在舊系統上打補丁。

2. 擁有專有數據(Proprietary Data): 構建「圍牆花園」,擁有大模型無法獲取的獨家資訊。

3. 重新定義工作流(End-to-End Workflow): 不只是提供工具,而是接管整個工作流程,直接交付結果(Outcome)。

4. 按價值定價(Value-Based Pricing): 擺脫席位費的束縛,根據創造的經濟價值或節省的勞動力成本收費。

正如 Alex Rampell 所言,很多時候我們並未意識到自己正生活在歷史的關鍵時刻,直到時光流逝。AI 驅動的產品週期不再是中心化的,而是由軟體主導的,這賦予了技術人員前所未有的創造力。

對於投資者和創業者來說,這不是關於「AI 是否會取代人類」的恐慌,而是關於如何利用 AI 擴展服務邊界、解決供需失衡、並創造全新市場類別的機遇。

AI 應用的黃金時代,才剛剛開始。

——————————————————————————–

本文取材自 a16z YouTube 影片 – https://youtu.be/3XVDtPU8xKE

READ MORE
AI資訊分享Build School Learn2026-02-24
Share article:TwitterFacebookLinkedin
536 Views
44 Likes

OpenAI 發佈 GPT‑5.3‑Codex 及實戰解讀:它不只會寫程式,還開始「幫你把整個工作做完」

如果你過去用過「會寫程式的 AI」,大概都遇過同一種痛:小段程式碼很神,但一進到真實專案(要跑測試、要改設定、要看 log、要部署、要修回歸),就開始卡在流程與工具鏈。OpenAI 在 2026/02/05 推出 GPT‑5.3‑Codex,傳遞的訊息很直接:Codex 不再只做「寫/審程式碼」,而是往「可以在電腦上完成幾乎所有開發者與專業人士日常工作」的方向前進。

一、先用一句話理解:它想成為你的「代理型同事」

GPT‑5.3‑Codex 被描述為把 GPT‑5.2‑Codex 的程式設計能力,加上 GPT‑5.2 的推理與專業知識能力,再把速度提升約 25%,目標是處理研究、工具操作、複雜執行流程等長時間任務。你可以一邊讓它做事、一邊插話調整方向,而不太容易把前面討論的脈絡弄丟。

把它想成一位「你可以隨時打斷、請它回報進度、讓它拆子任務」的同事,會比把它當成聊天機器更貼近它的設計目標。尤其當你要做的事不是單一檔案的修改,而是跨 repo、跨環境、跨多步驟(例如:修 bug→補測試→跑 CI→調整設定→打包→部署→驗證),代理能不能穩定地把流程跑完才是重點。

二、基準測試不是炫技:它們對應到你每天在做的苦工

原文點名 SWE‑Bench Pro、Terminal‑Bench 2.0、OSWorld 與 GDPval。你不需要死背每個名字,但可以把它們對應到「你每天在做什麼」。

1) SWE‑Bench Pro:把你丟進真實專案,看你能不能修到 test 過

SWE‑Bench Pro 以真實世界軟體工程為基礎、評估嚴謹,涵蓋四種程式語言(不像只測 Python 的 SWE‑bench Verified)。這類測試更像:給你一個既有 repo、一堆上下文,請你修 bug 或完成變更,並讓驗收條件成立。

你會感受到的提升場景:

  • 修回歸:某個 PR 合併後出現邊界 bug,得找根因、補測試
  • 升級依賴:框架大版本升級導致多處破壞性變更
  • 跨語言協作:後端/前端/腳本混在一起的專案維護

2) Terminal‑Bench 2.0:終端機能力才是「代理」能不能落地的關鍵

Terminal‑Bench 2.0 用來評估編碼代理的終端操作能力。講白一點:會不會用 terminal 跑指令、看輸出、改設定、重試、逐步逼近成功。這個能力一旦上來,你就能把「我貼給你錯誤訊息,你回我一段建議」升級成「你自己跑、自己看、自己修、自己再跑一次」。

原文也提到它在達成成果時使用的 Token 更少,代表在長任務的成本與可持續性上更有利(同樣預算可跑更多輪迭代)。

3) OSWorld:它開始能「看著桌面」做事

OSWorld 是讓智慧體在視覺化桌面環境中完成生產力任務的基準。工程師不一定每天都在桌面上拖拉點按,但你一定做過類似事情:打開工具、找資料、填表、整理輸出、把結果貼回系統。當代理能處理這類「電腦操作」能力,許多零碎但耗時的工作就有機會被半自動化。

4) GDPval:不只寫程式,還要做簡報、試算表與各種交付物

GDPval 用來衡量跨 44 種職業的明確知識工作任務表現(例如建立簡報、試算表等成品)。對工程團隊來說,這意味著你可以把「交付物」一起交給代理:PRD 初稿、風險清單、測試計畫、上線公告、指標報表草稿、RCA 模板等。

5) 直接看數字(同為 xhigh 推理強度)

原文給了一個清楚的對照表,這裡用工程師常用的「重點列點」整理:

  • SWE‑Bench Pro(公開):GPT‑5.3‑Codex 56.8%(略高於 GPT‑5.2‑Codex 56.4%、GPT‑5.2 55.6%)
  • Terminal‑Bench 2.0:77.3%(相較 64.0%、62.2% 是顯著提升)
  • OSWorld‑Verified:64.7%(相較 38.2%、37.9% 大幅提升)
  • GDPval(勝出或平局):70.9%(與 GPT‑5.2‑Codex 持平)
  • Capture‑the‑Flag:77.6%(相較 67.4%、67.7% 提升)
  • SWE‑lancer IC Diamond:81.4%(相較 76.0%、74.6% 提升)

你可以這樣解讀:程式能力是穩定進步,但更「有感」的提升會出現在終端操作與桌面任務這種代理必備能力,因為那直接影響你能不能把任務整段丟給它跑。

三、網頁開發示例:為什麼它看起來更像「可直接上線的起點」

原文展示它能在數日內從零建立複雜遊戲與應用,並且能靠通用跟進提示詞(像「修正錯誤」「改善遊戲」)反覆迭代,甚至使用數百萬 Token 自主打磨內容。你不一定要拿來做遊戲,但你一定做過這些事:

  • 做一個 landing page、加上收信表單與 FAQ
  • 做個內部工具介面、串 API、加權限與日誌
  • 做個 demo 讓 PM、設計、業務可以快速對齊方向

原文也提到一個很貼近產品工作的細節:在同樣「登陸頁」需求下,GPT‑5.3‑Codex 會自動把年費換算為「折扣後月費」的呈現方式,讓優惠更直覺;也會做出更完整的推薦輪播,讓初版看起來更接近可上線狀態。這種「預設更懂產品語境」的差異,會讓你在第一輪就少很多來回。

工程師實作建議:把需求寫成「可驗收」的清單,而不是只有風格描述。舉例:

  • 必須有 E2E 測試覆蓋主要路徑(登入、付款、設定等)
  • 可及性基本盤(鍵盤可操作、focus state、語意化結構)
  • 效能預算(例如首屏資源大小、圖片壓縮策略)
  • 事件追蹤規格(曝光、點擊、轉換)

四、互動方式的改變:更像 pair programming,但對象是「會跑流程的代理」

OpenAI 強調互動協作:模型會更頻繁提供更新,讓你不用等到最後才發現走偏;你可以在過程中提問、討論做法、調整方向。這對工程師很重要,因為代理做長任務時最怕兩件事:

  • 悶著頭跑太久:最後結果不符合你要的,回頭全砍重來。
  • 在關鍵點做了高風險操作:例如改了權限、動了資料、部署到 production。

比較務實的做法是:把「你一定要看的點」插到流程裡。像是:開始前先確認任務拆解、動到資料前先列出 migration 計畫、部署前先列出回滾方案、上線後先看監控儀表板與告警門檻。

五、OpenAI 內部怎麼用:把代理拿來除錯訓練流程、追問題、做資料分析

原文提到 GPT‑5.3‑Codex 是第一個在打造自身過程中發揮關鍵作用的模型:早期版本被用來除錯訓練流程、管理部署、診斷測試與評估結果;工程面也拿來找上下文渲染錯誤、追快取命中率偏低原因、甚至在發布期間協助動態擴展 GPU 叢集以扛住流量高峰。

如果你想在公司內複製這種收益,建議選一個你們真的痛、而且每週都在發生的工作當切入點,例如:

  • 把「CI 失敗分類 + 建議修法」半自動化(先從建議開始,不要直接自動 merge)
  • 把「事件後 RCA 草稿」自動產生(log/指標/時間線整理)
  • 把「版本升級影響範圍掃描」自動化(找 API 變更、deprecated 用法)

六、資安段落務必讀:能力變強,同時也更需要「可信存取」與監控

原文指出,GPT‑5.3‑Codex 在應變整備框架下被歸類為可用於資安任務的「高能力」模型,也提到它是第一個直接受訓用來識別軟體漏洞的模型。即使目前沒有明確證據顯示能端到端自動化網路攻擊,仍部署了更全面的防護機制(安全訓練、自動化監控、進階功能的可信存取、結合威脅情報的執行管道等)。

工程師角度的重點是:你在公司內把代理接上工具鏈(repo、CI、雲端、資料庫)之後,它就具備「實際影響系統」的能力。此時你應該把它當成新成員 onboarding 一樣,給它最小權限、把操作都記錄下來、在高風險動作前要確認、並且要能回滾。

最小可行的安全做法(建議從第一天就做):

  • dev/staging/prod 權限分離,prod 預設只讀或禁止寫入
  • 金鑰與機密資料不直接暴露給代理(用短時效憑證、代管存取)
  • 所有外部寫入(推 PR、發版、改設定、建立資源)都要有審核點
  • 保留完整操作記錄,包含它「為什麼這樣做」的理由與替代方案

七、我該怎麼開始試?一個工程團隊可落地的試點清單

原文提到 GPT‑5.3‑Codex 可透過付費 ChatGPT 方案使用,支援 Codex 平台(應用程式、CLI、IDE 擴充功能、網頁版),並正準備在確保安全前提下開放 API。這意味著你可以先用「非侵入式」方式試點:先不接 production,不給高權限,先從輸出建議與草稿開始。

兩週試點建議(工程師版):

  1. 選一條穩定痛點流程:例如 CI 失敗診斷、回歸修復、依賴升級。
  2. 定義成功指標:修復時間縮短、來回澄清次數減少、PR throughput 提升。
  3. 把需求寫成模板:輸入(log/錯誤/限制)→輸出(修法、測試、風險、回滾)。
  4. 建立審核點:只允許它產生 PR 草稿,合併必須人工批准。
  5. 回收案例:把成功與失敗的提示詞整理成團隊內部手冊。

未來趨勢

  • 代理會從「寫 code」走向「跑完整流程」:包含工具操作、文件產出、測試與部署,逐步變成可重複使用的工作流。
  • 資安與合規會跟著代理一起產品化:可信存取、審計、監控、最小權限將成為標配,不再是選配。

給專業人士的實務建議

  • 先把它當成「很會做事的實習生」:讓它做草稿與建議、你做審核與決策;等流程穩了再逐步給更多權限與自動化範圍。
  • 把品質門檻寫出來:測試、效能、可及性、回滾、風險清單都要在同一份輸出裡,否則你只是把工作換個地方做。

參考資料

  • OpenAI Blog – https://openai.com/zh-Hant/index/introducing-gpt-5-3-codex/
  • GPT‑5.3‑Codex 系統說明卡(2026/02/05)
READ MORE
  • 1
  • 2
  • 3
  • …
  • 9
Search
Recent Posts
  • AI 時代產品人的新修煉:為何「主動性」比「技能」更關鍵 – 深度解析 Notion 產品負責人 Max Schoening 的產品建構哲學
    AI 時代產品人的新修煉:為何「主動性」比「技能」更關鍵 – 深度解析 Notion 產品負責人 Max Schoening 的產品建構哲學
    2026-05-04
  • 【深度解讀】OpenAI 總裁 Greg Brockman 最新對談:邁向 AGI 的進程與「人類注意力」的稀缺時代
    【深度解讀】OpenAI 總裁 Greg Brockman 最新對談:邁向 AGI 的進程與「人類注意力」的稀缺時代
    2026-05-04
  • 邁向通用人工智慧 (AGI) 的架構與科學發現的新紀元:Google DeepMind CEO Demis Hassabis 專訪深度解析
    邁向通用人工智慧 (AGI) 的架構與科學發現的新紀元:Google DeepMind CEO Demis Hassabis 專訪深度解析
    2026-05-04
  • AI 時代:「智能體工程」崛起,你的「理解力」是無法被取代的
    AI 時代:「智能體工程」崛起,你的「理解力」是無法被取代的
    2026-05-04
  • 【深度洞察】Builder 構建者時代降臨:Claude Code 之父 Boris Cherny 解析 Agentic AI 的未來
    【深度洞察】Builder 構建者時代降臨:Claude Code 之父 Boris Cherny 解析 Agentic AI 的未來
    2026-05-01
Tags
Agent AI AI900 AI GPT企業共用版 AI GPT學校共用版 AZ900 ChatGPT Claude模型 Copilot DAX query GitHub Copilot Google Gemini模型 gpt-image-1模型 Microsoft Certification PL900 Power BI Registration SC900 平台使用教學 微軟 Microsoft Azure OpenAI 微軟認證 生成式 AI GPT 學校共用版 自主學習 註冊方法 類似 ChatGPT介面
Build School Logo

We support corporate clients in driving business success, while empowering AI-driven knowledge workers to achieve their career goals.

FacebookInstagramYoutube

Useful links

AI One-stop shop Services

AI Subsidy Program

Microsoft Certificate/Certiport Testing Center

Blog : AI Insightful

About Us | FAQ

Service Terms and Conditions

Privacy Policy

Learning

Microsoft Certification Learning Roadmap

Azure / Azure DevOps Exam

Power Platform Exam / Power BI

Cyber Security

AI (ChatGPT/Gemini/Copilot/Azure AI/GitHub Copilot)

AI, Cloud, Software Engineering Bootcamp – Taipei/HsinChu

Contact Us

11Fl.-1, No.96, Sec.3, Chung Hsiao E. Rd., Taipei, Taiwan

Live Chat Messenger

bslearn@mail.build-school.com

© Copyright 2025 by Build School 青杉人才 | 青群科技. All rights reserved.

Our website uses cookies to provide you the best experience. By continuing to use our website, you agree to our use of cookies. More information,

Login

Please register and login by your Google or Microsoft account.

請使用第三方身份驗證服務進行登錄。

Continue with Google
Continue with Microsoft
Lost Your Password?
Build School Logo
Register
Don't have an account? Register one!
Register an Account
  • English
  • 繁體中文 (Chinese (Traditional))
  • 日本語 (Japanese)