
邁向通用人工智慧 (AGI) 的架構與科學發現的新紀元
Demis Hassabis 擁有科技界最非比尋常的職涯歷程之一。從小作為國際象棋神童,他在 17 歲時就設計了首款暢銷電子遊戲《主題樂園》(Theme Park),隨後重返校園取得認知神經科學博士學位,發表了關於大腦記憶與想像力運作機制的基礎研究。2010 年,他共同創辦了 DeepMind,使命只有一個:解決智能問題 (solve intelligence)。此後,他的實驗室實現了許多人們以為還要數十年才能達成的里程碑,例如 AlphaGo 擊敗圍棋世界冠軍,以及解決了生物學 50 年來的重大挑戰——蛋白質結構預測的 AlphaFold,並將其免費提供給全球科學家使用,這項工作更讓他贏得了去年的諾貝爾化學獎。
如今,作為 Google DeepMind 的負責人,Demis 正在帶領團隊打造 Gemini,並持續朝著他青少年時期設定的目標邁進:通用人工智慧 (AGI)。在近期的專訪中,他深入探討了 AGI 的架構、記憶機制、代理系統 (Agents) 的未來,以及 AI 將如何帶來下一波巨大的科學突破。本文將全面摘要並解析這場訪談的核心精華。本文深度彙整自 Google DeepMind CEO Demis Hassabis 於 Y Combinator 訪談中的精華洞見。從 AGI 的底層架構到科學革命的開端,AI 將以我們難以想像的速度重塑這個世界。
原始影片
一、 AGI 的最終架構:我們還缺少什麼?
當我們審視當前的 AI 典範——大規模預訓練 (large scale pre-training)、基於人類回饋的強化學習 (RLHF) 以及思維鏈 (chain of thought) 推理,許多人好奇這是否就是 AGI 的最終架構。Demis 肯定地表示,這些組件絕對會是最終 AGI 架構的一部分。AI 技術已經取得了長足的進步,並證明了其強大的能力,他無法想像我們會在幾年後突然發現這是一條死胡同。
然而,要達到真正的 AGI,我們可能還缺少一兩個關鍵的拼圖。目前尚未解決的難題包括:持續學習 (continual learning)、長期推理 (long-term reasoning) 以及記憶的某些層面。此外,如何讓系統在各個領域的表現更加一致,也是一項挑戰。Demis 認為,現有的技術或許可以透過規模化擴展與漸進式創新來達成 AGI,但也可能還有一兩個重大理念需要被攻克。他對這兩種可能性的預測大約是五五波,因此 Google DeepMind 同時在兩方面並進研發。
在他的時間表中,AGI 的出現大約落在 2030 年左右。這意味著,如果你現在開始一段深科技 (deep tech) 的創業旅程,你必須將 AGI 在旅程中途出現的可能性納入考量。
二、 記憶機制與持續學習的腦神經啟發
目前在與代理系統互動時,開發者往往會發現模型不斷重複使用相同的權重,這使得「持續學習」的概念變得尤為重要。目前的做法大多像是用封箱膠帶勉強拼湊起來的,例如透過夜間的「夢境循環」(dream cycles) 等方式來處理。
擁有認知神經科學背景的 Demis 指出,這與大腦海馬迴 (hippocampus) 的運作方式有著異曲同工之妙。大腦能夠極其優雅地將新知識整合到現有的知識庫中。在睡眠期間,尤其是 REM 睡眠階段,大腦會回放重要的事件片段,以便我們從中學習。事實上,DeepMind 早在 2013 年開發的第一個雅達利 (Atari) 遊戲程式 DQN,就是借鑑了神經科學中的「經驗回放」(experience replay) 技術,透過多次回放成功的軌跡來掌握遊戲。
現今的 AI 模型往往依賴將所有資訊硬塞進極大的上下文窗口 (context window) 中,Demis 認為這種做法並不令人滿意。雖然機器沒有生物大腦的限制,理論上可以擁有數百萬甚至數千萬的上下文窗口並完美儲存,但要從中查找並找出對當下決策真正相關的資訊,仍然需要耗費巨大的運算成本。
比起人類工作記憶平均只能記住大約 7 到 12 個數字,百萬級別的上下文窗口確實已經非常龐大。但問題在於,我們現在試圖把所有東西,包括不重要的或錯誤的資訊,都用暴力破解 (brute force) 的方式塞進去,這顯然不是正確的方向。再者,如果要處理即時影片,一百萬個 Token 大約只能涵蓋 20 分鐘的內容;如果希望系統能理解你一兩個月內的生活動態,現有的上下文窗口容量是遠遠不夠的。因此,在記憶領域還有極大的創新空間。若無法突破持續學習的瓶頸,代理系統將難以完美適應使用者所在的特定情境,這也是目前阻礙代理系統自動完成複雜任務的關鍵。
三、 強化學習的復興與代理系統 (Agents) 的崛起
DeepMind 在歷史上一直非常重視強化學習 (RL) 和搜尋演算法,例如 AlphaGo、AlphaZero 和 Muse。Demis 認為,強化學習的潛力目前在業界可能被低估了。從創立之初,DeepMind 就致力於代理系統的研究,從 Atari 到 AlphaGo 再到星海爭霸 (StarCraft) 的 AlphaStar,他們開發的都是能夠自主達成目標、做出主動決策和計畫的系統。
過去幾年的重點在於將這些在遊戲領域取得成功的模型,泛化為世界模型 (world models) 或語言模型。但有趣的是,現今最先進模型所具備的「思考模式」和思維鏈推理,其實正是當年 AlphaGo 開創性技術的延續。DeepMind 正以更通用的方式,在大規模模型上重新審視過去的舊概念,包含蒙地卡羅樹搜尋 (Monte Carlo tree search) 以及其他增強強化學習的方法。這些源自 AlphaGo 和 AlphaZero 的點子,對於當今基礎模型的發展至關重要,我們將在未來幾年看到這些技術帶來的巨大進展。
針對當前熱門的「代理系統 (Agents)」,Demis 強調,要達到 AGI,我們必須擁有能夠主動為人類解決問題的活躍系統,因此代理系統絕對是通往 AGI 的必經之路。儘管外界對代理系統充滿炒作,他認為這一切才剛剛開始。
目前,大家都在摸索如何將這些系統融入日常工作流程,而不僅僅是個「有了很棒」的玩具。技術大約在最近幾個月才剛達到足以真正提供價值的水平。雖然代理系統能將過去需要六個月開發的遊戲雛型縮短到半小時內完成,但這仍然需要人類的「靈魂」、品味和工藝。我們尚未看到由純 AI 生成的「AAA 級遊戲」霸佔應用程式商店排行榜,這表示目前在流程或工具上仍有缺失。Demis 預期在接下來的 6 到 12 個月內,我們會看到真正的價值爆發,初期將由工程師或創作者透過代理系統將生產力提升千倍來達成,隨後才會邁向更高程度的完全自動化。
四、 模型推論能力、蒸餾技術與開源策略
在推理 (Reasoning) 能力方面,現有的模型雖然能展現令人印象深刻的思維鏈,但仍會在聰明的大學生不會犯錯的地方栽跟頭。Demis 認為,目前的思考典範仍有很大的創新空間,做法仍然偏向簡單暴力。例如,目前缺乏對思維鏈的監控機制,無法在思考過程中途介入。
他觀察到系統有時會「過度思考」甚至陷入無限迴圈。以 Gemini 下西洋棋為例,這些頂尖模型在遊戲中的表現往往不盡理想;你可以輕易地從其思考軌跡中發現,模型有時會考慮某步棋,意識到這是一個嚴重的失誤 (blunder),但因為找不到更好的走法,最終還是選擇了那步錯誤的棋。這種情況在一個精密的推理系統中是不該發生的。
這導致了模型表現出「參差不齊的智能」(jagged intelligence):它可以在國際數學奧林匹亞 (IMO) 級別的難題中拿下金牌,但如果以特定方式提問,它卻會犯下小學程度的數學或推理錯誤。Demis 認為,這似乎表明模型缺乏對自身思考過程的「內省能力」(introspection),只需要一兩個關鍵的微調,或許就能填補這個巨大的落差。
談到模型體積,推動參數極大的前沿模型固然必要,但 DeepMind 的核心優勢之一,在於發明了「模型蒸餾」(distillation) 技術,能迅速將強大的能力壓縮到極小的模型中。對於 Google 而言,旗下擁有搜尋、YouTube、Google Maps 等超過數十個擁有十億以上用戶的產品,這些服務都需要以極高的速度、極低的延遲與成本來運行。因此,打造極其高效的 Flash 模型或邊緣設備模型是強烈的需求。
Demis 表示,他目前還沒看到小模型變聰明的任何資訊論極限。我們通常可以假設,前沿模型發布後的半年到一年內,其能力就會被下放到極小的邊緣模型中。這些小模型在程式開發等領域能帶來極快的迭代速度,且在隱私與資安考量下,非常適合運行於處理個人敏感資訊的手機或未來的居家機器人上。在理想架構下,邊緣設備可在本地端處理所有的視聽感測器資料,只有在特定情況下才將任務委派給雲端的超大型基礎模型。
這也呼應了 DeepMind 對開源社群的貢獻。除了過去將 AlphaFold 完全免費開源外,近期的 Gemma 模型也創下了在短短兩週半內突破 4000 萬次下載的紀錄。Demis 強調,西方科技界在開源領域擁有自己的技術堆疊非常重要,而 Gemma 在同級別模型中具有極高的競爭力。從策略上來看,用於 Android 系統、智慧眼鏡和機器人上的邊緣模型,因為在設備端本身就較容易被破解,不如直接將其完全開源,這不僅有利於生態系發展,也符合其戰略利益。
五、 多模態基礎與科學發現的終極結合
Gemini 在設計之初就選擇了一條更困難的道路:原生多模態 (multimodal)。這項決策如今帶來了巨大的長遠優勢,特別是在建立世界模型以及推動機器人技術 (如 Gemini robotics) 發展上。未來的數位助理無論是存在於手機或智慧眼鏡中,都必須能夠理解使用者身處的實體環境、具備直覺物理學 (intuitive physics) 的認知。DeepMind 在處理這些結合真實世界感測資料的問題上,擁有遙遙領先的競爭優勢,並正逐步應用於 Waymo 等專案中。
Demis 從小就認定 AI 將是歷史上最具影響力的事物,並相信 AI 將成為科學界的「終極工具」。DeepMind 的核心任務分為兩階段:第一步是解決智能問題 (打造 AGI),第二步則是利用 AGI 來解決其他所有問題。
他口中的「其他問題」特指科學領域的「根節點問題」(root node problems),即一旦解開就能開啟全新科學發現分支的關鍵挑戰。AlphaFold 便是最經典的範例。目前全球幾乎每一位生物學研究人員 (超過三百萬人) 都在使用 AlphaFold,未來的每一款新藥研發過程中,幾乎都將運用到這項技術。
DeepMind 目前分拆出的 Isomorphic Labs 正在順利推進中,不僅利用 AlphaFold,更結合了相鄰的生物化學和化學領域,致力於設計具有特定屬性的新藥化合物,近期將會有重大發表。Demis 更具野心的願景是打造一個完整的「虛擬細胞」(virtual cell) 模擬器。他預估距離實現完整的虛擬細胞大約還有十年的時間。目前的策略是從細胞核的模擬開始,因為相對獨立且容易定義輸入與輸出。
然而,這項科學挑戰最大的瓶頸在於缺乏足夠的資料。如果我們能在不破壞活體細胞的前提下,以奈米級解析度對動態細胞進行即時影像捕捉,這項挑戰就能被轉化為我們擅長的電腦視覺問題。要解決這個問題,可能需要透過硬體技術的突破來獲取數據,或者開發出更強大的動態系統學習模擬器。
Demis 總結了 DeepMind 過去開發 AlphaGo 和 AlphaFold 等突破性專案的成功模式,當一個科學問題符合以下條件時,就非常適合用 AI 來攻克:
- 龐大的組合搜尋空間 (massive combinatorial search space): 空間越大越好,確保無法用傳統演算法或暴力破解法解決 (例如圍棋的棋局變化,或超過宇宙原子數量的蛋白質折疊結構)。
- 清晰的目標函數 (clear objective function): 可以明確定義優化方向,例如最小化蛋白質的自由能,或是贏下圍棋比賽。
- 充足的數據或模擬器: 能夠生成大量且符合分佈 (in-distribution) 的合成資料。
只要符合這三個條件,配合當前的技術,我們就能在科學的汪洋大海中,精準地撈出那根解開疾病解藥的「完美之針」(needle in a haystack)。材料科學、氣候模擬、數學等領域,目前正處於各自的「AlphaFold 1 時刻」,雖然尚未完全解決重大挑戰,但在未來幾年內將會有飛躍性的突破。
六、 從模式匹配到真正的創新:愛因斯坦測試
談到 AI 的極限,Demis 被問及 AI 系統何時能超越現有的假說空間,進行真正的科學推理,而不僅僅是對既有數據的模式匹配 (pattern matching)。他坦言目前的系統雖在實驗階段 (例如內部代號 Co-Scientist 或 AlphaEvolve),但尚未展現出真正重大的原創性發現。
這回到了我們前面探討的「創造力」議題。AlphaGo 下出震驚世人的「第 37 手」(Move 37) 固然令人讚嘆,並促使了 AlphaFold 專案的啟動,但 AI 能不能「發明」出圍棋這款遊戲呢? 如果你給 AI 一個高階指令:「發明一款可以在 5 分鐘內學會規則,但需要花費一生去精通、極具美感且能在一個下午玩完的遊戲」,現今的系統依然無法回傳像「圍棋」這樣完美的答案。
要達成這樣的境界,AI 必須具備超越模式匹配的能力,運用某種類比推理 (analogical reasoning) 跨出已知領域的邊界。Demis 最喜歡的挑戰是讓 AI 解決「P = NP」問題,甚至提出一組全新的「千禧年大獎難題」,提出足以讓頂尖數學家耗費一生去研究的深刻命題。
為此,他提出了一個名為「愛因斯坦測試」(Einstein test) 的有趣構想:如果我們將 1901 年以前的所有物理學知識輸入給 AI,它是否能像愛因斯坦在 1905 年的奇蹟年那樣,自己推導出狹義相對論? 如果我們能不斷運行這個測試並獲得成功,那才代表 AI 真正具備了發明新事物的能力。
七、 寫給深科技創業者的終極建議
對於有志於在 Y Combinator 等環境中開創事業的技術人才,Demis 給出了極為中肯的建議。首先,新創公司必須去攔截 AI 技術未來發展的軌跡。更重要的是,應該將 AI 與深科技 (例如材料科學、醫學等涉及實體原子的領域) 結合。建立具備這兩種專業知識的跨領域 (interdisciplinary) 團隊,是抵禦大型基礎模型更新迭代「降維打擊」的最有效護城河。
他回憶道,真正長遠且有價值的事情從來都不是容易的。在 2010 年剛創辦 DeepMind 時,投資人和學界都認為類神經網路在 90 年代就已經證實不可行,但只要你對自己的理念有堅定的信念和獨特的跨領域背景,就能創造出巨大的價值。即使當時進展不順,基於對這個領域的純粹熱情,他依然會選擇繼續投入 AI 研究。
最後,他提醒創業者,如果你今天啟動一個為期 10 年的深科技專案,你必須預期在旅程中途 (約 2030 年) 將會遇見 AGI 的誕生。這不是壞事,但你必須思考你的系統如何利用 AGI,以及 AGI 會對你的產品做些什麼。
未來的世界架構,很可能不會只有一個涵蓋所有知識的「單一巨大無敵大腦」。如果把所有蛋白質數據硬塞進 Gemini,反而可能導致其語言能力退化 (regression)。相反地,未來的 AGI 將具備強大的通用工具使用能力,它們會負責調用像 AlphaFold 這樣高度專業化的外部系統,甚至負責訓練這些系統。理解這個趨勢,並去構建在這個未來架構下不可或缺的實體設施 (如未來的工廠或新型態金融系統),將會是下一個世代創業家最大的機會所在。




