簡立峰專欄》Token經濟是手段輝達要當算力平台商

輝達執行長黄仁勳今年在GTC大會(GPU Technology Conference)宣示,將全面卡位AI工廠時代,從GPU供應商升級為AI基礎設施平台業者。這次GTC是方向的確認:輝達正從訓練端轉向推論市場,試圖打造屬於自己的「token(註1)經濟」。
過去三年·AI產業的核心在訓練大模型,這也是輝達幾乎沒有對手的領域。但現在能夠負擔大模型訓練的公司沒多少,且這些巨頭幾乎都發展自己的ASIC晶片(註2),希望減低對GPU的依頼。
相對地,AI的使用端才正要開始擴張。當AI從少數公司訓練轉向大量企業與用戶日常使用,推論的需求會遠遠超過訓練本身。但這也是一場硬仗・例如安謀(Arm)三月就推出面向AI推論的CPU產品(Arm AGI CPU),強調在處理AI代理人多元決策時,不一定要全靠GPU。
此外,GPU的迭代速度也帶來了隱憂。過去CPU年代是兩、三年一換,現在GPU是一年一代,效能差了近百倍。這對投資資料中心的企業來說,資產折舊壓力相當大,三年前買的設備現在看來效能落後太多,這使推論市場的競爭不再只看性能,更看投資風險與成本控管。
在這樣的轉折點,輝達推出開源AI代理平台「NemoClaw」,鎖定企業用户,主打封裝性與安全性。NemoClaw提供一種折衷方案,讓企業能在可控,且針對輝達硬體最佳化的環境中運行模型,在風險與效能之間取得平衡。
我一直認為AI的殺手級應用會以代理式AI(註3)的形式出現,而輝達此刻推動相關平台,某種程度上已不只是技術延伸,同時也在重新定義自己的角色。它不再只是晶片供應商,而是開始直接切入應用與服務市場。除了產品,輝達真正的野心是建立一套以token為基礎的計價方式。
所謂「token經濟」,本質上是依使用量付費。未來企業不一定要斥資買下昂貴且快速貶值的品片,而是直接向輝達租借算力,或根據使用的token數量來付費。這也意味輝達的競争對象正在改變,對手不再只是晶片公司,還包括掌握企業入口的雲端巨頭(AWS、Azure、Google雲端)。
但如果把時間拉長來看,token經濟只是手段,黄仁動想建立的是一個以算力為核心、向外延伸的應用生態。
在未來的競争環境中,關鍵變數很可能回到成本,當各家模型的能力逐漸接近、差異縮小時,企業選擇服務的首要考量就是CP值。雖然這條路不容易,因為底層作業系統與生態系仍掌握在少數巨頭手中,但輝達已經抛出了這個球,正一步步往算力平台商的目標邁進。
(作者是Google前台灣董事總經理。記者許珮絨整理)
註1:token:語言模型處理文字時的組成單位,又稱詞元
註2:ASIC:特殊應用積體電路,指在硬體設計上專為特定用途量身打造的晶片,相對於較為通用的GPU有單顆成本較低、低耗能、高效率、高算力的優點,但用途較窄、相容性較低,因此設計的生命週期短暫,通常隨模型而更替。
註3:代理式AI:能夠理解並拆解指令,自動執行任務的AI,與單次問答、依賴使用者提供資料的生成式AI不同,代理式AI能夠重複、長時間且自動調用外部工具(如API)完成任務,因此相對於生成式AI,使用者更需要長期穩定的算力支持。
資料來源:聯合報
