簡立峰專欄》Token經濟是手段輝達要當算力平台商

輝達執行長黄仁勳今年在GTC大會(GPU Technology Conference)宣示,將全面卡位AI工廠時代,從GPU供應商升級為AI基礎設施平台業者。這次GTC是方向的確認:輝達正從訓練端轉向推論市場,試圖打造屬於自己的「token(註1)經濟」。

過去三年·AI產業的核心在訓練大模型,這也是輝達幾乎沒有對手的領域。但現在能夠負擔大模型訓練的公司沒多少,且這些巨頭幾乎都發展自己的ASIC晶片(註2),希望減低對GPU的依頼。

相對地,AI的使用端才正要開始擴張。當AI從少數公司訓練轉向大量企業與用戶日常使用,推論的需求會遠遠超過訓練本身。但這也是一場硬仗・例如安謀(Arm)三月就推出面向AI推論的CPU產品(Arm AGI CPU),強調在處理AI代理人多元決策時,不一定要全靠GPU。

此外,GPU的迭代速度也帶來了隱憂。過去CPU年代是兩、三年一換,現在GPU是一年一代,效能差了近百倍。這對投資資料中心的企業來說,資產折舊壓力相當大,三年前買的設備現在看來效能落後太多,這使推論市場的競爭不再只看性能,更看投資風險與成本控管。

在這樣的轉折點,輝達推出開源AI代理平台「NemoClaw」,鎖定企業用户,主打封裝性與安全性。NemoClaw提供一種折衷方案,讓企業能在可控,且針對輝達硬體最佳化的環境中運行模型,在風險與效能之間取得平衡。

我一直認為AI的殺手級應用會以代理式AI(註3)的形式出現,而輝達此刻推動相關平台,某種程度上已不只是技術延伸,同時也在重新定義自己的角色。它不再只是晶片供應商,而是開始直接切入應用與服務市場。除了產品,輝達真正的野心是建立一套以token為基礎的計價方式。

所謂「token經濟」,本質上是依使用量付費。未來企業不一定要斥資買下昂貴且快速貶值的品片,而是直接向輝達租借算力,或根據使用的token數量來付費。這也意味輝達的競争對象正在改變,對手不再只是晶片公司,還包括掌握企業入口的雲端巨頭(AWS、Azure、Google雲端)。

但如果把時間拉長來看,token經濟只是手段,黄仁動想建立的是一個以算力為核心、向外延伸的應用生態。

在未來的競争環境中,關鍵變數很可能回到成本,當各家模型的能力逐漸接近、差異縮小時,企業選擇服務的首要考量就是CP值。雖然這條路不容易,因為底層作業系統與生態系仍掌握在少數巨頭手中,但輝達已經抛出了這個球,正一步步往算力平台商的目標邁進。

(作者是Google前台灣董事總經理。記者許珮絨整理)

註1:token:語言模型處理文字時的組成單位,又稱詞元

註2:ASIC:特殊應用積體電路,指在硬體設計上專為特定用途量身打造的晶片,相對於較為通用的GPU有單顆成本較低、低耗能、高效率、高算力的優點,但用途較窄、相容性較低,因此設計的生命週期短暫,通常隨模型而更替。

註3:代理式AI:能夠理解並拆解指令,自動執行任務的AI,與單次問答、依賴使用者提供資料的生成式AI不同,代理式AI能夠重複、長時間且自動調用外部工具(如API)完成任務,因此相對於生成式AI,使用者更需要長期穩定的算力支持。

資料來源:聯合報

相關新聞

俄羅斯總統普丁於5/9日勝利日閱兵上提到,俄烏衝突「正在走向終結」,這是他首次真正暗示他所選擇的這場戰爭可能即將結束。但俄軍攻勢未歇,...
BBC引述多名消息人士與官員報導,外界目光聚焦在美伊戰爭之際,美國與丹麥近幾個月持續秘密談判擴大美方在格陵蘭的駐軍,...
 投行高盛11日發布最新報告預測,在AI晶片出口熱潮帶動下,台韓經常帳盈餘將創下新高,迫使兩國央行今年稍後必須升息應對。以蒂爾頓(...
2020年,蘋果執行長庫克宣布放棄英特爾、全面轉向自研晶片,為雙方長達15年的合作畫下句點。如今,六年後的2026年5月,《華爾街日報》...