簡立峰專欄》Token經濟是手段輝達要當算力平台商

輝達執行長黄仁勳今年在GTC大會(GPU Technology Conference)宣示,將全面卡位AI工廠時代,從GPU供應商升級為AI基礎設施平台業者。這次GTC是方向的確認:輝達正從訓練端轉向推論市場,試圖打造屬於自己的「token(註1)經濟」。

過去三年·AI產業的核心在訓練大模型,這也是輝達幾乎沒有對手的領域。但現在能夠負擔大模型訓練的公司沒多少,且這些巨頭幾乎都發展自己的ASIC晶片(註2),希望減低對GPU的依頼。

相對地,AI的使用端才正要開始擴張。當AI從少數公司訓練轉向大量企業與用戶日常使用,推論的需求會遠遠超過訓練本身。但這也是一場硬仗・例如安謀(Arm)三月就推出面向AI推論的CPU產品(Arm AGI CPU),強調在處理AI代理人多元決策時,不一定要全靠GPU。

此外,GPU的迭代速度也帶來了隱憂。過去CPU年代是兩、三年一換,現在GPU是一年一代,效能差了近百倍。這對投資資料中心的企業來說,資產折舊壓力相當大,三年前買的設備現在看來效能落後太多,這使推論市場的競爭不再只看性能,更看投資風險與成本控管。

在這樣的轉折點,輝達推出開源AI代理平台「NemoClaw」,鎖定企業用户,主打封裝性與安全性。NemoClaw提供一種折衷方案,讓企業能在可控,且針對輝達硬體最佳化的環境中運行模型,在風險與效能之間取得平衡。

我一直認為AI的殺手級應用會以代理式AI(註3)的形式出現,而輝達此刻推動相關平台,某種程度上已不只是技術延伸,同時也在重新定義自己的角色。它不再只是晶片供應商,而是開始直接切入應用與服務市場。除了產品,輝達真正的野心是建立一套以token為基礎的計價方式。

所謂「token經濟」,本質上是依使用量付費。未來企業不一定要斥資買下昂貴且快速貶值的品片,而是直接向輝達租借算力,或根據使用的token數量來付費。這也意味輝達的競争對象正在改變,對手不再只是晶片公司,還包括掌握企業入口的雲端巨頭(AWS、Azure、Google雲端)。

但如果把時間拉長來看,token經濟只是手段,黄仁動想建立的是一個以算力為核心、向外延伸的應用生態。

在未來的競争環境中,關鍵變數很可能回到成本,當各家模型的能力逐漸接近、差異縮小時,企業選擇服務的首要考量就是CP值。雖然這條路不容易,因為底層作業系統與生態系仍掌握在少數巨頭手中,但輝達已經抛出了這個球,正一步步往算力平台商的目標邁進。

(作者是Google前台灣董事總經理。記者許珮絨整理)

註1:token:語言模型處理文字時的組成單位,又稱詞元

註2:ASIC:特殊應用積體電路,指在硬體設計上專為特定用途量身打造的晶片,相對於較為通用的GPU有單顆成本較低、低耗能、高效率、高算力的優點,但用途較窄、相容性較低,因此設計的生命週期短暫,通常隨模型而更替。

註3:代理式AI:能夠理解並拆解指令,自動執行任務的AI,與單次問答、依賴使用者提供資料的生成式AI不同,代理式AI能夠重複、長時間且自動調用外部工具(如API)完成任務,因此相對於生成式AI,使用者更需要長期穩定的算力支持。

資料來源:聯合報

相關新聞

歐洲理事會主席科斯塔表示,歐盟已得到基輔方面的支持,尋求與俄羅斯總統展開談判。一位高級官員表示,歐盟領導人正準備與俄羅斯總統弗拉迪米爾•...
泰德·特納 於2026年4月6日去世 ,他才華橫溢、精明幹練,這位有線電視先驅在正確時間正確的地點, 徹底改變了電視和視訊新聞的格局 。
宏都拉斯 新任總統正在審查他的前任與中國達成的協議,這可能有助於美國削弱中國在該地區的影響力,並可能促使宏國重新承認台灣。
 6日公布的「小非農」ADP就業報告顯示,4月美國民間就業增加10.9萬人,不僅優於市場預期,增幅更創2025年1月以來最高。...