自從輝達 (Nvidia) 從遊戲 GPU 供應商,轉型成全球 AI 運算的核心技術供應商,已成功在全球 AI 產業上站穩腳跟。而全球各大科技巨頭像是微軟 (Microsoft)、亞馬遜 (Amazon)、Google、Meta 以及馬斯克 (Elon Musk) 也緊隨其後,並加碼投資 AI 基礎設施。
同時斥資數十億美元來打造「超大規模資料中心」,並採購數百萬顆 AI 晶片來建置,以滿足 AI 模型對算力的龐大需求。然而面對輝達的強勢主導,AMD、英特爾 (Intel)、Google TPU 與亞馬遜 (Tranium) 等對手是否有機會突圍,未來 AI 發展是否會遇到算力瓶頸,這場 AI 大戰究竟會如何發展。
「規模」成為關鍵,科技巨頭繼續打造 AI 基礎設施
近年來 AI 模型的運算需求快速成長,科技巨頭們相繼斥資打造大型資料中心,以擴張 AI 運算能力,包括:
藉由這些科技巨頭的投資顯示,「規模」仍是關鍵,再透過光纖網路將全球資料中心互相連結,進而提升 AI 訓練與運算效能,直接反駁「AI 運算規模已達極限」的說法。
輝達仍獨佔鰲頭,全球 AI 算力 70% 以上靠它
在 AI 晶片市場,輝達仍以市占率 70% 穩坐市場龍頭,尤其是在 AI 訓練領域,市占率更接近 98%。即便 Google 擁有自己的 TPU (Tensor Processing Unit) 晶片,但仍是輝達 GPU 的買家之一。
(註:TPU 是 Google 為加速機器學習和 AI 工作負載而設計的特殊應用晶片。)
這些因素讓 NVIDIA 成為 AI 晶片領頭羊,即便 AMD、Google、亞馬遜等對手積極投入 AI 晶片開發,輝達依舊穩居市場霸主地位。然而市場競爭仍然激烈,許多科技業者正在尋找替代方案,以降低對輝達依賴。
Google TPU、AMD MI300、亞馬遜 Tranium 能否挑戰輝達
儘管輝達仍然主導市場,但以下幾家主要競爭對手像是 Google、AMD 與亞馬遜仍試圖搶占 AI 算力市場。Google 的TPU雖然主要用於內部服務,像是搜尋、廣告、YouTube 影片處理,但在 AI 訓練市場仍擁有大量市占率。
AMD MI300 為輝達最大競爭對手,但軟體仍是短板
AMD 近年來積極布局 AI 晶片市場,MI300X GPU受惠於美國對中國的出口管制,在中國市場相對吃香。此外微軟與 Meta 也積極採用 AMD 晶片,以降低對輝達的依賴。
雖說 AMD 表現不錯,但不會向市場預期般大爆發。因為 AMD 的 ROCm 平台在 AI 軟體生態系統方面還不夠成熟,跟輝達的 CUDA 相比,穩定性和易用性都還有進步空間。
舉例來說,開發者在使用 ROCm 來訓練 AI 模型時,經常會遇到除錯 (debug) 困難等問題,甚至連基本的「開箱即用」體驗都不太順利。像是直接用 ROCm 跑 PyTorch 這類主流 AI 框架的模型,可能會遇到無法順利運行的情況,還需要額外調整或修改,讓開發者使用起來沒那麼方便。
Amazon Tranium 2 主打成本效益
亞馬遜所推出的 Tranium 2 被外界戲稱為亞馬遜版 TPU,主要針對內部 AI 訓練使用,強調低成本與高記憶體帶寬。以下是 Amazon 針對成本效益的三個面向:
對 AWS 客戶來說,不僅降低租賃費用與電費,也透過生態整合減少間接成本,特別在 AI 晶片需求激增的背景下,此為挑戰輝達的關鍵策略。
輝達仍然領先,但 AI 算力資本狂潮是否能持續
目前來看輝達依舊穩坐 AI 晶片霸主地位,但 2025、2026 年將是市場的分水嶺。如果 AI 模型效能持續突破,算力需求將不斷攀升,各大科技巨頭也會繼續投入資本來促進產業發展。
然而市場仍需關注AI 商業模式能否真正帶來穩定獲利,否則 AI 市場可能會出現「泡沫化」,到時將迎來一波整併潮,只有真正具有技術優勢的公司才能存活。
(64,000 顆輝達 AI 晶片準備入場!Stargate 專案砸數十億鎂,德州超級數據中心即將啟動)
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。