【AMD AI大會】三大策略拓展AI市場 AMD蘇姿丰:AI是運算的未來

「AMD Advancing AI」大會於今(7)日(美國時間6日)登場,AMD執行長蘇姿丰強調,AI不只是很酷的新玩意,也是運算的未來、是自50多年前半導體誕生以來最重要的技術;為此,AMD祭出三大AI策略,進而大幅加速全面AI產業體系的創新進程。

AMD執行長蘇姿丰。(圖/記者侯冠州攝)
AMD執行長蘇姿丰。(圖/記者侯冠州攝)

蘇姿丰於會中表示,預期至2027年,資料中心AI加速器市場的TAM將達到4,000億美元,年均複合成長率(CAGR)較2023年成長70%;AI在很短的時間爆炸性成長,歷史上地位能與AI相比的大概就是網路網路的發明,然而,AI採用速度會更快,現在只是AI發展非常早期階段。

為此,AMD祭出三大AI策略。

1.打造完整、廣泛運算引擎產品組合,以支援從雲端、邊緣至終端的工作負載

基於此一策略,AMD在本次大會中一口氣揭示新一代AMD Instinct加速器MI300X、MI300A以及Ryzen 8040系列行動處理器。

首先是AMD Instinct MI300X加速器

MI300X加速器基於全新AMD CDNA 3架構,相較前一代產品,可為AI與HPC工作負載帶來近40%的運算單元提升、高達1.5倍的記憶體容量提升以及高達1.7倍的峰值理論記憶體頻寬提升,同時支援FP8與Sparsity等的全新數學格式。

另外,現今的LLM持續增加尺寸與複雜度,需要龐大的記憶體和運算能力。為此,MI300X加速器配備192GB HBM3記憶體容量以及每秒5.3TB的峰值記憶體頻寬,提供不斷增加且要求嚴苛的AI工作負載所需效能,且具有1.5TB HBM3記憶體容量。

AMD Instinct MI300X加速器。(圖/記者侯冠州攝)
AMD Instinct MI300X加速器。(圖/記者侯冠州攝)

其次是AMD Instinct MI300A APU

此為HPC與AI打造的資料中心APU,結合高效能AMD CDNA 3 GPU核心、最新AMD Zen 4 x86 CPU核心與新一代128GB HBM3記憶體,相較前一代AMD Instinct MI250X,在FP32 HPC與AI工作負載提供高達1.9倍的每瓦效能提升。APU優勢代表AMD Instinct MI300A APU搭配統一記憶體與快取記憶體資源可為客戶帶來簡易的程式化設計GPU平台、高效能運算、快速的AI訓練以及優異的能源效率,以應對要求最嚴苛的HPC和AI工作負載。

第三是全新AMD Ryzen 8040系列行動處理器

不同於MI300X、MI300A,該處理器鎖定AI PC市場。相較上一代處理器,AMD Ryzen 8040系列在執行Llama-2 7B模型時帶來1.4倍效能,在AI影像識別與物件偵測模型套組中則帶來高達1.4倍的效能。至於在HPC效能方面,相較Intel Core i9-13900H處理器,AMD Ryzen 8040系列帶來高達1.1倍的多執行緒效能、1.8倍的遊戲效能以及1.4倍的內容創作效能。

廣告

AMD強調,新款處理器基於AMD RDNA 3架構的Radeon顯示核心,特定系統更搭載為AMD Ryzen AI打造的AMD XDNA架構,能為專業創意人士、遊戲玩家以及主流使用者打造強大筆電,不僅擁有符合現今需求的可信賴效能,更能運行各種先進的AI體驗。

AMD發表新一代Ryzen 8040處理器。(圖/記者侯冠州攝)
AMD發表新一代Ryzen 8040處理器。(圖/記者侯冠州攝)

蘇姿丰強調,AI是運算的未來,而AMD擁有獨特的優勢,能夠為定義全新運算時代的端到端AI基礎架構挹注效能,範圍涵蓋從搭載數以萬計個GPU的大型雲端伺服器,到本地企業端伺服器叢集和新一代支援AI的智慧邊緣裝置與PC。

2.擴展軟體能力,以降低進入與使用AI完整潛力的門檻

AMD透露正透過兩大策略擴大Ryzen AI生態系。第一步是打造出可用的硬體,第二步便是擴大賦能開發者;為此,本次大會AMD除了釋出一系列硬體產品外,也發表最新版本開源軟體堆疊ROCm 6,同時也釋出Ryzen AI 1.0版本,讓開發人員可更輕鬆地增加先進生成式AI能力。

AMD執行長蘇姿丰表示,ROCm 6意味著AMD Instinct資料中心加速器的軟體產業體系之重大進展,也體現AMD向開源社群貢獻最先進的函式庫之承諾,推動AMD開發開源AI軟體的願景。

AMD透過兩大策略拓展Ryzen AI生態系。(圖/記者侯冠州攝)
AMD透過兩大策略拓展Ryzen AI生態系。(圖/記者侯冠州攝)

AMD解釋,ROCm 6可為生成式AI進行最佳化,特別是大型語言模型,同時還能支援全新資料型式、先進繪圖與核心最佳化、最佳化函式庫與最先進的注意力演算法;相較於MI250上執行的ROCm 5,於MI300X上執行的ROCm 6在Llama 2 text generation模型帶來高達8倍的全面延遲效能提升。

另一方面,除了ROCm 6之外,AMD也釋出Ryzen AI 1.0軟體,是為Ryzen AI所打造的開發者軟體,讓開發者組建與部署以PyTorch或TensorFlow框架進行訓練的機器學習模型,並在搭載Ryzen AI的特定筆電上運行這些模型。

AMD進一步指出,透過Ryzen AI軟體的釋出,開發者可憑藉Ryzen AI組建各種AI應用,包括先進手勢辨識、生物特徵驗證以及其他存取功能。開發者更能獲得自動語音識別模型的初期支援,包括Whisper以及OPT和Llama-2等大型語言模型。總之,Ryzen AI 1.0軟體主要是讓開發人員可更輕鬆地增加先進生成式AI能力,藉由此軟體,開發人員只需選擇一個預先訓練好的模型,即可打造在Ryzen AI硬體上執行就緒的AI應用。

3.深化AI合作夥伴的產業體系

在本次大會中,AMD也與多家合作夥伴同台展現AMD Instinct資料中心AI加速器的強勁採用狀況與成長動能。像是微軟採用最新AMD Instinct加速器產品組合,近期宣布全新Azure ND MI300x v5虛擬機器(VM)系列,為AI工作負載進行最佳化並由AMD Instinct MI300X加速器挹注效能。此外,位在美國勞倫斯利佛摩國家實驗室的超級電腦El Capitan採用AMD Instinct MI300A APU,預期成為第二台搭載AMD核心的exascale等級超級電腦。

AMD和合作夥伴同台展現Instinct資料中心AI加速器。(圖/記者侯冠州攝)
AMD和合作夥伴同台展現Instinct資料中心AI加速器。(圖/記者侯冠州攝)

不僅如此,各大OEM廠商也在AMD Advancing AI活動展示加速運算系統。戴爾展示採用8個AMD Instinct MI300系列加速器的Dell PowerEdge XE9680伺服器以及為生成式AI推出的全新Dell Validated Design;HPE近期發表首款超級運算HPE Cray Supercomputing EX255a accelerator blade,搭載AMD Instinct MI300A APU,預期將於2024年稍早開始供貨。聯想宣布其設計支援全新AMD Instinct MI300系列加速器,計畫於2024上半年開始供貨;美超微(Supermicro)則宣布其H13世代加速伺服器的全新產品採用第4代AMD EPYC處理器與AMD Instinct MI300系列加速器。

總結來說,AMD正積極從硬體、軟體和生態系夥伴三管齊下,積極擴大AI生態系統。蘇姿丰強調,AI是自50多年前半導體誕生以來最重要的技術,AI是運算的未來,所以AMD正積極推動高效能和自行調適運算的藍圖發展,帶來實現全方位AI所需的更高運算能力;同時也在與最大的雲端公司、領先業界的伺服器供應商以及最具創新性的AI新創公司攜手合作,為我們的資料中心AI解決方案打造重要動能。

「AMD已打造一個橫越多年與多世代的硬體藍圖,帶來能夠運用開放軟體產業體系能力的適銷、高效能與具能源效率的AI平台。」蘇姿丰這麼說。

  • Yahoo財經特派記者 侯冠州:自進入新聞產業後便於科技領域鑽研,採訪足跡遍及台積電、鴻海、NVIDIA、Arm等外商與台企,期許能在瞬息萬變的科技產業中提供讀者真實、專業的新聞內容。