工商時報

LLM推論應用擴張 啟動記憶體超級循環

李娟萍/台北報導

AI大型語言模型(LLM)推論應用全面擴張,全球記憶體市場正進入前所未見的爆發期。根據研調機構的報告指出,以OpenAI的GPT-5為例,其推論過程所帶來的HBM、DRAM與NAND需求,將足以啟動一波記憶體超級循環(Memory Supercycle)。

該報告指出,AI應用正從訓練階段轉向推論階段,這一轉變徹底改變了記憶體的使用結構。AI伺服器通常採三層記憶體架構:一是HBM(高頻寬記憶體):直接整合於GPU封裝內,負責即時高速資料交換;二是DRAM(系統記憶體):容量較大,承擔模型載入、暫存及快取延展。三是NAND Flash(SSD儲存層):負責模型權重載入、KV快取溢出及RAG(檢索式生成)查詢。該報告指出,AI推論需要持續載入模型參數、生成KV快取並進行檢索操作,造成對高頻寬與大容量記憶體的雙重壓力。

廣告

以GPT-5為例,估算該模型擁有4.5兆參數(trillion parameters),採用 Mixture-of-Experts(MoE)架構。每次推論僅有部分專家模型被啟用,平均每個模型複本需約1TB HBM。若以全球用戶同時生成每秒2,400萬tokens計算,總高頻寬記憶體需求約26.8PB,其中模型權重佔約24PB,KV快取占約2.8PB。此外,為支撐推論過程中的快取重用與上下文再取(Context Reuse),需搭配9.1EB DRAM 儲存中繼資料;同時,RAG資料庫與多重備援結構,使NAND需求高達200EB。另據TrendForce資料,2025年全球DRAM總供給為36.5EB、NAND為925EB。

惟研調報告指出,僅GPT-5一款模型即新增約全球DRAM供給的25%、NAND供給的22%。若2026年Token生成量再倍增,其對應需求將分別提升至43%與39%,意味AI推論流量,已足以吞噬全球記憶體新增產能。TrendForce亦預測,2026年DRAM與NAND供給僅將年增17%與12%;惟LLM推論所帶動的記憶體需求可能年增逾100%,導致市場出現明顯供需落差。AI推論的即時性、連續性與超高頻存取特性,使HBM、DRAM、NAND成為AI時代的基礎戰略資源。

隨著主要記憶體廠仍維持保守擴產策略,全球供給缺口恐於2026年進一步擴大,記憶體價格上漲趨勢可望延續數年。

更多工商時報報導
邁斯科生醫 獲日商投資合作
倒數剩六天 內資拚作帳
亞太電開新局 遠傳扮靠山

相關內容

記憶體漲到出事?投資人快看...NAND零出貨「供應鏈大塞車」 這檔急發警報:成本一週暴漲100%

記憶體漲到出事?投資人快看...NAND零出貨「供應鏈大塞車」 這檔急發警報:成本一週暴漲100%

[FTNN新聞網]記者莊蕙如/綜合報導全球記憶體市場正陷入罕見的全面緊縮,原本就火熱的DRAM、NAND漲勢,近期因AI與大型資料中心需求擴張再度升溫,讓供給端幾...

FTNN新聞網 ・ 3 天前發起對話

《半導體》創見示警:記憶體交期拉長、價格漲

【時報-台北電】全球記憶體供需失衡急速惡化,模組大廠創見近日向客戶發布最新供應警示,該公司指出,NAND Flash與DRAM供應全面吃緊,SSD、SD卡、microSD卡與USB等產品,將面臨「交期拉長、價格大幅上漲」的市場壓力。 創見強調,已積極與記憶體原廠協調額外配額,但市場供給緊縮程度遠超預期。該公司呼籲客戶,若有現行專案,需提前提出需求;若有急單,務必立即溝通,以便優先調度有限資源。 此次由創見具名所流出的訊息,據了解,是該公司業務人員針對特定客戶的溝通內容,「並非公司官方公告」,但AI需求強勁,使市場本就供不應求,業界搶貨搶得很凶。 另據法人供應鏈調查,近期記憶體缺貨主因是全球雲端服務供應商(CSP)與超大規模資料中心(Hyperscalers)持續擴大採購,2025年第四季原廠與大型客戶簽訂的長約(LTA)規模創新高,反映原廠正將產能優先保留給高產值、高黏著度客戶。 業界人士分析,原廠會依應用產值、客戶關係與後續成長性調整供貨,一般預料,不會出現完全斷供;短期停止出貨,多半是爭取時間盤點需求、觀望市場變化。亦有記憶體模組廠內部採購回報,公司仍可收到原廠來貨,並未完全中斷,

時報資訊 ・ 3 天前發起對話
創見示警:記憶體交期拉長、價格漲

創見示警:記憶體交期拉長、價格漲

全球記憶體供需失衡急速惡化,模組大廠創見近日向客戶發布最新供應警示,該公司指出,NAND Flash與DRAM供應全面吃緊,SSD、SD卡、microSD卡與USB等產品,將面臨「交期拉長、價格大幅上漲」的市場壓力。

工商時報 ・ 4 天前發起對話

產能價值重組,供需失衡升級…DRAM、NAND進入強漲循環

AI伺服器與雲端基礎建設擴張推升記憶體需求全面升溫,DRAM與NAND Flash同步進入強漲循環。11月DDR5與DDR4現貨價分別大漲75%與45%,與合約價差距拉大至近年罕見水位,市場供需失衡明顯升級。

工商時報 ・ 4 天前發起對話
有錢也買不到?HBM需求引爆缺貨潮 大戶搶簽華邦電6年長約鎖產能

有錢也買不到?HBM需求引爆缺貨潮 大戶搶簽華邦電6年長約鎖產能

[FTNN新聞網]財經中心/綜合報導記憶體供應吃緊情況再度升高。TrendForce(集邦)最新調查指出,DRAM供應商平均庫存週期已降到2~4週,幾乎沒有安全緩衝。在A...

FTNN新聞網 ・ 2 天前發起對話

三星再搶輝達商機 吃下SOCAMM 2逾半數訂單

韓國記憶體龍頭三星電子在搶攻AI伺服器供應鏈的戰局中再下一城。除了與AI晶片霸主輝達(NVIDIA)就HBM4展開供應談判外,韓媒4日報導,三星已成功拿下輝達2026年新型記憶體模組SOCAMM 2超過半數的採購訂單,成為該產品首批最大供應商。

工商時報 ・ 3 天前發起對話

AI爬太快… 梁次震:記憶體缺多久猜不透

AI熱潮引發記憶體缺料,廣達副董事長暨總經理梁次震3日參與DIGITIMES科技大勢2026論壇時表示,AI帶來的相關需求仍龐大,記憶體目前大部分都是客戶自行採購,多少也有事先準備明年記憶體的庫存,但他們也很傷腦筋,因為記憶體缺貨狀況不知道持續多久,大家也都「猜不透」,主要是AI爬得太快了。

工商時報 ・ 4 天前發起對話

《熱門族群》記憶體之火沒滅?雙雄人氣居高、創見帶隊模組反攻

【時報-台北電】記憶體漲多修正後,近期走勢分化!美光震撼退出消費記憶體市場,象徵全球記憶體市場正被AI巨浪重新分配,台灣記憶體模組大廠也反映,目前市場已出現明顯分化,創見(2451)也傳出開「第一槍」喊漲NAND Flash,加上基本面護體,股價止跌走揚3%,模組廠凌航(3135)大漲5%衝波段高,群聯(8299)、宜鼎(5289)、品安(8088)跟進走揚,顆粒廠的華邦電(2344)連彈2日,南亞科(2408)力返150大關。 被稱為「超級週期」的記憶體漲價潮,持續衝擊全球電子產業鏈。2025年第四季,三星、海力士等國際記憶體原廠已先後宣布DRAM記憶體和NAND快閃記憶體價格將上調最多30%。SanDisk在11月將NAND快閃記憶體合約價大幅調漲50%,為年內第三度上調,引爆全球漲價潮。 美光(Micron)更是丟出震撼彈,向通路證實,因NAND配額大幅不足,將退出旗下Crucial消費性產品線,象徵全球記憶體市場正在被AI巨浪重新分配。台灣記憶體模組大廠也反映,目前市場明顯分化,大型業者因具備長期配額,仍可維持供應,但部分中小型模組廠已出現拿不到NAND/DRAM配額。 模組廠

時報資訊 ・ 2 天前1

AI記憶體搶貨潮升級,美光停賣消費級產品,全力供應數據中心

【財訊快報/陳孟朔】外電報導,美國記憶體大廠--美光科技(Micron,美股代碼MU)週三宣布,將停止面向終端消費者銷售記憶體產品,未來營運重心將全面轉向高性能人工智慧(AI)晶片與數據中心需求,標誌在AI基礎設施投資狂潮下,記憶體產能分配正式向「雲端與大客戶」大幅傾斜。美光業務主管薩達納(Sumit Sadana)在聲明中表示,AI帶動的數據中心成長,正推升高階記憶體需求出現「爆發式上升」,為改善供應並優先支援成長更快領域的策略客戶,公司做出退出消費級記憶體業務這個「艱難但必要」的決定。美光股價週三收低2.23%至234.16美元,成了費半唯三黑且最大魯蛇,但今年以來累計漲幅仍高達約178.23%,反映市場看好其在AI記憶體週期中的關鍵地位。在AI基礎設施建設熱潮之下,記憶體這一核心零組件正步入全球性供給吃緊階段。輝達(Nvidia)與超微(AMD)等AI晶片大廠的GPU大量搭載最先進的高頻寬記憶體(HBM):例如,輝達GB200晶片每顆圖形處理器配置192GB記憶體,谷歌最新AI晶片Ironwood TPU同樣需搭配192GB高頻寬記憶體;AMD現行MI350則一口氣配備288GB

財訊快報 ・ 3 天前發起對話

震撼彈!全球DRAM三哥退出「消費記憶體市場」 背後原因曝光

全球第三大記憶體(DRAM)廠美國美光科技於周三(3日)拋出震撼彈,正式宣布退出消費型記憶體市場,未來營運將全面轉向高性能人工智慧(AI)晶片與資料中心需求。

中時財經即時 ・ 3 天前6

陸科技巨頭 攻AI玩具市場

華為、京東、優必選等大陸科技巨頭近期不約而同進軍AI玩具市場,引爆新一波硬體商機。隨著AI技術應用普及,這塊原本不起眼的市場正快速崛起,機構預估2025年規模將達人民幣(下同)290億元,成為AI硬體「新藍海」。

工商時報 ・ 4 天前發起對話

《科技》AI基礎建設助力 NAND價Q4拚續漲25%

【時報記者葉時安台北報導】根據TrendForce最新調查,2025年第三季因雲端服務業者(CSP)持續擴建AI基礎建設,對企業級enterprise SSD需求強勁,帶動前五大NAND Flash品牌商合計營收季增16.5%,逼近171億美元。上半年的減產措施奏效,下半年供需失衡情況獲得改善,加上enterprise SSD銷售占比提高,各原廠的平均銷售單價(ASP)皆有上漲。展望第四季,預計將支撐第四季整體NAND Flash價格持續上漲,各產品漲幅將落在20-25%間,帶動營收再度成長。 展望第四季,AI應用將持續推升CSP對高效能TLC enterprise SSD、QLC enterprise SSD的需求,然原廠庫存回歸正常,製程轉換期間造成自然損失,將限縮出貨量成長幅度,且HDD供應依然短缺,預計將支撐第四季整體NAND Flash價格持續上漲,各產品漲幅將落在20-25%間,帶動營收再度成長。 分析各供應商第三季營收表現,Samsung的手機用NAND Flash產品儘管在中國市場面臨本土業者瓜分市占率,其enterprise SSD銷售仍然強勁,推升第三季營收季增15

時報資訊 ・ 4 天前發起對話

AI熱潮引爆記憶體晶片供應危機 科技大廠搶貨 手機廠警告可能漲價

路透報導,有鑑於全球記憶體晶片短缺,使得人工智慧(AI)和消費性電子公司被迫爭奪日益減少的供應,這些較低階但卻必備的晶片如今價格水漲船高。而智慧型手機製造商也警告,由於記憶體成本飆升,手機價格可能即將上漲。

中時財經即時 ・ 4 天前發起對話
最狂缺貨潮 創見通知客戶:10月以來沒拿到新晶片、價格還翻倍漲

最狂缺貨潮 創見通知客戶:10月以來沒拿到新晶片、價格還翻倍漲

記憶體大缺貨情況前所未見,缺貨一波接一波,創見 (2451-TW) 也傳出通知客戶,由於 SanDisk 跟三星的 NAND 交貨遞延,第四季拿到的貨大幅減少,且上週成本就上漲 50-100%,價格上漲速度正以極快的速度和異常的幅度持

鉅亨網 ・ 4 天前發起對話

《台北股市》記憶體熱 華邦電、群聯帶頭衝

【時報-台北電】記憶體族群股價修正已久,研究機構對其基本面的看好熱度卻始終不退。金控旗下投顧研究機構指出,DRAM、NAND持續供不應求,研判報價上升循環將延續至2026年下半年;法人點名熱門指標股華邦電(2344)、群聯(8299),將是族群重返多頭的領頭羊。 過往如只是因供給端DRAM換代與短期的補庫存需求,通常報價上升周期僅能維持二至三季;相對地,能延續四至六季報價上升之周期,則需要由強勁需求所帶動。 例如:一、2012~2014年智慧機出貨量強勁年增(年複合成長率約35%);二、2016~2018年DRAM產品換代加上雲端服務供應商(CSP)加大投入伺服器之資本支出;三、2021~2022年WFH需求。 金控旗下投顧研究機構最新預估,2026年DRAM與NAND報價上升周期將延續至年底,主要原因有四:一、需求端CSP伺服器訂單高於預期,進一步排擠其他應用之供應;二、HBM持續供不應求,且位元產出耗用量大;三、以物料清單(BOM)成本與規格調整彈性來看,對AI伺服器影響相對輕微;四、原廠DRAM與NAND月產能擴張有限,主要聚焦在製程升級提升產出。 以DDR4產能規畫來看,原廠D

時報資訊 ・ 4 天前1

美光退出消費記憶體市場

美光(Micron)向通路證實,因NAND配額大幅不足,將退出旗下Crucial消費性產品線。產業人士指出,這並非一般策略調整,而是「連原廠自家消費品牌都無貨可配」,象徵全球記憶體市場正在被AI巨浪重新分配。

工商時報 ・ 3 天前發起對話

《國際產業》不只產業洗牌!AI狂熱引爆記憶體大缺貨 全球經濟剉咧等

【時報編譯柯婉琇綜合外電報導】全球記憶體晶片嚴重短缺,AI產業和消費電子製造商都為半導體搶破頭,導致半導體晶片價格飆升,其造成的衝擊可能從科技業擴大到總體經濟。 根據路透社所做的產業調查,日本電子商場已經開始對硬碟祭出限購令。中國智慧型手機製造商警告可能漲價。消息人士透露,微軟、Google和字節跳動(ByteDance)等科技巨頭都爭相向美光、三星電子和SK海力士等記憶體晶片製造商搶貨。 從USB隨身碟和智慧手機使用的快閃記憶體到資料中心AI晶片所需的高頻寬記憶體(HBM),幾乎所有類型的記憶體都缺貨。根據TrendForce的調查,自今年2月以來,一些類別的記憶體價格已經翻漲一倍以上,這也吸引許多投資人押注這波半導體股漲勢後市可期。 半導體晶片大缺貨的影響可能遠不止於在科技業。許多經濟學家和企業高層警告半導體長期短缺可能減緩AI帶來的生產力提升,並拖慢數千億美元的數位基礎建設計畫。在許多經濟體正試圖抑制物價上漲和應對美國關稅之際,半導體晶片短缺還可能加劇通膨壓力。 科技顧問公司Greyhound Research執行長Sanchit Vir Gogia表示,記憶體短缺現在已經從一個

時報資訊 ・ 4 天前發起對話

《半導體》京元電EPS年年拚高 法人喊價至250元

【時報記者葉時安台北報導】京元電子(2449)受惠AI帶動測試需求強勁,產能供不應求狀況將在2026年延續,故積極進行廠房租進和設備採購。展望後續營運,營收連兩年挑戰歷史新高,且同步帶動獲利改善,中長期資本支出支持成長,AI產能建設積極,推升營運表現。本土法人評估,營運成長性將顯著高於產業平均,目標價從236元調升至250元,維持買進Buy投資目標。 Burn In測試隨GPU客戶對可靠度要求提升而增加,而Burn in後需要再次進行成品測試,使總測試時長提升,代客戶良率穩定後可能再進行調整而下降。另一方面,消費性產品測試時間也隨晶片導入AI、功能、複雜度提升,由過往的每世代增加15-30%,在近年加速到50%。法人預期,京元電2026年ASIC營收在明年隨新品放量和包含CP測試後將翻倍,並連同GPU,將AI占比由今年的25-30%提升至35-40%。 京元電今年第四季主要動能仍來自AI需求(含GPU和ASIC)延續,手機客戶旗艦新品備貨,其他non-AI客戶需求維持疲弱,京元電預期全年營收成長幅度仍可挑戰公司歷史新高。以業務別來看,預期產品測試、老化測試需求提升,帶動產能利用率提升至

時報資訊 ・ 3 天前發起對話
AI晶片需求續旺 京元電Q4營收續揚、毛利率可望優於Q3

AI晶片需求續旺 京元電Q4營收續揚、毛利率可望優於Q3

京元電 (2449-TW) 受惠 AI 需求續強,法人估,第四季營收將呈現季增,毛利率還可望優於第三季的 36.02%,全年營收年增幅可望成為公司歷年來成長最快的一個年度。

鉅亨網 ・ 17 小時前發起對話
HBM缺貨急升溫!華邦電午盤大逆轉漲破半根 外資回流炸31萬張大量

HBM缺貨急升溫!華邦電午盤大逆轉漲破半根 外資回流炸31萬張大量

[FTNN新聞網]財經中心/綜合報導記憶體供應吃緊題材持續延燒,DRAM庫存僅剩2~4週、市場更傳出有客戶搶簽華邦電(2344)6年長約。今(5)日資金持續湧入記憶...

FTNN新聞網 ・ 2 天前1