NVIDIA加速開源大型語言模型Meta Llama 3 的高效推理

工商時報張珈睿

2024年4月18日下午10:43

輝達（NVIDIA）19日宣布與Meta合作，針對旗下最新開源的大型語言模型Llama 3進行了全面優化，使其能夠在NVIDIA GPU上高效運行推理任務。無論是雲端服務、數據中心、邊緣設備還是個人電腦，Llama 3現在都可以充分發揮NVIDIA硬體的加速能力。

作為下一代開創性的大型語言模型，Llama 3具有超過700億個參數，具備出色的自然語言理解和生成能力。Meta的工程團隊利用NVIDIA的AI超級電腦集群，搭載了2.4萬顆H100 Tensor Core GPU，進行了Llama 3的訓練工作。在NVIDIA的支援下，Meta針對網絡、軟件和模型架構做了專門的調整。

Llama 3推理版本將借助NVIDIA的GPU加速技術，大幅提升在生產環境中的推理性能和效率。開發者可以直接在ai.nvidia.com的瀏覽器中體驗Llama 3。它被封裝為標準微服務，擁有通用API接口，可輕鬆部署於任何環境。

企業用戶也能夠基於自身數據，使用NVIDIA開源的NeMo框架對Llama 3進行微調，將其應用於實際業務場景。客製化模型還可利用NVIDIA TensorRT-LLM進行推理優化，並通過NVIDIA Triton推理服務器進行部署。

更令人興奮的是，NVIDIA將Llama 3優化部署在業界領先的Jetson邊緣AI平台上，為機器人、物聯網等賦能。同時，Llama 3在NVIDIA的RTX和GeForce GPU上也可實現高效加速，直接讓過億消費級GPU設備受益。

針對實際應用場景，NVIDIA進行了詳細的性能測試。結果顯示，在配備單張H200 GPU的系統上，能夠同時為300位用戶提供基於Llama 3的聊天機器人服務，每秒處理3000個詞元。而在Jetson AGX Orin和Nano邊緣平台上，Llama 3的推理速度也可達到每秒15-40個詞元。

通過與Meta等合作夥伴的緊密協作，NVIDIA正在為開源AI社區注入强勁動力，推動大型語言模型在各行各業的應用落地，塑造AI的未來。

Mashdigi·17 小時前
NVIDIA更新ChatRTX功能，加入支援Gemma等人工智慧模型、新增影像識別能力
NVIDIA在今年2月時展示可在裝置端獨立運作的「Chat With RTX」聊天機器人，目前加入更多新功能，並且支援最新人工智慧模型，而此次更新也在DLSS 3.5加入包含光線重建技術，並且將強化NVIDIA RTX Remix中包含光線追蹤效果模組的表現。
華視·2 天前
台灣專屬AI引擎！　「台版ChatGPT」升級釋新模型
生成式AI席捲各界，但國際上許多大型語言模型，容易產生資訊偏誤、以及與台灣文化衝突的狀況。國科會為此在去年四月開始研發「台版ChatGPT」。昨(29)日釋出最新模型，持續升級繁體中文使用體驗。而Ch...
Reactions1
行銷人·1 天前
避免依賴輝達！Meta推出自研AI晶片並與Open AI加深合作
商傳媒｜記者許方達／綜合報導隨著AI應用越來越廣， […] 這篇文章避免依賴輝達！Meta推出自研AI晶片並與Open AI加深合作最早出現於行銷人。
台灣醒報·1 天前
歐盟緊盯大企業左打假、右查漂綠
【台灣醒報記者呂翔禾綜合報導】歐盟環保與數位法規嚴格，近日還對社群軟體與航空業啟動調查，令企業叫苦連天！歐盟近日將調查Meta旗下的臉書與IG，質疑他們打擊假訊息、下架詐騙廣告不力；另外，歐盟也將調查20家航空公司，認為他們透過「漂綠」誇大節能減碳成果。由於歐盟有《數位服務法》、碳稅等規定，企業常與歐盟發生訴訟或意見衝突。 ##調查減碳與資訊業根據《[半島電視台]( https://www.aljazeera.com/news/2024/4/30/eu-launches-action-against-20-airlines-for-greenwashing)》報導，歐盟執委會與...
三嘻行動哇·3 小時前
Meta 釋出 Quest v65 更新，借鏡 Vision Pro 加入新功能並改進穿透功能
Meta Quest 在官方部落格公布將推出 v65 更新，這次更新主要功能是借鏡 Apple Vision Pro 頭戴裝置而生的 VR 全景照，以及針對 Q
中廣新聞網·4 小時前
提升雲端服務　微軟首個區域資料中心落腳泰國
微軟（Microsoft）宣布，他們將在泰國開設第一個區域資料中心，以提高微軟蔚藍（Azure）雲端服務的用途。微軟發表聲明稱，這個區域資料中心，將擴大微軟「超大規模雲端服務」的可用性。聲明中
Moneydj理財網·7 小時前
FOMC：6月放慢QT，公債縮表上限砍至250億美元
MoneyDJ新聞 2024-05-02 08:23:24 記者郭妍希報導聯邦公開市場委員會(FOMC)週三(5月1日)結束貨幣政策會議時宣布，將放慢縮減資產負債表(又稱量化緊縮貨幣政策、QT)的速度，以免對金融市場造成不必要的壓力。路透社、CNBC等外電報導，聯準會(Fed)指出，自6月1日起，每個月讓公債到期後不再投入本金的金額上限，將從原本的600億美元大幅下修至250億美元，不動產貸款抵押證券(MBS)到期後不再投入本金的上限則維持350億美元不變。此外，額外支付的MBS本金將投入公債。 Fed放慢縮表雖在市場意料之中，但人們原本預測公債每個月到期後不再投入本金的上限僅將下修至300億美元，也不清楚Fed究竟要在本週抑或是6月的FOMC會議公布縮表放慢時程。 Fed主席鮑爾(Jerome Powell、見圖) 1日在會後記者會表示，最新上限大概會讓縮表速度放慢至每月400億美元。他的說法暗示，Fed實際上的縮表速度常常無法達標，尤其是在MBS方面。鮑爾並強調，放慢縮表速度並不是要讓貨幣政策變寬鬆、或減少對經濟的限制性。他說，「這主要是確保縮表的過程能保持順暢，不會像上次
FTNN新聞網·1 天前
信義房屋女力來襲　房仲二寶媽入職首年年薪破百
[FTNN新聞網]財經中心／綜合報導近年來企業除了落實ESG，為女性打造DEI（多元共融）職場環境，也成為吸引女性人才加入的重要政策。根據知名女性媒體今年發布...
Reactions3
非凡新聞節目影音·44 分鐘前
5分鐘看台股/2024/05/02收盤最前線
今日盤勢重點美AI科技股重挫大盤震盪破月線台積電壓盤零股交易衝個股第一營建輪流亮燈航空觀光政策帶旺利多漲不動? 貨櫃.重電開高走低
Business Wire·11 小時前
Rocket Software以22.75億美元完成收購OpenText的應用程式現代化和連接業務
麻塞諸塞州沃爾瑟姆, May 01, 2024--(美國商業資訊)--現代化軟體領域的全球技術領導者Rocket Software是全球頂級規模企業現代化進程中的首選合作夥伴，而且地位不斷提升。該公司完成了對OpenText（原Micro Focus旗下公司）應用程式現代化和連接（AMC）業務的收購，現在可為客戶提供涵蓋大型電腦和雲端的現代化軟體解決方案。此交易的總收購價為22.75億美元（稅費及其他調整前），使公司收入增加60%以上，客戶群擴大到12,500多家企業，網路覆蓋全球750多個合作夥伴。此外，該公司還新增了770多位軟體工程師、市場進入專業人員及其他支援團隊成員，並且正在招募數百名Rocketeers來補充現有團隊。
鉅亨網·18 小時前
〈美股早盤〉市場靜待Fed利率決策出爐主要指數漲跌互現
美股主要指數周三 (5/1) 漲跌互現，受晶片股財報表現不佳領跌影響，目前市場靜待稍晚聯準會 (Fed) 公布最新利率決策，以及觀察最新出爐的經濟數據。

Yahoo奇摩股市·24 分鐘前
存股族報稅注意！領股利也可節稅　1招抵減稅額省荷包
5月報稅季，存股族注意了！領股利也可節稅，券商業者提醒，存股族領到的股票股利屬於股利收入，要計入個人綜合所得，可運用8.5%股利抵減稅額省荷包。此外，面對近期台股回跌套牢或資金周轉壓力，投資人如有短期資金需求，不必急著賣股變現，可善用股票借貸，將庫存股票作為擔保品。
Yahoo奇摩股市·53 分鐘前
KKBOX母公司「科科科技」海外市場傳捷報
科科科技（KKT-KY，6950）除旗下KKBOX年度經常性收入占比年年穩定增長外，目前海外市場傳來好消息。
中時財經即時·7 分鐘前
恐怖巧合！又一波音吹哨者身亡他踢爆737 MAX生產缺陷驟逝
美國波音737 MAX客機事故頻發，但揭發公司弊端的人下場似乎都很慘，繼先前一名吹哨者疑似輕生身亡後，又爆出另一名舉報者因感染驟然病逝。
民視·38 分鐘前
"台灣天糰"雙冠軍出爐! 葷.素口味上架超商.量販店
財經中心／吳任瑜、胡崇恩台北報導農業部農糧署第2屆台灣天糰爭霸戰，選出2款冠軍飯糰，將在超商及量販店上架，農糧署表示，國人每年平均吃的米，逐年下降，希望藉此提高食米糧，因此號召全民一起吃飯糰，用實際行動，支持有產銷履歷的台灣好米，以及辛苦的農民。
民視·32 分鐘前
引進義大利"奇亞尼那牛" 飯店推36盎司巨無霸丁骨牛
財經中心／呂中漁、陳聖翰台北報導不同於美國牛肉和澳洲牛肉，義大利的奇亞尼那牛，有著濃郁的肉香，和淡淡香草的氣息，有飯店業者就找來義大利肉品商，推出36盎司巨無霸的丁骨牛排，並使用西西里島的料理手藝，讓民眾能吃到原汁原味。
Reactions1
買購不動產新聞台·32 分鐘前
是真愛？「西華富邦」原住戶6.6億再買2戶
【MyGoNews蕭又安/綜合報導】不動產抗通膨，富豪購屋不手軟，大直豪宅「西華富邦」原住戶加碼，以6.6億元無貸款一次打包兩間高樓層戶別，單價約220~221萬元；此外，「西華富邦」中樓層也有新鄰居，一自然人同樣以無貸款入手一戶，總價約2.4億元、單價209.6萬元，「西華富邦」兩百萬俱樂部身價屹立不搖。
Yahoo奇摩財經編輯室·1 小時前
【看圖說股市】八大公股行庫是哪些？跟國安基金有什麼關係？對股市的影響為何？
在股市走跳的股民一定對「八大公股/官股」不陌生，但你數得出這「八大」是哪8家行庫嗎？除了八大行庫，四金二銀又是什麼？他們在台股中扮演怎麼樣的角色？透過本文就能一次搞清楚！
Reactions1
買購不動產新聞台·25 分鐘前
高力國際推出大台北公開標售不動產9案
【MyGoNews蕭又安/綜合報導】2024年商用不動產交易熱度節節升溫，根據商仲業者高力國際統計，2024年第一季商用不動產及土地交易總金額分別高達438億元及469億元，均遠高於2023年同期水準。
CTWANT·25 分鐘前
姐報稅搶申報爸！怒嗆「男生賺比較多」：人家是女生　高薪男氣炸：罵我是畜生
[周刊王CTWANT] 原PO在PTT以「大家繳所得稅了嗎」為題表示，姐姐住外縣市，一個月會回來探望爸爸1、2次，收入大約只有他的4成，豈料近日報稅季，「剛剛姐姐傳訊息來，說她要申報扶養父親，如果可以，她希望我連小孩也給她申報扶養，說她這樣子就可以繳很少的稅。」原PO當下立刻問，「為什麼...
Reactions1
三立新聞網 setn.com·12 分鐘前
旭新科技涉吸金遭起訴　486先生見「1現象」不解開轟：出事再罵政府？
娛樂中心／蔡佩伶報導台中地檢署去年9月偵辦旭新科技股份有限公司與代表人陳育澍等14人，該公司以「年報酬率7%至12%」高報酬率作為宣傳，向民眾吸金高達73億元，投資
財訊快報·24 分鐘前
七大都會區購屋年齡遞延，台北50歲以上購屋達三成
【財訊快報／記者張家瑋報導】30至40歲的青壯年向來被視為購屋的主力年齡，但受到高房價現象的影響，購屋年齡出現遞延，根據聯徵中心購置住宅貸款統計資訊顯示，近10年購屋年齡占比的變化，雖然30至40歲仍是購屋主力，但是40至50歲、50歲以上年齡層的購屋占比幾乎全面上升，而台北市的購屋主力年齡更已移轉至40至50歲，顯見購屋年齡向後遞延的現象。永慶房屋研展中心副理陳金萍表示，對比2023年與10年前購屋環境，薪資所得成長趨於停滯，近幾年房價卻持續走高，讓消費者需要花費更多的時間累積足夠的頭期款，才能達到購屋的門檻，使購屋的年齡也出現遞延的現象。七都中房價最高的台北市，購屋年齡向後遞延現象尤為明顯。2013年台北市30至40歲購屋的占比達32.9%，仍為4年齡區間中最高；但到了2023年，便下降至26.7%。而40至50歲的占比則躍升至33.7%，50歲以上亦達到三成，雙雙超越30至40歲的占比。新北市30至40歲和40至50歲的占比也迅速拉近，2023年的占比差距已不到1%，2023年新北市50歲以上交易占比高達21.2%，僅次於台北市。顯見房價上漲、只能拉長存款期間，以致購屋年齡遞延，
時報資訊·19 分鐘前
《通網股》中華電Q1多項數據超標董座：新三雄版圖持續擴大領先
【時報記者王逸芯台北報導】中華電(2412)今(2)日舉辦法人說明會，第一季每股賺1.21元，財報表現亮眼，包括營業淨利、EBITDA及歸屬於母公司業主之淨利皆超越財測目標。面對新電信三雄的競爭格局，董事長郭水義表示，中華電持續擴大市場領先。中華電第1季合併營收為549.4億元，較去年同期增加1.4%；營業淨利為119.1億元，減少2.2%；EBITDA為218.2億元，較去年同期減少1.1%；歸屬於母公司業主之淨利為93.9億元，減少2.6%；每股盈餘1.21元；營業淨利、EBITDA及歸屬於母公司業主之淨利皆超越財測目標。董事長郭水義表示，中華電以第一季的強勁表現邁入2024年，由於公司策略有效執行及團隊的優秀表現，第一季整體營收創2017年以來同期新高，稅前淨利排除一次性政府補助收入影響後，則為2016年以來同期最高；同時，中華電強勁的成長動能，持續推升在台灣行動市場的行動服務營收市占率及客戶數市占率，第一季分別達40.4％與37.7％，在新的三家競爭格局中，持續擴大市場領先。郭水義進一步指出，中華電將持續投資於AI基礎設施，提升營運效益與服務品質，以利在AI帶動的轉型浪潮
中時財經即時·14 分鐘前
上市公司永續揭露實作研習及實務宣導會今日起跑
證交所5月將於北中南三地辦理3場次「上市公司永續揭露實作研習及實務宣導會」，將針對「我國產業淨零永續政策與推動作法及防漂綠議題」、「上市公司永續發展行動方案及ESG近期推動措施」及「減碳技術及碳循環經濟」等議題說明。
華視影音·21 小時前
五月報稅季起跑　國稅局湧現排隊人潮
台北市 / 黃敏惠方起年報導五月起開始報稅，很多民眾搶在第一天就來辦理。各地國稅局也加派人手，但就算櫃檯全線開放，也還是有出現排隊的狀況。除了臨櫃，也有不少人選擇用手機來報稅，各家信用卡也各自推出刷卡繳稅的回饋優惠。財政部鼓勵民眾多用線上繳稅，官方臉書還放上逗趣哏圖，說線上繳稅可以解決你的頭痛。國稅局的椅子沒一張閒著，還搬出了椅子大夥再圍一圈，全都來等報稅，5月1日報稅第一天，也是勞動節勞工休假，不少民眾抓緊空檔來報稅打頭陣，為了消化現場等待的人，還出動了工作人員現場指導民眾利用手機報稅，就不用在現場從天亮等到天黑。許多民眾利用信用卡繳稅享優惠賺回饋，讓口袋的錢也能多點時間緩一緩，包括台銀等20家銀行，可以無條件或低門檻分期零利率，最長的還能分12期。另外像是台灣Pay綁定指定信用卡，送80元到200元的刷卡金，適合稅金較低的小資族，王道銀行簽帳金融卡，或是聯邦LINE Bank聯名卡繳稅，則是6月份消費都有加碼現金回饋，永豐和星展銀行也祭出抽日圓旅遊金，與iPhone 15手機，繳稅大戶如果刷中信卡，稅額滿2000萬，送最高16萬哩航空哩程。信用卡達人子勛說：「以前是可以把稅單拆很多張繳，今年開始是有限制，一個人只能拆幾張稅單去繳納，如果可以在可控範圍內拆成規定張數，分別用各家信用卡繳費，當然可以追求利益極大化。」截至1日傍晚五點為止，根據財政部統計用手機線上報稅的件數，超過24萬件，財政部為了鼓勵大家，多利用手機電腦線上報稅不用跑斷腿，還在官方臉書亮出了勸世圖，頭痛百百種有偏頭痛血壓高壓力大，都沒有五月報稅最頭痛，但是大家報稅最痛的恐怕不是人頭，是我們的戶頭。原始連結
Reactions1
台灣新生報·9 分鐘前
大葉大學會資系培訓納稅服務隊
綜合所得稅申報作業五月起跑，大葉大學會計資訊學系培訓十名大三學生組成 ...
中時財經即時·49 分鐘前
政院通過修法個人及營利事業捐款私校可全數抵稅
為落實公私立學校抵稅額衡平，提高個人或營利事業大額捐款意願，強化興學基金會財務監管功能，行政院會2日通過《私立學校法》修正草案。教育部說明，未來透過興學基金會指定與非指定捐款予學校法人或學校者，可全數作為列舉扣除額或列為費用或損失。
FTNN新聞網·1 小時前
台股大跌174點！最火熱門股出爐　國建盤中飆高收漲2%…網嘆：沖仔再沖啊
[FTNN新聞網]記者薛明峻／台北報導台股今（2）日開低走低，終場因台積電（2330）重挫18元，集中市場也重跌174.16點，收在今日最低點20222.44點，成交量增至38...
Reactions2
中時財經即時·1 小時前
力積電銅鑼新廠啟用成熟製程晶片月產5萬片
晶圓代工廠力積電2日舉行新廠啟用典禮，位在苗栗的銅鑼12吋晶圓新廠從2021年3月開始興建，總投資超過3千億元，主要製程為55、40、28奈米，未來將月產5萬片；未來隨業務成長，還可以在銅鑼廠區興建第2期廠房。
Reactions1
今日新聞NOWnews·27 分鐘前
謝金河曝新財富效應2波大浪抓住堪稱人上人
[NOWnews今日新聞]台股ETF規模突破2兆元、家庭財富分配統計貧富差距拉大，這兩個重要數據揭示台灣的新財富效應。財信傳媒董事長謝金河指出，00940沒站上面額或許是個機會，半導體帶來的新財富效應...
財訊快報·4 分鐘前
醫療保健類股衝高，道瓊歐洲600指數週四開盤小紅，三大股市漲跌互見
【財訊快報／劉敏夫】歐洲股市週四盤初走升，醫療保健類股領軍衝高，成了大盤主要亮點，因聯準會最新貨幣政策決定一如預期，且傳達相對鴿派訊息，令投資人做出正面回應。道瓊歐洲Stoxx 600指數盤初上揚0.22點或0.04%，報504.53點。盤初，20檔產業類股漲跌互見，醫療保健類股指數上漲0.60%，表現最為亮眼。反觀，科技類股指數下跌1.35%，表現最差。歐洲主要股市漲跌互見，其中英國富時100指數盤中上揚0.31%；法國CAC40指數下跌0.39%；德國法蘭克福DAX指數揚升0.05%；西班牙IBEX35指數則是上揚0.47%。聯準會決策者在甫結束的政策會議上將利率維持在5.25%至5.5%的區間，以因應持續的價格壓力。同時，聯準會還放慢了量化緊縮的步伐，此一決議符合預期。聯準會主席鮑威爾還淡化了升息的可能性，但是他也重申了在降息之前需要看到更多證據顯示通膨持續降溫。週四將是歐洲企業財報相對忙碌的一天，AXA、安賽樂米塔爾、諾和諾德、Orsted、維斯塔斯、Hugo Boss、殼牌和渣打銀行等公司都發布了財報。同時，包括瑞士四月通膨數據和義大利三月生產者價格等經濟數據也將在週四發布。

NVIDIA加速開源大型語言模型Meta Llama 3 的高效推理

相關內容

NVIDIA更新ChatRTX功能，加入支援Gemma等人工智慧模型、新增影像識別能力

台灣專屬AI引擎！　「台版ChatGPT」升級釋新模型

避免依賴輝達！Meta推出自研AI晶片並與Open AI加深合作

歐盟緊盯大企業左打假、右查漂綠

Meta 釋出 Quest v65 更新，借鏡 Vision Pro 加入新功能並改進穿透功能

提升雲端服務　微軟首個區域資料中心落腳泰國

FOMC：6月放慢QT，公債縮表上限砍至250億美元

信義房屋女力來襲　房仲二寶媽入職首年年薪破百

5分鐘看台股/2024/05/02收盤最前線

Rocket Software以22.75億美元完成收購OpenText的應用程式現代化和連接業務

〈美股早盤〉市場靜待Fed利率決策出爐主要指數漲跌互現

最新報導

存股族報稅注意！領股利也可節稅　1招抵減稅額省荷包

KKBOX母公司「科科科技」海外市場傳捷報

恐怖巧合！又一波音吹哨者身亡他踢爆737 MAX生產缺陷驟逝

"台灣天糰"雙冠軍出爐! 葷.素口味上架超商.量販店

引進義大利"奇亞尼那牛" 飯店推36盎司巨無霸丁骨牛

是真愛？「西華富邦」原住戶6.6億再買2戶

【看圖說股市】八大公股行庫是哪些？跟國安基金有什麼關係？對股市的影響為何？

高力國際推出大台北公開標售不動產9案

姐報稅搶申報爸！怒嗆「男生賺比較多」：人家是女生　高薪男氣炸：罵我是畜生

旭新科技涉吸金遭起訴　486先生見「1現象」不解開轟：出事再罵政府？

七大都會區購屋年齡遞延，台北50歲以上購屋達三成

《通網股》中華電Q1多項數據超標董座：新三雄版圖持續擴大領先

上市公司永續揭露實作研習及實務宣導會今日起跑

五月報稅季起跑　國稅局湧現排隊人潮

大葉大學會資系培訓納稅服務隊

政院通過修法個人及營利事業捐款私校可全數抵稅

台股大跌174點！最火熱門股出爐　國建盤中飆高收漲2%…網嘆：沖仔再沖啊

力積電銅鑼新廠啟用成熟製程晶片月產5萬片

謝金河曝新財富效應2波大浪抓住堪稱人上人

醫療保健類股衝高，道瓊歐洲600指數週四開盤小紅，三大股市漲跌互見