OpenAI緊張?對手Mistral開源模型效能直逼GPT-4

MoneyDJ新聞 2024-02-01 13:48:31 記者 郭妍希 報導

法國新創商Mistral近來外洩的開源AI模型剛剛獲得高層認證,而根據網友測試,其效能直逼OpenAI目前最強大的大型語言模型(LLM)「GPT-4」。

VentureBeat 31日報導,1月28日左右,一位代號「Miqu Dev」的網友在開源AI模型與編碼分享平台HuggingFace張貼了一組檔案,組合起來後便成為全新LLM「miqu-1-70b」。該名網友並提到,這款LLM的提示模板(Prompt format,指使用者與之互動的方式)跟Mistral一樣。

有人隨即透過社交平台X分享了上述訊息。網友N8 Programs 31日在X指出,不管「Miqu」是甚麼,這款LLM在情感智能評分標竿軟體「EQ-Bench」的跑分高達83.5分,擊敗世界上幾乎每一款LLM,僅落後GPT-4。

機器學習(ML)研究人員也注意到Miqu。摩根大通(JP Morgan & Chase)機器學習科學家Maxime Labonne 31日透過LinkedIn網站指出,Miqu是不是「MIstral QUantized」的縮寫,目前還無法確定,但Miqu已快速成為最佳的開源LLM之一。調查雖仍在進行中,但估計大家很快就能看到表現超越GPT-4的Miqu微調版本。

在機器學習界,Quantization (中文稱作量化)是一種以短數字序列取代特定長數字序列的技術,可讓AI模型在功能較不強大的電腦、晶片上執行。

廣告

消息延燒幾天後,Mistral執行長Arthur Mensch終於在2月1日透過X證實,「提前獲得存取權的客戶中,一名過度熱情的員工外洩了我們訓練並公開發送過的舊模型,且是經過量化(並打上水印)的版本。」

Mensch說,「為了趕快跟特定客戶展開合作,我們在取得整個叢集後立刻重新訓練了這款源自Llama 2的模型——預訓練(pretraining)在Mistral 7B釋出當天就已完成。」他還說,自此之後公司進展良好,敬請期待!(stay tuned!)

VentureBeat報導指出,Mensch說「敬請期待」,似乎暗示Mistral訓練的「Miqu」模型不但效能已經逼近GPT-4,現在還可能追平、甚至超越GPT-4。

這對整個生成式AI及電腦科學界而言,將是關鍵的分水嶺。GPT-4自2023年3月釋出以來,就一直是全球最強大、效能最高的LLM,連Google目前的「Gemini」模型都比不上。一個效能媲美GPT-4的開源AI模型(理論上可免費使用),勢必會對OpenAI造成極大競爭壓力,尤其是在愈來愈多企業都開始檢視開源AI模型的情況下。

Mistral創辦人分別為Arthur Mensch、Timothée Lacroix及Guillaume Lample,三人之前曾擔任過Meta及Google的研發人員,協助Meta打造過開源軟體的LLAMA模型。Mistral去(2023)年12月募資4億美元、估值因而攀升至20億歐元,輝達(Nvidia Corp.)也是投資者及夥伴。相較之下,OpenAI的估值約達860億美元。

(圖片來源:shutterstock)

*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

延伸閱讀:

蘋果傳挑微軟GitHub Copilot、開發AI編程工具

H100比MI300X貴四倍?分析師喊輝達上看800美元

資料來源-MoneyDJ理財網