OpenAI緊張？對手Mistral開源模型效能直逼GPT-4

Moneydj理財網

2024年2月1日上午12:48

MoneyDJ新聞 2024-02-01 13:48:31 記者郭妍希報導

法國新創商Mistral近來外洩的開源AI模型剛剛獲得高層認證，而根據網友測試，其效能直逼OpenAI目前最強大的大型語言模型(LLM)「GPT-4」。

VentureBeat 31日報導，1月28日左右，一位代號「Miqu Dev」的網友在開源AI模型與編碼分享平台HuggingFace張貼了一組檔案，組合起來後便成為全新LLM「miqu-1-70b」。該名網友並提到，這款LLM的提示模板(Prompt format，指使用者與之互動的方式)跟Mistral一樣。

有人隨即透過社交平台X分享了上述訊息。網友N8 Programs 31日在X指出，不管「Miqu」是甚麼，這款LLM在情感智能評分標竿軟體「EQ-Bench」的跑分高達83.5分，擊敗世界上幾乎每一款LLM，僅落後GPT-4。

機器學習(ML)研究人員也注意到Miqu。摩根大通(JP Morgan & Chase)機器學習科學家Maxime Labonne 31日透過LinkedIn網站指出，Miqu是不是「MIstral QUantized」的縮寫，目前還無法確定，但Miqu已快速成為最佳的開源LLM之一。調查雖仍在進行中，但估計大家很快就能看到表現超越GPT-4的Miqu微調版本。

在機器學習界，Quantization (中文稱作量化)是一種以短數字序列取代特定長數字序列的技術，可讓AI模型在功能較不強大的電腦、晶片上執行。

消息延燒幾天後，Mistral執行長Arthur Mensch終於在2月1日透過X證實，「提前獲得存取權的客戶中，一名過度熱情的員工外洩了我們訓練並公開發送過的舊模型，且是經過量化(並打上水印)的版本。」

Mensch說，「為了趕快跟特定客戶展開合作，我們在取得整個叢集後立刻重新訓練了這款源自Llama 2的模型——預訓練(pretraining)在Mistral 7B釋出當天就已完成。」他還說，自此之後公司進展良好，敬請期待！(stay tuned!)

VentureBeat報導指出，Mensch說「敬請期待」，似乎暗示Mistral訓練的「Miqu」模型不但效能已經逼近GPT-4，現在還可能追平、甚至超越GPT-4。

這對整個生成式AI及電腦科學界而言，將是關鍵的分水嶺。GPT-4自2023年3月釋出以來，就一直是全球最強大、效能最高的LLM，連Google目前的「Gemini」模型都比不上。一個效能媲美GPT-4的開源AI模型(理論上可免費使用)，勢必會對OpenAI造成極大競爭壓力，尤其是在愈來愈多企業都開始檢視開源AI模型的情況下。

Mistral創辦人分別為Arthur Mensch、Timothée Lacroix及Guillaume Lample，三人之前曾擔任過Meta及Google的研發人員，協助Meta打造過開源軟體的LLAMA模型。Mistral去(2023)年12月募資4億美元、估值因而攀升至20億歐元，輝達(Nvidia Corp.)也是投資者及夥伴。相較之下，OpenAI的估值約達860億美元。

(圖片來源：shutterstock)

＊編者按：本文僅供參考之用，並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦，讀者務請運用個人獨立思考能力，自行作出投資決定，如因相關建議招致損失，概與《精實財經媒體》、編者及作者無涉。

相關內容

最新報導