OpenAI 發表 GPT-4,五大強項輾壓競爭對手,兩種方式先試用!

如上週所揭露,OpenAI 正式發表 GPT-4。根據官方介紹,GPT-4 是 OpenAI 努力擴展深度學習的最新里程碑。GPT-4 是一個大型多模態模型(接受圖像和文本輸入,發出文本輸出),雖然在許多現實世界場景中的能力不如人類,但在各種專業和學術基準上的表現已經超越人類水準。以下先給大家一些重點摘要:

  • 已經能獲得前 10% 的成績,通過律師考試

  • 具備影像解讀能力,給 GPT-4 看梗圖,能說出好笑之處

  • 能從圖片生成程式碼,給 GPT-4 看網頁框架手繪圖,能生成該網頁的程式碼

  • 對英文理解能力從 70.1% 進步到 85.5%,對中文理解能力進步到 80.1%

  • 最弱的數學從 40% 進步到超過 70%

此外,想先試用 GPT-4 的人,可以透過以下兩個途徑:

  • ChatGPT Plus 付費訂閱使用者可以優先獲得 GPT-4 使用權限

  • 微軟宣布 New Bing 已經採用 GPT-4

GPT-4 的進步

  • 多模態模型:從輸入文字、輸出文字,到可以輸入圖像和文字,再輸出文字

  • 文字限制:從 ChatGPT 只能接受 3,000 字,到 GPT-4 可以接受 25,000 字

超強考試能力

取自 <a href="https://openai.com/research/gpt-4" rel="nofollow noopener" target="_blank" data-ylk="slk:OpenAI;elm:context_link;itc:0;sec:content-canvas" class="link ">OpenAI</a> GPT-4 文件
取自 OpenAI GPT-4 文件

GPT-4 當然不是設計來考試的工具,但在技術報告中,在未經訓練的情況下,讓 GPT-4 透過各種專業和學術考試檢驗其能力。如上圖可見,GPT-4 已經比 GPT 3.5 進步非常多,且在大多數考試中都能勝過過半數的人類考試成績,幾乎都有領先 60-80% 的程度。

具備影像解讀能力

取自 <a href="https://openai.com/research/gpt-4" rel="nofollow noopener" target="_blank" data-ylk="slk:OpenAI;elm:context_link;itc:0;sec:content-canvas" class="link ">OpenAI</a> GPT-4 文件
取自 OpenAI GPT-4 文件

可能有人會認為人工智慧沒有情緒,無法理解什麼是幽默有趣,但從上圖的示範,至少 GPT-4 已經可以做到從圖片辨識出物件,並且描述其幽默之處。簡單來說,這不算是有「意識」,但 GPT-4 的理解能力其實是非常傑出的。

此外,GPT-4 被問到圖片中的繩子如果被剪掉,會發生什麼事?它能回答那些氣球就會飛走,這已經從理解到能進行邏輯推理了。

從手繪圖,生成網頁程式碼

在示範中,OpenAI 也展示了上傳一張手繪的網頁設計圖,GPT-4 就能自動理解與推論,並且寫出這個網頁的程式碼。

中文與英文等各種語言理解能力的進步

取自 <a href="https://openai.com/research/gpt-4" rel="nofollow noopener" target="_blank" data-ylk="slk:OpenAI;elm:context_link;itc:0;sec:content-canvas" class="link ">OpenAI</a> GPT-4 文件
取自 OpenAI GPT-4 文件

之前在 ChatGPT 大家都有感受到中文的理解能力與生成內容的質與量都不如英文,主要是受到訓練資料不足的影響。但是在 GPT-4 的技術報告上,看起來這個差距已經大幅降低了,而且並不是訓練資料變多,更是語言模型的進步。

廣告

從實際數字來看,ChatGPT 採用的 GPT 3.5 在英文的精確度只有 70.1%,但是 GPT-4 已經高達 85.5%,而義大利文、南非文、西班牙文、法文、德文等也不相上下,中文(Mandarin)在各語言中排名第 13 名,精確度也已經有 80.1%,換句話說現在用 GPT-4 的中文理解能力,已經高於 GPT 3.5 在英文的精確度。

各種應用能力的進步,與限制

取自 <a href="https://openai.com/research/gpt-4" rel="nofollow noopener" target="_blank" data-ylk="slk:OpenAI;elm:context_link;itc:0;sec:content-canvas" class="link ">OpenAI</a> GPT-4 文件
取自 OpenAI GPT-4 文件

其實這部分在技術報告上的標題是「限制」,意指 GPT-4 在應用上還是有其不足之處,但即便如此,也已經相較於先前的版本進步許多。

從上圖可以看到,在 ChatGPT-v3,的確在數學上精確度不高,只有 40%,但是在 GPT-4 已經進步到將近 80%,就算是 ChatGPT-v4,也有近五成的精確度。

總之,技術報告分析了 GPT-4 在學習、科技、寫作、歷史、數學、科學、推薦、編碼、商業等各領域的能力,其中科學和歷史的表現都相當傑出,而學習和推薦表現也不差。

透過 ChatGPT 使用 GPT-4

OpenAI 表示,ChatGPT Plus 的付費訂閱者將獲得有上限的 GPT-4 使用權限,會根據實際需求和系統性能,調整使用上限,但預計在使用者瘋狂湧入的情況下,會受到嚴重的限制,但將在未來幾個月內擴大規模並優化。

OpenAI 也提到將會根據看到的流量模式,可能會為更高容量的 GPT-4 使用引入新的訂閱級距,也希望在未來提供一些免費的 GPT-4 查詢,讓沒有付費訂閱的人也可以嘗試。

透過 New Bing 使用 GPT-4

微軟則表示,如果你在過去五週內的任何時間使用過新的 Bing 預覽版,那麼你就已經體驗過這個強大模型的早期版本。隨著 OpenAI 對 GPT-4 及更高版本進行更新,Bing 從這些改進中受益。簡單來說,New Bing 使用的已經是 GPT-4 的早期版本了。

如果想體驗 GPT-4,微軟表示可以註冊新的 Bing 預覽版,就能使用新的 Bing 進行搜尋、問答、聊天和創作。

OpenAI 的 GPT-4 開發者功能展示直播

Join Greg Brockman 在示範 GPT-4 時,表示:「我第一次想搞懂稅法的時候,花了一個半小時讀那些條款,卻完全搞不懂,直到我把文件丟進GPT-4然後直接問它問題,由它來推理,我再去讀,我終於搞懂了。這就是我認為這個系統強大的地方。它不完美,你也不完美,但是一起合作就能放大彼此的能力,達到新的高度。」

核稿編輯:陳涵書

《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報

延伸閱讀:
微軟表示 GPT-4 將在下週發表,且提供多模型滿足各種任務需求
Google 宣佈在 Gmail 等產品中加入 AI 生成功能與微軟競爭,但僅在測試狀態