OpenAI推GPT-4、律師資格考贏90%人類 錯誤更少

MoneyDJ新聞 2023-03-15 08:59:07 記者 郭妍希 報導

人工智慧(AI)聊天機器人「ChatGPT」開發商OpenAI宣布,推出最新版大型語言模型「GPT-4」,聲稱能在美國大學的入學SAT測驗擊敗90%人類、並在律師資格考試(Bar examination)擊敗90%受試者。

CNBC、Forbes等外電報導,OpenAI 14日在官方部落格宣布推出GPT-4,使用微軟(Microsoft)的Azure公用雲端服務平台進行訓練,跟過去的版本相比規模更龐大。這代表該模型受過更多資料訓練、模型檔案更具份量,營運成本也更昂貴。OpenAI宣稱,GPT-4在許多專業測試的表現已「可媲美人類」(human-level performance)。

OpenAI表示,GPT-4生成的答案錯誤更少、正確性比GPT-3.5高40%,也較不會超脫常軌、大聊禁忌話題,在許多標準化測驗的表現甚至比人類優秀。值得注意的是,GPT-3.5及GPT-4閒聊時差別雖不大,但若任務夠複雜,GPT-4比GPT-3.5更可靠、有創意且能處理更多微妙指令。

根據OpenAI說法,GPT-4可在律師資格考試擊敗90%人類、在國際生物奧林匹亞(Biology Olympiad)擊敗99%高中生。事實上,GPT-4在至少34種涵蓋總經、寫作、數學等領域的測驗皆名列前茅(各項測驗的成績見此)。

有趣的是,GPT-4如今可接受圖片及文字指示,用戶能展示一張食材的照片,詢問可以做成甚麼食物。GPT-4現在也可保留超過25,000字的文字,能進行更長的對話及回應。

廣告

不過,OpenAI警告,GPT-4未臻完美,許多情境仍然不如人類,且還是有「幻覺」(hallucination)的問題,也就是會捏造資訊,生成的文字或許跟事實不符。不只如此,GPT-4依舊傾向在出錯時堅持自己是對的。

OpenAI 表示,GPT-4仍有許多必須設法解決的已知限制,例如社會偏見、幻覺及對抗提示(adversarial prompts)。

GPT-4將提供ChatGPT付費訂閱戶使用,也可做為應用程式開發介面(API)的一部分,讓程式設計師把這款AI整合至手中的app。OpenAI會對750字的文字提示收費3美分、750字的回應收費6美分。

科技市調機構IDC近日才剛發表研究報告指出,2023年全球對AI系統的支出將年增27%至1,540億美元,之後每年平均有望成長27%、到2026年支出將超過3,000億美元。

IDC分析師Mike Glennon表示,引進AI速度緩慢的企業,無論規模大小都會落後競爭對手。企業應用AI的最佳方式,就是藉此放大人類的能力、把重複的任務自動化、提供個人化建議,並快速且正確地依據大數據下決策。

(圖片來源:Shutterstock)

*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

延伸閱讀:

研調:AI市場正式開啟「大模型驅動的AI時代」

陸促加快工業互聯網等應用,壯大數位經濟產業

資料來源-MoneyDJ理財網