Bloomberg 上週發文介紹內部開發的「BloombergGPT」,這個專為財經新聞量身打造的大型語言模型(LLM),以大量的財經數據訓練,可執行金融行業所需的自然語言處理(NLP)任務。BloombergGPT 吸引金融與媒體界的關注,Nieman Lab 創辦人 Joshua Benton 也撰文討論。
Q:BloombergGPT 是什麼?
Bloomberg 說明,基於大型語言模型的 AI 進展在許多領域擁有令人驚艷的功能,但對金融領域來說,還需要有更強的工具滿足財經範疇的複雜度以及專有名詞的需求。因而推出「BloombergGPT」來改善金融產業所需的 NLP 服務,例如新聞分類、Q&A、情感分析等等。
同時,BloombergGPT 也會利用大量數據來協助企業客戶洞察新的可能性,企圖在金融領域完整發揮 AI 的潛力。
Meet #BloombergGPT 👋🏻
This 50-billion parameter #LargeLanguageModel was purpose-built from scratch for #finance using a unique mix of @Bloomberg's #data and public datasets to support financial #NLProc tasks.https://t.co/vehdOZtvu0#AI #ArtificialIntelligence #LLMs #ML #GPT— Tech At Bloomberg (@TechAtBloomberg) March 31, 2023
Q:BloombergGPT 是怎麼訓練的?
在這篇研究報告裡已說明,BloombergGPT 以 7,000 億個以上的 token 訓練。比較一下,2020 年發布的 GPT-3 是以 5,000 億個的 token 來訓練(目前 GPT-4 用多少 token 來訓練則未知)。
在這些 token 之中,有3,630 億個來自 Bloomberg 自己的金融資料庫,剩下的3,450 億個 token 則來自其他一般的資料庫。
Bloomberg 在研究報告裡表示,團隊同時以通用範疇與特定知識領域訓練 BloombergGPT,通用模型涵蓋的範疇很廣,而特定領域的訓練成果則是通用模型不能取代的,經過混合模式的訓練,BloombergGPT 可以應用在金融領域,在一般範疇的表現也保有競爭力。
The new BloombergGPT AI may be harbinger of the next wave of corporate AI. Current AIs are trained on web data (though firms can add their own training)
BloombergGPT is 52% either proprietary data or cleaned financial data. And it shows signs of being better at financial tasks. pic.twitter.com/VmDKjg6ztX— Ethan Mollick (@emollick) April 1, 2023
訓練 BloombergGPT 的資料從何而來呢?Bloomberg 有個資料庫叫做 FinPile,這裡面包含新聞、公司申報資料、新聞稿、財務文件、社群媒體資訊等一切 Bloomberg 報導過的內容,其他像是提交給 SEC 的表單、Bloomberg 電視台的報導口稿,聯準會資訊,以及其他跟金融市場有關的數據都在裡面。
當然,非 Bloomberg 自產的財經新聞與數據也在這個訓練的範疇中,這是為了讓訊息更多元、更貼近事實,以減少單方面偏頗的觀點。
Q:BloombergGPT 能做什麼?
由於 BloombergGPT 的訓練基礎與其他大型語言模型相同,因此 BloombergGPT 也可以執行跟 ChatGPT 類似的功能。重要的是,BloombergGPT 能滿足 Bloomberg 的需求,例如回答「蘋果與 IBM 的市值與 EPS」這個問題,也能寫出 Bloomberg 風格的新聞標題。
這個研究也比較了 BloombergGPT 與 GPT-3 及其他大型語言模型(LLM)的功能,結果發現 BloombergGPT 在一般任務表現不錯,在金融領域則表現優異。
有人認為,BloombergGPT 的誕生可能取代金融分析師,分析師的工作不就是日復一日收集、組織、解釋這些財務數據嗎?
BloombergGPT is going to replace the Analyst
Analysts are fundamentally chat-based interfaces that senior finance folks use to gather, organize, and output data
Finance workflows are already very iterative and GPT doesnt care about protected Saturdays🧵https://t.co/3pwdX9boHT pic.twitter.com/2ayyWIhPMd— Van Spina (🌴,🥷) (@palmtreeshinobi) March 31, 2023
雖然 Bloomberg 並沒有明說未來打算用 BloombergGPT 做什麼,但隨著持續的訓練,BloombergGPT 可用的功能會超出今天的想像。
本篇研究的共同作者 Mark Dredze 則說:「我們的團隊不大,不要低估訓練模型的時間跟資料…BloombergGPT 的能力讓我們對未來非常期待。我們也還在提升它的功能,探索如何評估與使用它。我們期待社群了解我們的研究經驗,進一步建構更好的模型或應用方式。」
Our amazing team is smaller than others who built similar models. That reflects the progress that has been made in model training, and the value of publicly sharing our experiences. DO NOT underestimate the time and data needed, but we’re hoping our experience helps others.
— Mark Dredze (@mdredze) March 31, 2023
《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報。
【GTC 2023】黃仁勳對談 OpenAI 首席科學家:ChatGPT 怎麼訓練的?GPT-4 有多強?