讓財經記者與分析師擔心飯碗的BloombergGPT是什麼?有哪些功能?

Bloomberg 上週發文介紹內部開發的「BloombergGPT」,這個專為財經新聞量身打造的大型語言模型(LLM),以大量的財經數據訓練,可執行金融行業所需的自然語言處理(NLP)任務。BloombergGPT 吸引金融與媒體界的關注,Nieman Lab 創辦人 Joshua Benton 也撰文討論

Q:BloombergGPT 是什麼?

Bloomberg 說明,基於大型語言模型的 AI 進展在許多領域擁有令人驚艷的功能,但對金融領域來說,還需要有更強的工具滿足財經範疇的複雜度以及專有名詞的需求。因而推出「BloombergGPT」來改善金融產業所需的 NLP 服務,例如新聞分類、Q&A、情感分析等等。

同時,BloombergGPT 也會利用大量數據來協助企業客戶洞察新的可能性,企圖在金融領域完整發揮 AI 的潛力。

Q:BloombergGPT 是怎麼訓練的?

在這篇研究報告裡已說明,BloombergGPT 以 7,000 億個以上的 token 訓練。比較一下,2020 年發布的 GPT-3 是以 5,000 億個的 token 來訓練(目前 GPT-4 用多少 token 來訓練則未知)。

廣告

在這些 token 之中,有3,630 億個來自 Bloomberg 自己的金融資料庫,剩下的3,450 億個 token 則來自其他一般的資料庫。

Bloomberg 在研究報告裡表示,團隊同時以通用範疇與特定知識領域訓練 BloombergGPT,通用模型涵蓋的範疇很廣,而特定領域的訓練成果則是通用模型不能取代的,經過混合模式的訓練,BloombergGPT 可以應用在金融領域,在一般範疇的表現也保有競爭力。

訓練 BloombergGPT 的資料從何而來呢?Bloomberg 有個資料庫叫做 FinPile,這裡面包含新聞、公司申報資料、新聞稿、財務文件、社群媒體資訊等一切 Bloomberg 報導過的內容,其他像是提交給 SEC 的表單、Bloomberg 電視台的報導口稿,聯準會資訊,以及其他跟金融市場有關的數據都在裡面。

當然,非 Bloomberg 自產的財經新聞與數據也在這個訓練的範疇中,這是為了讓訊息更多元、更貼近事實,以減少單方面偏頗的觀點。

Q:BloombergGPT 能做什麼?

由於 BloombergGPT 的訓練基礎與其他大型語言模型相同,因此 BloombergGPT 也可以執行跟 ChatGPT 類似的功能。重要的是,BloombergGPT 能滿足 Bloomberg 的需求,例如回答「蘋果與 IBM 的市值與 EPS」這個問題,也能寫出 Bloomberg 風格的新聞標題。

舉例來說,輸入一段新聞報導,就能抓出重點產生新聞標題:

這個研究也比較了 BloombergGPT 與 GPT-3 及其他大型語言模型(LLM)的功能,結果發現 BloombergGPT 在一般任務表現不錯,在金融領域則表現優異。

有人認為,BloombergGPT 的誕生可能取代金融分析師,分析師的工作不就是日復一日收集、組織、解釋這些財務數據嗎?

雖然 Bloomberg 並沒有明說未來打算用 BloombergGPT 做什麼,但隨著持續的訓練,BloombergGPT 可用的功能會超出今天的想像。

本篇研究的共同作者 Mark Dredze 則說:「我們的團隊不大,不要低估訓練模型的時間跟資料…BloombergGPT 的能力讓我們對未來非常期待。我們也還在提升它的功能,探索如何評估與使用它。我們期待社群了解我們的研究經驗,進一步建構更好的模型或應用方式。」

核稿編輯:李柏鋒

《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報

延伸閱讀:
【GTC 2023】黃仁勳對談 OpenAI 首席科學家:ChatGPT 怎麼訓練的?GPT-4 有多強?
比爾蓋茲:AI時代已經來臨!不要過度焦慮,但要思考這3個問題