李鎮宇專欄-對話革命:ChatGPT模型與AI的未來

ChatGPT 是一個近期非常熱門的話題,註冊用戶數在兩個月內就突破1億人,連Bill Gates都認為,OpenAI的GPT是自1980年GUI問世以來,最具革命性的科技進步。

為了讓ChatGPT的回答更貼近真人,OpenAI 採用了一系列方法進行優化。首先,他們收集了過去用戶曾問過GPT的問題,請真人給出優化過的答案,再利用這些資料去訓練ChatGPT,使得模型有更高的機率給出接近真人的回答。

其次,ChatGPT會給出優化過的對話內容,接著進行人工評分,將模型的答案從最好到最差進行排序。OpenAI利用這些評分,訓練另一個「獎勵模型」,扮演老師的角色,而ChatGPT則作為學生。在這個訓練過程中,學生ChatGPT模型不斷給出對話,而老師獎勵模型根據答案評分,藉由強化學習自成循環,最終目標是讓ChatGPT能給出最佳化的對話結果。

在第三步驟中,ChatGPT不再需要人工干預,而是自成循環與獎勵模型互動。OpenAI採用的強化學習方法為近端策略優化,讓ChatGPT能夠不斷自我學習和進步。這種循環不斷地進行調整和改進,以使ChatGPT能夠持續地進步。

OpenAI運用了一套高效的訓練模型,透過過往問答、人工評分和強化學習等方式,讓這個模型能夠以接近真人的方式進行對話,為自然語言處理領域帶來了重大突破。

2017年的AlphaGo Zero對人類社會產生了極大的影響。它是AlphaGo Lee的升級版,不同之處在於不需要大量的數據和棋譜,而是只需要基本的圍棋規則。電腦透過自我對弈來學習,直到能夠預測每一手棋及其對棋局結果的影響。

廣告

令人驚訝的是僅僅過了三天,AlphaGo Zero就有巨大的進步,不但打敗曾擊敗AlphaGo Lee,在21天後,它達到AlphaGo Master的水準。AlphaGo Master曾經在與數十位人類頂尖棋手的比賽中以60:0大比分獲勝。當AlphaGo Zero自我對弈到第40天時,已經擊敗所有以前的AlphaGo程序。

從AlphaGo Zero的成長軌跡來看,未來人工智慧的成長將會是幾何級數的爆發式增長。可以預期ChatGPT也會有同樣的發展。目前,OpenAI已經暗示今年年底GPT-5就會問世,這個版本已經接近通用人工智慧,也就是說,生成式人工智慧可能變得與人類無法區分。

因此可能已經越來越接近所謂的「科技奇異點」,科技奇異點將由超越現今人類並且可以自我進化的機器智能的出現所引發。由於其智慧遠超今天的人類,因此技術的發展可能完全超乎全人類的理解能力,甚至無法預測其發生。

雖然未來充滿不確定性,但人類和其他物種最大的區別在於人類善於使用工具。可以看到在金融圈,已經有許多公司開始使用人工智慧應用在各種場景中,其中包括升級客服能力、優化銷售流程和提升風險控管等。

例如,美國銀行的智慧助手Erica可以為客戶提供24/7的服務,包括賬戶餘額、交易歷史、還款日期和還款金額等信息,還可以回答常見問題、提供建議和解決問題。摩根士丹利也使用ChatGPT來開發自動化的投資建議和銷售系統.透過系統了解客戶偏好後提供個性化的投資建議。Ayasdi的「Ayasdi AML」產品也使用ChatGPT來檢測和預測金融犯罪行為。

目前GPT-4已經具備圖像辨識的功能,未來GPT-5甚至可能再加入聲音等相關參數,這也代表未來可以應用的場景會越來越多。趨勢的發生大多在隱性中默默進行,人們面對趨勢形成所採取的態度,也多習慣以被動方式面對,直到趨勢逐漸受到注意時,人們才開始察覺、附和。在這波人工智慧的浪潮上,越早能掌握工具的人就能越早掌握趨勢。

更多工商時報報導
iPhone組裝將倍增 立訊大擴廠 叫陣鴻海、和碩
美光早盤大漲逾9% 記憶體族群歡騰
台灣電路板產值 估破8千億