ChatGPT之父訪日對日政府談7大提案,訪台行卻揭開台灣「國家級AI危機」?

OpenAI 創辦人 Sam Altman 在事前保密到家的計畫中,9 月 25 日炫風登上永齡基金會與天下雜誌合辦的 AI 大師論壇。這是自 2022 年末,ChatGPT 在全球掀起生成式 AI 浪潮後,Sam Altman 首度在台灣公開露面。

同場論壇還邀請到有「Google大腦」之父稱呼、AI Fund管理合夥人吳恩達(Andrew Ng),被國內創新創業、及 AI 研究領域認為是不可多得的夢幻組合。

然而,或許是活動籌辦過於倉促,整場下來一直有種「打不中要點」的遺憾感。

我們在論壇聽到了什麼?

吳恩達的擔綱 Keynote 演說,不脫近期的校內演講與專訪內容,以說明大型語言模型(LLM)原理、科普 AI 應用為主。儘管吳恩達最後提到希望在台灣建立應用層面的探索合作,但聽講者印象最深的,或許只有他以「臭豆腐」、「番茄炒蛋」來說明大型語言模型的運作模式。

而 Sam Altman 與神秘嘉賓、也是 OpenAI 公司研究者 Mark Chen 所參與的爐邊對談,最大焦點在 Sam Altman 提出對 AGI 發展時程的評估;與吳恩達判斷還需要 30~50 年,也就是至少一個世代以上的時間不同,Altman 對於業界在 10 年內實現 AGI 抱持信心。

同登時代雜誌「AI 領域百大人物」的吳恩達與 Sam Altman 同場,但是否帶給場內外關注 AI 議題的台灣社會帶來任何啟發?

Sam Altman 數月前訪日,見了岸田文雄與執政黨幹部時談什麼?

Altman 於 4 月亞洲行出訪日本,10 日上午與日本首相岸田文雄會面、表明對日本市場的重視。當天下午出席日本執政黨自民黨的會議,與黨籍國會議員進行意見交換。

廣告

根據自民黨議員塩崎彰久 Twitter(當時尚未更名「X」) 指出,Sam Altman 提出包含「提升日本相關的學習數據權重」等 7 項對日提案,會後並強調「在新技術出現時,政府有保護國民的義務」,在當時國際間瀰漫著對 AI 技術在數據收集手法的疑慮時,強烈展現出與各國協調的意欲。

7 大提案是什麼?

  1. 提升日本相關的學習數據權重

  2. 提供政府公開數據等的分析

  3. 共享有關使用 LLM 的學習方法、注意事項等 Know-how

  4. 提供 GPT-4 的圖片解析等優先功能

  5. 研討保護日本國內敏感數據的機制

  6. 強化在日本的 OA(Office Automation)公司存在感

  7. 為日本年輕的研究者和學生提供培訓和教育

日媒當時分析,就技術面而言,重點在於第「1」、「4」項。依據微軟與 OpenAI 近一週最新發表的訊息,「4」也將在今天(26 日)呈現於世人面前,略過不談。

第「1」點,由於 ChatGPT 在學習時所使用的數據,英語遠高於其他語言(如在 ChatGPT 3 階段,中文所佔比例據說僅佔 0.09%),因此在技能上也是英語較為突出。使用經驗上,不論是推論能力、處理速度等,使用英語提問、及獲得回答的時候,都較其他語言更佳。因此在七大提案之中的第一項,「提升日本相關的學習數據權重」,就是要消除這個因語言差異而發生的落差。

即使無法完全達到與英語相同的水準,若 ChatGPT 能夠往特定語言方向加強,可期待在獲得回應的品質、或是使用者體驗上都可以達到提升。

場景換到台灣,以簡立峰在「教育 AI 年會」上發表的計算,「全世界爬蟲可以抓到的網頁,它的語言的資訊量,中文這個時候大概來到 5.9%,而繁體中文則是 5.9% 的 1%」。簡立峰指出,

全世界最 popular 的一千萬個網站,它的中文資訊量只有 1.4%。你可能會問,會不會這些網站在中國大陸因為防火牆的問題所以沒有爬到?這是有可能的。但更多的可能是,中國大陸的網站雖然數量大,但因為內容不夠多元,所以它的資訊量是少的。總體來講,中文資訊量是非常少,只有 1.4%。相對於英文的資訊量大概佔了 55% 左右。

換言之,台灣與日本在大型語言模型的訓練上,面臨一模一樣的問題。

或許在不是與執政團隊互動的場合上,無法像日本具體談 OpenAI 對「一個國家」的支援合作。或者基於政治理由,無法就簡中與繁中語料訓練是「一種 Language、或是兩種 Language」進行討論。但是否可以討論在過去 5 個月來,OpenAI 的日本經驗是否有台灣可以借鏡的地方?這絕對是台灣的業界內外眾所關注的課題。

然而這個機會卻平白流失掉了。

我們聽到的更像是一個如何養成優秀企業家、以及 AI 可以帶來更光明未來的心路歷程與佈道大會。

中央社
中央社

根據報導, Sam Altman 4 月的訪日行程是由自民黨協調而成行的,執政黨的專案分析認為 ChatGPT 等技術創新「可能引爆新的經濟成長」。而每天有超過 1 百萬人使用 Chat GPT 的日本、用戶基礎很堅實,媒體分析 Altman 是為了拓展 OpenAI 的支持度而到訪日本。在這樣的對價關係下,可以理解 OpenAI 對日本這個國家提出的合作利多方案。

而台灣呢?

或許主辦單位想要藉由邀集站在全球 AI 浪潮之尖者來台,展現自身擁有領導「國家級 AI」的政治實力,但是在這一場吸引爆炸級關注熱度,最後卻因為一個問句,打擊了台灣 AI 發展的信心。在全球分秒必爭 AI 軍備競賽背景下,我們看見的不是台灣發展國家級 AI 可能性,而是台灣 AI 發展的國家級危機。

核稿編輯:李柏鋒

《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報

延伸閱讀:

解析 OpenAI 對日本七大提案,Sam Altman:新科技出現時,政府有義務保護國民
日本政府部門業務導入生成式 AI?日首相岸田文雄今會 Sam Altman
Sam Altman的創業課:不需比較誰最努力,要看成果有沒有用