【洞見AI大未來論壇】吳恩達兩度直呼「超羨慕台灣」!唐鳳說了什麼?

由台杉投資主辦,數位時代、INSIDE、台灣人工智慧學校、SEMI 國際半導體協會共同合辦的「洞見 AI 大未來論壇」邀請到兩位今年一同入選《時代》雜誌「人工智慧領域百大影響力人物」的 AI 領袖-AI Fund合夥人、DeepLearning.AI 創辦人及 Landing AI 創辦人暨執行長吳恩達(Andrew Ng),以及數位發展部部長唐鳳,共談對於人工智慧發展的看法。

吳恩達(Andrew Ng)
吳恩達(Andrew Ng)

AI 研發需要大量資源? 唐鳳:筆電就可跑 LLM

一般認為,AI 研發需要大量的資源,無論是金錢、人才,或是算力資源。然而,唐鳳指出,關於需要龐大資源來訓練或 fine-tuning AI 的假設,在預訓練(pre-training)階段是正確的。但由於 Llama、Falcon 等開源模型的存在,在個人電腦對量化資料進行 fine-tuning 得以實現。

唐鳳透露,她在自己的蘋果筆電成功運行語言模型,「我在今年初得到這台 M2 架構、有 96G 記憶體的蘋果筆電,目前已經非常成功地做了很多有趣的事情,即使跑最大的語言模型和視覺模型也適合。畢竟沒有人願意把敏感資料放到雲端,對我來說,這只是電子郵件到雲端的過程,除非使用非常強大的技術,例如同態加密,目前比地端運算更昂貴。」

吳恩達對主持人說,「你知道這有多不尋常嗎?我住在美國,我愛美國,但我不知道美國有任何監管機關在他們的筆電有 fine-tuning 模型。如果美國政府在這裡發揮了領導力該有多好,我其實挺羨慕的。」

廣告

主持人回應,唐鳳是世界上唯一曾是駭客、但現在是政府官員的人。

唐鳳提到,在台灣有很多人希望政府展示負責任的 AI 使用方式,這與許多國家形成鮮明對比,台灣邀集 Open AI、Anthropic 參與對齊大會(Alignment Assemblies)專案將在幾週內發布。

台灣已有公部門使用生成式 AI 指引,以負責任、保護隱私的方式使用 AI。政府部門致力共用程式碼及開源,這意味著程式碼將跨部門使用,這都將作為產業指南發布。國科會也在幾個月前宣布正在進行有薪培訓。

唐鳳強調,這些都是政府須做的基礎建設設施工作,當提到程式碼共用時,它既指軟體程式碼,也指監管程式碼,這些監管程式碼也可以出口到其他國家。

對於如何把台灣的 AI 人才與全球 AI 發展連結起來?唐鳳指出,台灣就業金卡新增數位領域人才,這意味著任何在開源領域貢獻 8 年的人,不一定是代碼,也可以是文檔,將在台灣自動取得就業金卡,並享受 3 年的工作許可、全民健保等資格。

「這很受歡迎,實際上,在疫情期間,我許多矽谷的朋友使用就業金卡在台灣停留。現在不僅是矽谷,還有拉丁美洲的以太坊開發者。只要他們能證明在開源領域做出了八年貢獻,將自動取得資格,希望這些人才來到台灣,建立良好的關係,這樣我們的本地人才可以與這些人才一起工作。」語畢,吳恩達直呼「你又讓我羨慕了」,引來全場笑聲。

台灣精密製造業強大 成 AI 獨特優勢

吳恩達認為,今天的 AI 科技猶如十年前機器學習的混亂中,所有的規則都將被重新制定,新事物正在被發明。因此,「這是台灣的人才投入並開始建立的最佳時機。我認為,台灣獨特優勢在於台灣強大的精密製造業。」

如果我想為精密製造業建立 AI,我不知道如何在矽谷做到這一點,這在矽谷是不可能發生的。但台灣有數百家公司從事精密製造,因此,對於在台灣的人來說,這可能會更有效率。

台灣的保險、金融服務也與眾不同,這些都是非常獨特的項目。台灣提升英語讀寫能力的努力,並沒有在很多地方看到,這些都是台灣擁有獨特優勢的應用領域,我認為這將是一系列的機會,也是最佳時機,也就是利用硬體生態系的實力,強化軟體產業。

對此,唐鳳也觀察到,愈來愈多人投入零知識(zero-knowlege)證明技術,許多醫院聯合或拆分學習(split learning) AI 應用技術,不希望患者的私人臨床資料被外洩。因為如果發生這種情況,整個產業在學習方面都會倒退幾年。有了生成式 AI,可以確保資訊移轉使用零知識技術、資料共享協作學習,成為每個人都可以做的事情。

她也感謝台灣大法官對上一代「全民健保數據重用」的解釋,行政院現在正在建立最高標準、獨立的國家保護機構,與許多人就非個資數據公益運作和隱私增強技術進行協商。

唐鳳強調,一旦加速就解決了基本困境,即把公眾數據以加密的形式開放。但無論是運行推理還是其他類型的訓練,都不能查看個人的數據。她聽到許多 APEC 國家說他們需要這樣的東西,但他們目前沒有機構間的協調來實現。

台灣大法官對上一代「全民健保數據重用」的解釋
台灣大法官對上一代「全民健保數據重用」的解釋

不是工作被 AI 取代,而是任務被重新設計

關於工作的討論,吳恩達認為,AI 不是讓工作(jobs)自動化,而是讓任務(tasks)自動化。但弔詭的是,有時工作確實會在今天消失,但最終會創造更多的價值。如果觀察早期的創新方式,會發現大多數企業為了省錢,最終都把所有的時間都花在 prompt 上。

AI 實際上對工作非常有益,但問題是對很多人來說,如果有 10% 的可能性會失去工作,不確定是否想要這樣的結果。他認為我們需要那些關於「工作影響」的坦誠對話,這些對話是現實的,我們確實需要照顧那些生計受到影響的人。

儘管 AI 可能會奪走或取代數百萬個工作崗位,但唐鳳認為,AI 將創造數兆美元的財富,因此她提出「財富重分配」的想法,即讓無條件基本收入(UBI)成為可能。這不只是幾個監管機構說我們明天要做 UBI,而是要持續檢視社會指標哪些部門是脆弱的,哪些部門目前沒有得到救助和社會安全網等,然後將資金重新分配給特定的部門。

我覺得這種動態的或持續的民主確實是需要的。我認為使用 AI 促進民主對話,是我大部分職業生涯的研究主題,這是非常好的事情,不僅僅是 Google 和 Open AI,所有的投資都以類似的方式,讓 AI 能夠促進與基層對話,改善民主進程。

中文用戶使用成本高 可用特定模型微調

對於中文用戶使用成本較高,吳恩達坦言,大型科技公司提供的全球 LLM,是在大量英語數據和較少的中文數據上訓練的,這些模型針對英語進行優化。如果將英語同樣的概念用中文表達出來,事實證明,回答中文或其他較少數語言時,將花費更多成本。

吳恩達說明,這似乎不公平,不只是中文,還有日語、韓語都有類似的談話,「我們需要訓練我們自己的大型語言模型,需要更多資料、更多我們自己的語言。」

然而,吳恩達指出,實際上,世界上有大量不同大小的模型,包括那些專門用於特定任務的模型,台灣去與最大的語言模型競爭是否合理,即使 fine-tuning 是相對便宜的技術、是尺寸較適中的模型。對他們來說,在世界上各種情況下,包括台灣,在這訓練上更專業、絕對有意義。

唐鳳也同意此說法,她認為 fine-tuning 產生的 LoRA (Low-Rank Adaptation),卻保持了地方文化,而且沒有 pre-training 階段的成本。她也補充,中文相對上也比其他語言(如台語)更強勢。如果你使用台語(河洛語)跟 ChatGPT 說話,他可能會用廣東話回答。

台灣明年將開始為醫療保健、高齡相關領域部署 AI 技術,實際上很難要求 90 多歲的人開始說一口流利的國語,這對他們的文化背景而言是不公平的,這也是為什麼我們加倍投資台灣的其他民族語言,這是可以在現有 pre-training 完成的影音語言模型上做的事情。

監管 AI 產品 比監管AI技術更有效

吳恩達指出,雖然 prompting 是很棒的想法,你可以說英語或中文,告訴電腦你想得到什麼結果,問題在於語言常是模稜兩可的,因此,當你提問時通常會得到你想要的答案,但不是總是如此。而程式碼是明確的,你寫進同樣的程式碼每次都會得到相同的結果,這就是為什麼我認為在可預見的未來,人們需知道如何使用 AI 大型語言模型。

這就是為什麼我希望看到教育體系的轉變,從幫助少數人到幫助每個人,只要學習一點點編程,就能大大地增強能力。

對於 AI 監管,吳恩達指出,監管產品可能比監管技術更有效。當監管汽車產業,有我們想要的結果,例如安全,也有我們不想要的結果,譬如希望人們能夠在公平的條件下獲得貸款或任何服務。

但唯有當應用者開始賺到足夠營收,才能付錢給工具開發者等,逐步建立起商業模式;事實上,應用端往往有著龐大市場需求所帶來的機會,但競爭並不是那麼激烈,因此是新創的突破口。

核稿編輯:湯皓茹

《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報

延伸閱讀:

Sam Altman的回覆郵件速度測試:優秀或是平庸?
克里斯・米勒再談《晶片戰爭》後續趨勢:全世界在爭搶「自給自足」
吳恩達 vs. Sam Altman:兩大 AI 大師對 AGI 未來的不同看法
【2023人工智慧年會】《時代》AI百大人物!唐鳳:AI與「審議式民主」相互擴展