工商社論》從資料驅動發展 看AI基本法及主權AI

TAIDE計畫推動中面臨最大的瓶頸,不在算力,而在國內各方可用數據資料的匯集與取得。圖/本報資料照片
TAIDE計畫推動中面臨最大的瓶頸,不在算力,而在國內各方可用數據資料的匯集與取得。圖/本報資料照片

不知是否巧合,在輝達執行長黃仁勳倡議主權AI後,不但行政院經發會顧問會議創新經濟小組將主權AI列為首推建議,連監察院也開始關注行政部門規劃主權AI的進展。黃仁勳對主權AI的倡議,固然有著鼓勵每個國家都發展自己的AI能量,藉以帶動全球AI基礎建設投資商機的意味,但他的主要用意還是在於各國應要掌握本地的數據資料,維護文化傳統,以確保一國在AI時代的自主性。

國科會在2023年4月集結國內AI精英人才,推動「可信任生成式AI對話引擎」(Trustworthy AI Dialogue Engine,TAIDE)計畫,打造專屬台灣的大型語言模型。一年多來,TAIDE計畫成功達成任務,還隨著所採用的開源軟體,持續地更新,在大學及政府行政部門推廣相關應用。不過,據了解,當中面臨最大的瓶頸,並不在於算力,而是在於國內各方可用數據資料的匯集與取得。

台灣推動數位化,其實並不是始於TAIDE計畫,早在1998年就展開「電子化政府」,其後陸續依循國際技術典範發展趨勢推進;2002年啟動「數位典藏國家型科技計畫」,將國家重要的文物典藏數位化,建立國家數位典藏,執行兩期八年後,朝永續經營「臺灣數位典藏」,呈現臺灣語言、生物與文化的多樣性;在2021年起整合形成「國家文化記憶庫2.0」。在政府數位化方面,於2017年引進資料驅動、公私協力、大數據及開放資料等作法,並展開MyData,讓個人在認證與同意後,可便利自主使用個人在他方儲存的資料,2018年將這些資料驅動的理想,轉為以服務民眾為核心的「服務型智慧政府」。

2021年「智慧國家方案」展開,在「數位治理」的政策主軸下,「建構資料治理生態系」及「智慧政府服務」為主要的推動策略,並在「服務型智慧政府2.0」計畫下,設定了「加速資料開放、驅動資料再利用」的策略目標;2020年整合跨部會推動產業界的「雲世代產業數位轉型」計畫,並於2022年將相關政策移交給新成立的數位發展部迄今。

20年來,政府藉著國家型科技計畫、行政院層次國家級政策計畫持續推動台灣文化典藏、政府部門及產業資料的數位化與智慧應用,也還有許多計畫持續推動著。但是,何以2023年推動TAIDE計畫的AI精英小組覺得蒐集可用的數據資料仍為最大瓶頸?

大家一定很好奇,那些持續快速發展的大型語言模型如何取得數據資料?根據日本智庫IPA的分析,由於美國、中國的數位平台企業發展成熟且領先,藉著它們所掌握的數位平台商業模式即可直接掌握到許多個人層次的數據資料,經過整合加值後,就可成為大型語言模型的數據資料來源。準此,為了面對缺乏跨國數位平台業者掌握數據資料源的問題,必須要有政府政策的介入,以有效地取得可用數據資料集合,並開放給需求者應用。

以歐盟為例,長期政策願景就是將歐盟發展成「數位單一市場」。因此,在2021年啟動「數位十年」計畫,藉著「歐盟資料策略」及「歐盟AI策略」推進,期能帶來以民眾為核心可信任的AI應用。歐盟AI策略,大致分成發展卓越計畫及法制架構兩個面向。前者旨在引領產學研在AI相關技術與應用足以在國際市場上競爭,包括數位轉型中心及「共通歐盟資料空間」等。後者則是要建立一個讓民眾可以信任的法制環境,相關的法制可回溯到知名的GDPR、DMA、DSA,諸多產品安全管制,以及在2024年通過的AI Act等。

其中,「共通歐盟資料空間」就是歐盟介入,形成一個匯集可用數據資料集合的政策作法,迄今已經匯集了超過50個專業領域資料空間,這些資料空間開放組織及個人參與提供資料,並提供公平、透明、非歧視的接取應用管道與工具。

我國近期也提出「人工智慧基本法」草案,已公開對外徵詢意見結束。這份基本法草案,定位與歐盟AI Act大不相同,而是參考「科學技術基本法」,提出在相關領域的政策宣示及原則。當中,除提及需要與國際介接之AI風險分級外,也提及應促進個人資料保護納入預設及設計之相關措施或機制,以及應致力提升我國AI使用資料之品質與數量,確保訓練結果維繫國家多元文化價值與維護智慧財產權等方向與原則。這些當然都是正確的,但仍有賴跨部會跨部門加倍努力協助整合推進,才能讓各方同意共同協作建立台灣的主權AI。

更多工商時報報導
大眾控AR HUD 進攻電動車
遠端商機+蘋果訂單 創惟11月自結獲利 年增226%
純網路保險公司正式開放 金管會明年8月開始受理申請執照