工商社論》從建構主權AI 論著作權變革芻議

圖/本報資料照片
圖/本報資料照片

為因應中國大陸DeepSeek崛起,賴清德總統宣示速建「主權AI」的目標,國科會將修訂《著作權法》,擴大台灣的資料進行訓練。目前修正方向未臻明確,或可採用本報社論去年的建議,大型語言模型(LLM)的訓練資料,應經權利人授權始得使用。

依據致力推動主權AI(Sovereign AI)的輝達(NVIDIA)的說明,主權AI係指一個國家利用自己的基礎設施、數據、勞動力和商業網路,生產人工智慧的能力。由本地團隊開發並在本地資料集上進行訓練,以促進特定方言、文化和實踐的包容性。自主人工智慧在幫助每個國家加強永續發展方面,將可發揮關鍵作用。

國際上發展主權AI的國家並不罕見,據媒體統計,已有30多國正在推動類似的政策。依前述定義,由國科會推動的「可信賴AI對話引擎」(TAIDE)計畫,係政府出資,委託國內學術界專家執行,使用國網中心超級電腦設施,並以國內資料進行訓練,應屬我國的主權AI。

日前行政院副院長鄭麗君表示,為建構台灣主權AI,政府將推動繁體中文,具備台灣觀點的AI語言資料庫,此做法值得肯定,惟光政府資料仍嫌不足,尚需更多的民間資料。國科會林法正副主委曾表示,繁體中文數據庫須具公信力,牽扯到著作權法規適度鬆綁,否則全球大型語言模型無法用台灣的資料進行訓練,台灣所建置的主權AI,就不具公信力。

我們樂見,政府開始正視主權AI訓練的資料匱乏的困境,並從著作權法制面檢討。由於修正草案尚未公告,無法確知國科會的修訂方向。國際上對生成式AI所訓練的LLM文字與資料探勘(Text and Data Mining;簡稱TDM),是否須經權利人授權,有不同的立法可資借鑒:

最嚴格的模式非歐盟《人工智慧法》(AIA)莫屬,該法Recital 105明文,AI模型的開發和訓練文字和資料探勘,除該法明示的例外,原則上受著作權與相關權利的保護,需獲得相關權利人的授權,始得為之。

反觀,素有「AI天堂」之稱的日本,可謂全球最寬鬆的立法。日本為鼓勵AI的發展,特於2018年修訂的《著作權法》,其第30條之四明文,「從大量作品或大量其他此類資料中,對組成語言、聲音、影像或其他元素資料進行擷取、比較、分類或其他統計的資料分析」行為,只要非基於自己或他人「欣賞」之用,得不經著作權人的允許在必要範圍內使用。易言之,對於LLM使用未經創作人同意的著作進行訓練的行為,已不構成侵權。

該法制係對AI模型訓練最友善的設計,讓LLM輕易取得可觀的資料。事實上,其立法有其特殊背景,未必是我應仿效的對象。論者指日文網路資料有限,遠不如英文與中文資料,導致其發展大型語言模型受限,為了要迎頭趕上,遂採取最開放的制度,卻是以斲傷著作權人利益為代價。值得關注的是,據《日經新聞》調查,圖像生成AI產生的圖像中,有大量涉嫌侵犯日本知名動畫的圖像,不排除為該立法的後遺症。

為促進我國人工智慧產業的發展,推動台灣的主權AI或有其必要性。然欲建構完善的主權AI,並不代表訓練該大模型就可以恣意無償使用他人的創作,犧牲著作權人的利益,尚嚴重扼殺創作的誘因。

緣此,歐盟的立法應屬較值得效法的對象,特別是主權AI肩負國家產業發展的責任,政府不應以取巧方式獲取訓練內容,更應帶頭示範遵守《著作權法》等規範,以合理的報酬,爭取權利人授權使用優質的繁中資料,共創AI產業與文創界雙贏的結果。

更多工商時報報導
泓德能源衝刺綠電 明年看旺
千金股年底競速 大立光王者回歸 掀比價
斷鏈+疫情 Q3全球貿易量萎縮