工商社論》政府訓練台版LLM，應示範付費取得著作權

社論

2024年4月2日下午4:10

TAIDE被稱為「台版ChatGPT」，啟動近一年，仍未推出正式版。圖／本報資料照片

生成式AI席捲全球，為了掌握話語權，國科會於2023年4月啟動「可信任人工智慧對話引擎」（Trustworthy AI Dialogue Engine，以下簡稱TAIDE）計畫，投入適合我國語言、文化特性之生成式AI對話引擎的開發。惟從目前其侷限的訓練資料觀之，恐難達到預期的目標。政府主導的大型語言模型（LLM）或應有償取得高品質的著作權作品，提升模型品質，與文化界共創雙贏的結果。

台灣資源有限，只能使用國際上現有的開源LLM進行優化處理，以增強本土化優勢；TAIDE即使用Meta推出的Llama/Llama 2模型。然而這個被媒體稱為「台版ChatGPT」的計畫，啟動近一年來尚未推出正式版，直到日前國科會主委吳政忠才宣布將在4月中釋出7B模型（可商用版本）。據了解，數位部也規劃將在4月下旬廣邀Meta等國際大廠送測，並於5月公布TAIDE評測結果。反觀民間已陸續推出多個繁中LLM，如華碩集團的福爾摩沙大模型，早在去年9月就已推出FFM-Llama 2的70B大模型。

TAIDE將於4月成為開源模型，企業或個人可免費使用，並得修改軟體原始碼，透過微調和優化，快速推出新的產品與服務，加速我國產業的發展與創新。因此，TAIDE品質的優劣，攸關台灣產業的發展。

發展AI大模型四大關鍵：分別是資金、算力、人才與資料，又以資料最為重要。可惜的是，TAIDE計畫預算僅有2～3億元，相關硬體匱乏，且人才短缺，只能靠優質的訓練資料彌補。

根據TAIDE官方網站資訊，該模型訓練資料包含政府報告摘要、科技大觀園、科學發展月刊、學術會議論文摘要、GRB政府研究資訊系統報告／計畫摘要、光華雜誌、中文維基百科、法規資料庫、教育部《國語小字典》、中央及地方政府機關常見問題Q&A、十二年國教課程綱要、教育部《重編國語辭典修訂本》等。

繁中的訓練資料看似很豐富，但多屬政府公開資料，且部分資料僅使用摘要，占繁中的資料比重極為有限，且缺乏代表性。實與其他繁中的模型缺乏差異性，難以期待TAIDE光使用上述資料訓練的模型，如何精確回答有關台灣的問題？

台灣其他LLM設法尋求突破，如台大資工的Taiwan LLM V2訓練時，除抓取網路之外，還額外使用了小說、雜誌以及大量的社群媒體等資料。根據該模型的介紹，社群媒體的資料占總Token的47.32％，內容豐富許多，也較具代表性。不過此係資源有限下的變通作法，並非資料收集的常態。

我們可看看語言偏見同樣嚴重的日本，如何解決日文訓練資料短缺問題。日本以修正《著作權法》，讓LLM得利用有著作權保護的資料進行訓練，大舉擴大日文的訓練資料。前Google台灣區總經理建議，我國可仿效日本做法。然日本模式雖茁壯了AI發展，卻是以踐踏著作財產權人為代價，我國不宜貿然師法。

根本問題是，為何大模型都只想無償使用免費的資料？為何不以有償方式，爭取著作權人或資料擁有者的授權，取得優質的資料？特別是政府出資建構的繁體中文LLM，並無獲利的壓力，且背負國家AI發展任務，更應採取不同的方式。我們建議政府應主動與出版商或創作人協商，支付一定的授權費，取得資料使用權，打造出最適合台灣使用的模型。

我們以為，政府可先從媒體或研究機構的資料庫著手，蓋相對於書籍，媒體或研究機構多已累積數十年的豐富且深入的中文資料，若能獲取其大量內容，TAIDE將如吃了大補丸，功力立即大增。

值得慶幸的是，已有人注意到研究機構的資料庫，如日前立委詢問中研院可否協助整合中文資料庫，中研院院長廖俊智表示，會在不違反智慧財產權法規限制下，盡量開放中研院資料庫協助訓練AI模型。惟就是因涉及著作權重製限制，才無法使用該院的資料庫內容，廖院長如同委婉地拒絕立委的要求，更彰顯政府介入的必要性。

進入數位時代，傳統文化產業經營日益困難，如社群媒體與搜尋引擎恣意轉引傳統媒體辛苦報導與評論的內容，閱讀實體版紙媒的人口驟減，《新聞媒體與數位平台強制議價法》卻還躺在立法院，公平會與數位部也還在紙上談兵的狀態。倘能建立有償支付模式，授權大模型使用其資料有助於增加營收，應可提高權利人分享的誘因。此外，還有示範效果，其他大模型為搶奪繁中市場，也有可能會跟進爭取媒體授權。

值得欣慰的是，行政院長陳建仁日前宣布，未來將推動台灣AI行動計畫3.0，政府投入預算規模將從目前每年120億元再擴大。盼政府能將部分資源用於資料授權上，以促進我國相關產業的發展。

中時財經即時·
總統府首次氣候變遷對策會確定延至八月上旬
氣候變遷對策委員會原訂7月25日登場，惟受凱米颱風影響，總統賴清德已指示以防救災工作準備為優先，委員會則延期至8月上旬。
CTWANT·
劍指谷歌！OpenAI與多家新聞媒體出版商合作　計畫推出AI搜尋引擎「SearchGPT」
[周刊王CTWANT] 據科技雜誌《連線》（Wired）的報導，「OpenAI」發言人伍德（Kayla Wood）拒絕向《連線》提供演示新工具「SearchGPT」的詳細資料，但證實該公司已向若干合作夥伴和新聞媒體出版商取得訪問權限，並根據他們的反饋內容改進搜尋引擎的功能，此舉被外界解讀是正面劍指搜尋引擎龍...
中廣新聞網·
凱米攪局　氣候變遷委員會延至8月上旬召開「24委員名單搶先看」
總統賴清德宣布將在總統府下成立三大委員會並自任召集人，其中「國家氣候變遷對策委員會」原本將在明（25）日率先登場，不料「凱米颱風」攪局，府方證實已經順延到8月上旬。在此同時，委員會的24位委員名單也提
中央社·
中研院士發起成立TBGDS (圖)
台灣物種多樣性基因體發展學會（TBGDS）23日在中研院舉辦成立大會，未來將建置多樣性基因體資料庫、嫁接產學研資源整合，首屆理事長為國內遺傳及演化學權威、中研院院士李文雄（右5）。
鉅亨網·
漢光演習因颱風提前結束！專家：美國希望煽動台灣抵抗到最後一人
為期五天的漢光 40 號實兵演習今 (25) 日中午提前結束，以因應強颱凱米侵襲並協助地方政府進行救災工作，但此次演習聚焦「無劇本、實戰化」演練，重點為驗證交戰規則、去中心化指揮管制、任務式指揮、取消紅軍及預演等，中國時事評論員畢殿龍最新表示，此次軍演可看出美國希望煽動台灣打到最後一兵一卒。
Reactions1
鉅亨網·
美國第二季GDP初值超預期成長2.8% 物價壓力減弱
美國第二季的經濟成長速度超預期，顯示在借貸成本上升的重壓下，需求依然強勁。另一方面，在高利率的重壓下，消費者支出和更廣泛的經濟活動已經降溫，有助於逐步抑制通膨，對聯準會 (Fed) 來說是個好消息，經濟軟著陸似乎近在咫尺，9
PR Newswire Asia·
金沙中國片區活化項目「草堆街創業方案大募集」結果公佈
金沙中國片區活化項目「草堆街創業方案大募集」結果公佈
鉅亨網·
盤中速報 - 道瓊指數大漲1.22%，報40338.25點
道瓊指數盤中上漲，近日週月績效、成分股表現、即時新聞資訊。
FTNN新聞網·
只有股市不分藍綠白！廉政專刊「洩密」　立院諸公最愛「這1檔」
[FTNN新聞網]財經中心／綜合報導在最新一期監察院廉政專刊中，公布立法委員的財產申報，其中，國民黨立委柯志恩、翁曉玲、陳菁徽、林倩綺、蘇清泉、陳永康，...
Reactions1
Moneydj理財網·
Galaxy Ring熱賣三星緊急加碼首波產量100萬只
MoneyDJ新聞 2024-07-26 08:58:17 記者李彥瑾報導三星Galaxy Unpacked 2024發表會於日前登場，亮相新品包括首款智慧戒指Galaxy Ring。據韓媒報導，由於市場反應出乎意料熱烈，三星緊急加碼生產Galaxy Ring，年產量大幅上修至100萬只。韓媒《The Elec》近日報導，根據業界人士消息，三星Galaxy Ring首波產量原定40萬只，不過因為買氣意外熱烈，在預購階段就銷售一空，三星已向供應鏈加單60萬只，首波產量來到100萬只。Galaxy Ring官方定價為399美元，7月24日起於美國、英國等特定市場正式上市。芬蘭健康科技公司Oura於2017年率先推出智慧戒指Oura Ring，但一直處於小眾市場定位。隨著三星切入，有望讓智慧戒指跳脫小眾，逐漸成為穿戴式裝置市場中的主流。根據三星官方宣傳，Galaxy Ring是目前市面上最小巧的智慧穿戴裝置，結合三星自家Galaxy AI技術，提供計步、心率偵測、呼吸頻率、睡眠活動等多種測量，每次充電後可維持長達14天的使用時間，為消費者帶來更佳的智慧健康體驗。 (圖片來源：三星電
Moneydj理財網·
東京通膨持續升溫核心CPI增幅擴大、續破2%
MoneyDJ新聞 2024-07-26 08:57:58 記者蔡承啟報導住宿費大漲、電費等能源價格增幅大幅擴大，推升東京通膨持續升溫，核心CPI增幅擴大、連2個月突破2%。日本總務省26日公佈經濟數據指出，因住宿費大漲、電費等能源價格增幅大幅擴大，2024年7月份作為日本核心消費者物價指數(核心CPI)領先指標的東京核心CPI(以2020年=100)為107.4、較去年同月上揚2.2%，為連續第35個月呈現揚升，增幅高於前一個月份(2024年6月、年增2.1%)、連續第3個月呈現擴大，且增幅連續第2個月突破日本政府/日本央行(日銀、BOJ)所設定的「2%」目標。路透社事前所作調查的市場預估值為揚升2.2%、總務省公布的東京核心CPI增幅同於市場預期。作為領先指標的東京核心CPI增幅擴大，也讓預計8月公布的日本7月份全國核心CPI增幅也有可能擴大。 7月份東京能源價格較去年同月大漲14.5%(前一個月份為上漲7.5%)。其中，電費較去年同月飆漲19.7%(前一個月份為大漲10.8%)、連續第3個月揚升；都市瓦斯(City Gas)費大漲11.9%(前一個月份為上漲3.8%)、

中央社財經·
通膨趨緩激勵美股收紅
（中央社紐約2024年07月26日綜合外電報導）美國公布通貨膨脹趨緩，讓最近幾天科技股走弱的盤勢獲得提振，美股今天收紅。道瓊工業指數終場上漲654.27點，或1.64%，收在40589.34點。標準普爾500指數上漲59.88點，或1.11%，收在5459.10點。以科技股為主的那斯達克指數上漲176.16點，或1.03%，收在17357.88點。費城半導體指數上漲97.77點，或1.95%，收在5103.128點。
FTNN新聞網·
打進車鏈！「這紡織廠」連2日爆量上攻漲停　量噴1.3張強登雙增王
[FTNN新聞網]記者曾奕語／綜合報導台股昨（26）日終場收22,119.21點，重挫752.63點，跌幅達3.29%，成交量為4684.71億元。紡織廠佳和投入車材內裝紡品市場，去...
時報資訊·
《美股》收盤速報：科技股支撐+溫和通膨華爾街彈升
【時報-台北電】投資人重新擁抱此前遭大量拋售的科技巨頭，華爾街股市周五收高；此外降溫的通膨數據，也激勵了人們對聯準會很快降息的樂觀情緒。然而周五標普和那斯達克的上漲，無法收復此前兩個交易日的暴跌，兩個指數連續第二周走低。道瓊本周則收於上漲。周五3M上調年度獲利預測，股價飆升23%，提振了道瓊指數。在本週，道瓊上漲0.75%，標普下跌0.82%，那指下跌2.08%。在Meta上漲2.7%帶領下，科技七雄當中有五檔上漲，兩個例外是特斯拉和Alphabet，兩者皆下跌約0.2%，其中Alphabet跌至5月2日以來的最低收盤價；此前兩家公司公布黯淡業績，引發周三的大拋售。法國巴黎銀行美國股票主管Greg Boutle說：「我們下周將從蘋果、微軟、亞馬遜和Meta得到消息，將為這種輪動是否持續、以及市場的走向定下基調」。輪動是指從估值過高的高動能股票，移向業績稍遜的中小型股。最近幾週這種輪動似乎獲得動力，羅素2000指數和標普小型股600指數兩者皆升到本周第四次收盤新高。美國公布6月個人消費支出(PCE)物價指數溫和上揚，年增2.5%，符合預期，並低於前一個月的2.6%。激勵了聯
太報·
【晶圓代工新戰場】埃米時代即將來臨！台積電、英特爾、三星3強提前布局
AI 人工智慧正在驅動巨大的運算需求，為了支應此需求，晶片製造商正在尋求更節能的下一代製程技術。護國神山台積電今年在北美技術論壇首度披露A16製程技術，它象徵奈米（Nanometer）時代即將結束，未來將進入埃米（Angstrom）時代。而台積電2大對手英特爾、三星也朝向埃米時代進行布局，這場先進製程大戰已提前引爆！
CTWANT·
600張發票沒中半張「雲端專屬獎」　苦主怨：越來越難中…原因找到了
[周刊王CTWANT] 原PO在臉書《爆廢公社公開版》直喊：「最近雲端發票專屬獎越來越難中了！」提到這期5、6月發票，600多張才中2張，連半張雲端發票專屬獎都沒有，「財政部說500元專屬獎開195萬組」，他認為根本騙很大，連邊都沾不到。透過截圖可見，原PO消費的600多張發票中，有2張中獎，分別...
Reactions24
鉅亨網·
不只是回調！美股大輪動投資人應關注領漲板塊
這次股市大跌可能並非全面回調，而是一場應該會出現的板塊輪動。投資人可關注其他領漲板塊如電力、醫療保健和能源等的機會，同時減少對大型科技股和人工智慧的過度集中。未來小型股可能繼續反彈，成為最大受益者。
Yahoo奇摩股市·
「屏東農夫」轉行賣彩券超Lucky！　今晚開出2.33億元大樂透頭獎
農夫轉行開彩券行，幸運開出轉職後第一個大獎！大樂透頭獎2.33億元今（26）日獎落屏東，業者受訪時直言，接到台彩通知，還以為是詐騙。
Reactions62
民視影音·
水淹半個輪胎別硬開! 保養廠泡水車修不完"只接熟客"
財經中心／楊思敏、梁駿樂、鄭兆佐　台北-高雄報導凱米颱風帶來強降雨，造成中南部大淹水，許多車子泡在水裡，就有保養廠忙翻天，目前只接熟客，不接過路客。車主要注意，一旦車子泡水，不要發動，趕快請拖吊車幫忙送修。另外，開在路上碰到淹水，水深到輪胎1/3，還能慢速前進，但淹到一半就要立刻熄火，否則引擎浸水就會報銷。原文出處：開車遇淹水怎辦？　水淹達「這個位置」立刻熄火防二次傷害
工商時報·
Meta下月起廣告全面實名制
新政府如何防堵詐騙全民都在看，打詐四法完成三讀後，具體行動開始鳴槍起跑！據了解，數發部找上Meta、Google、LINE等業者「喝咖啡」，其中已在6月推動投資廣告實名制的Meta，8月起擴大為「所有廣告都要做身分確認」，藉此先處理假名人、假身分廣告的氾濫。數發部下一步將要求刊登廣告者，朝向使用數位簽章確認身分的方向辦理。
工商時報·
法鐵遭襲巴黎奧運維安升至最高規格
距巴黎奧運不到數小時就要開幕之際，法國高鐵路網（TGV）遭遇縱火等「大量、惡意」攻擊，估計影響80萬人的交通行程，法國東部的巴塞爾米盧斯弗萊堡歐洲機場，也一度因為炸彈警報而關閉。法國政府繃緊神經，全面部署最高規格的維安行動，力保奧運順利進行。
工商時報·
潤泰新插旗大同區總銷估60億
隨著台北市西區國門新地標「台北雙星」持續向上延伸興建，周邊房市行情、建商卡位熱度也隨之升高。潤泰新（9945）26日代子公司潤泰建設公告取得「台北市大同區延平段合建案」，占地約337坪。潤泰新協理陳柏宇表示，潤泰新「插旗」大同區再下一城！簽下民生西路、延平北路口的合建分屋案，不過短期內還沒有計畫推出銷售；市場人士估計，全案總銷金額可望上看60億元。
中時財經即時·
牙醫師買小型股狂賺2千萬這波逃得了？專家爆股災崩盤 1群人爽到
短線操作遇到行情大好，獲利看似輕鬆又快速，但遇到股災真能逃得了嗎？理財達人施昇輝表示，自己的牙醫師透露，今年股票賺了2000萬元，偏愛小型股和短線交易，這波台股重挫，不知是否獲利回吐。他認為，「領股息」的投資人，不會成為股神，但遇到股災時，會興奮地表示「又有機會買進了」。
民視·
折疊手機大戰PK功能應用! 雙面即時翻譯.大尺寸外螢幕
財經中心／楊思敏、梁駿樂台北報導折疊手機已成為各大品牌新戰場，三星最新一代手機，能化身即時翻譯機，Motorola則是強調轉軸設計，能減少螢幕耗損，小米外螢幕最大，4.1吋可以支援應用程式，直接回訊息、打電話。至於蘋果傳出，2026年可能推折疊機，3C達人認為，折疊平板可能先上市。
Reactions2
中時財經即時·
美國PCE持續和緩 Fed料就定位9月降息
聯準會（Fed）緊盯的通膨指標－6月個人消費支出物價指數（PCE）26日出爐，整體PCE年增率略為放緩，核心PCE年增率與前月持平。美國6月通膨持續和緩大致符合預期，可望讓聯準會（Fed）9月就定位扣降息板機。
中時新聞網·
NCC開解方 iPhone16可如期上市
果粉安了！NCC下屆委員不足額，恐難開會並做成決議，iPhone等電信管制射頻器材進口首當其衝。NCC於26日包裹修正委員會審議事項及授權內部單位規定，將電信管制射頻器材製造及進口，從許可案移列至處分案，由主委或代理主委召開諮議會議討論後決定即可，換言之，將在9月發表的蘋果iPhone 16可如期在台灣上市。
Reactions6
工商時報·
亞洲生技大展成大秀產學量能
2024亞洲生技大展串接全球生技產業，南台灣大學龍頭成功大學由沈孟儒校長率隊參展，攜手成大醫療聯盟醫學中心的七家醫院、12所成大大南方科研產業化平台學校、產學合作企業及衍生新創公司近30個團隊聯合展出，參展主題涵蓋AI精準健康與智慧醫材、新藥開發與細胞治療、遠距醫療與高齡科技、即時檢測與智慧醫療，以及健康照護與日常保健等，展現成大為首匯集各方研究技術量能的領導地位。
聯合新聞網·
高息ETF夯投資人愈跌愈買
台股殺聲隆隆，昨（26）日補跌752點，賣壓一舉摜破季線支撐，ETF跟著臉綠，僅約14%標的收紅，全體258檔ETF平均...
工商時報·
基隆房市新豐愛買商圈 3字頭誘人
基隆腹地小、市區少推案、房市發展不如大台北周邊衛星市鎮，但相較於台北市南港、汐止房價高漲，包括信義區新豐愛買商圈、中山區德安商圈因交通動線、房價低的優勢，近年建商推案量大，新建案房價雖站上3字頭，仍吸引不少台北首購族移居。
工商時報·
生技展報捷 TBMC組隊打世界盃
亞洲生技展26日登場大爆利多，除頒發19家傑出生技公司外，台北生技園區與默克、賽默飛世爾科技簽署合作協議，台灣生物醫藥製造（TBMC）也攜手日本CMIC Bio等國際大廠建置量產平台，執行長張幼翔表示，TBMC明年7月投產，將與美國韌力啟動全面性的戰略合作盃打世界盃。
鉅亨網·
鉅亨速報 - Factset 最新調查：Mohawk工業(MHK-US)EPS預估上修至9.73元，預估目標價為136.00元。
FactSet 最新調查：Mohawk工業(MHK-US)EPS預估上修，預估EPS、預估營收、目標價、歷史獲利表現、即時新聞資訊。

相關內容

最新報導