《產業》國科會TAIDE-LX-7B模型 提供產學研導入具台灣特色的生成式AI

【時報-台北電】國科會主委吳政忠今日宣布釋出TAIDE-LX-7B模型,這是一款結合台灣文化的大型語言模型,透過此次模型釋出,將能更進一步協助我國政府在生成式AI模型發展路上,提供更多元與多樣化的服務,幫助產學研快速導入生成式AI。

因應2022年底ChatGPT帶來廣泛且巨大的影響,國科會自去年初即推動可信任生成式AI發展先期計畫(TAIDE),現在已發展到一定程度,決定釋出TAIDE-LX-7B模型供外界使用。

國科會表示,TAIDE-LX-7B模型釋出版相當於汽車的引擎,後續搭配各式零件、組裝車殼,就可以化身成不同用途的車輛運具,提供消費者使用。

舉例來說,TAIDE已與高雄大學合作,透過吳俊興教授及其團隊開發的開源生成式AI應用平台(Kuwa GenAI OS),將TAIDE模型預載內建於Kuwa平台,開發者可靈活組合串接周邊功能,使用者則是透過簡易的Web介面與後端模型互動。

國科會表示,與現今其他大型語言模型不同之處,TAIDE-LX-7B模型具有繁體中文的文本生成能力,在Meta Llama-2-7B的基礎上,透過額外擴充繁體中文字元、字詞,使得生成的文本更加流暢、精準,並且更具有「台灣特色」。

國科會說,訓練此模型所使用的文本資料,皆以合法取得授權之文本數據進行訓練,此一過程確保模型本身強調的「可信任性」,透過「可信任性」的文本協助TAIDE-LX-7B模型加強臺灣文化、用語與國情等知識,從而產生豐富多樣的文本內容。

另加強訓練5大功能,包括自動摘要、寫信、寫文章、中翻英、英翻中等,並開發出多輪問答的對話能力,讓模型可以透過已生成的文本內容,接續使用者的指令,產出更符合需求的文本。(新聞來源:中時即時 林志成)