跟祖克柏「講」台語!Meta台灣工程師推動台語、英語AI語音翻譯系統
講台語也ㄟ通!Meta(原臉書)不只積極發展元宇宙,在AI自然語言領域也大有進展。Meta今日首度發表全新AI非書寫翻譯系統,創辦人兼執行長祖克伯還親自拍攝影片,更特別的,這段影片對話對象為台灣Meta軟體工程師陳鵬仁,且對話不是使用中文,而是台語,更引起台灣人熱烈討論。
根據Meta介紹,祖克柏透過這套翻譯對話的工程師,正是來自台灣的Meta 軟體工程師陳鵬仁。陳鵬仁在台灣長大,講中文,但他的父親,陳聖獎是70 歲、退休的工廠技術主管,來自台語普遍使用的台灣南部。雖台語與中文兩種語言有相關,但仍有許多不同,讓陳鵬仁爸爸常覺得用中文進行複雜對話非常困難。
「我希望我爸跟所有人溝通時都用台語(在台灣使用的閩南語)對話,這是他最熟悉的語言。」Meta AI 研究員陳鵬仁分享,「他聽得懂中文,但若是討論比較複雜的主題時,他說話的速度會比較慢。」然而,不甘於只為爸爸擔心,陳鵬仁開始投入心力,改善這個問題,推動全新技術發展,讓閩南語及英文之間得以相互翻譯。
Meta表示,目前階段能夠讓使用閩南語的人士與使用英語的人士對話。雖該模型仍在開發中,且每次只能翻譯一個完整句子,但已朝著未來實現為各種語言提供同步翻譯的目標邁開一步。
Meta指出,至今為止,AI 翻譯主要著重於各種書寫語言。但在全球超過 7000 種的現存語言中,近半數以口語表達,且沒有標準或廣泛使用書寫文字系統,因而難以透過有大量書寫文字的標準技術訓練AI打造翻譯工具。這次突破,讓主要以口語表達的「閩南語」打造了史無前例的AI技術翻譯系統。由於閩南語是華裔群眾廣泛使用的語言,但缺少標準書寫文字系統,這項技術讓使用閩南語的人士能與使用英語的人士對話。
這套翻譯系統是 Meta Universal Speech Translator(UST,通用語音翻譯工具)專案的一部分,該專案致力用AI方法為所有現存語言進行即時語音翻譯,包括主要以口語表達。Meta希望未來元宇宙中也能適用。且不只會開放閩南語翻譯模型原始碼,也會公開評估資料集和研究報告,讓其他開發者也能重製並以此為基礎建立模型。
Meta說明,著手打造閩南語翻譯系統時,面臨的重大障礙就是資料搜集。由於閩南語算是資源匱乏語言,與西班牙文或英文等相比,未有足夠的訓練資料,加上英語翻譯成閩南語的翻譯人員相對很少,因此更難蒐集資料並加上註解訓練模型。
Meta透露,這次做法是以中文為中間語言建立偽標籤和人工翻譯,也就是先將英語(或閩南語)語音翻譯成中文文字,再翻譯成閩南語(或英語),然後新增至訓練資料中。透過這方法利用了資源充足的相似語言資料,大幅改善模型成效。
此外,也透過語音探勘,用預先訓練好的語音編碼器,透過編碼方式將閩南語語音嵌入內容加入到其他語言的相同語意空間中,而無須取得閩南語書寫文字。閩南語語音可和擁有相似語意嵌入內容的英語語音和文字配對。接著從文字合成英文語音,產生平行的閩南語和英語語音。
而這套全新模型,讓語音轉單元翻譯(S2UT)系統,直接在先前由Meta開創的路徑中,將輸入的語音翻譯成一系列聲學單元,然後從這些單元中生成波形。而後針對二次解碼機制採用 UnitY,讓第一階段解碼器產生相關語言(中文)的文字,讓第二階段解碼器製作單元。
針對評估準確度上,Meta還開發了「Tâi-lô」系統,將閩南語語音轉譯成標準化拼音符號。以音節為單位計算 BLEU(標準機器翻譯衡量指標)分數。此外,也根據「Taiwanese Across Taiwan」的閩南語語音語料庫,建立第一個閩南語與英語雙向語音翻譯基準資料集。
AI研究有助打破現實世界和元宇宙中語言限制,Meta期望,未來所有語言無論是否可書寫,都不再是阻礙大家相互理解的障礙。
延伸閱讀
美中科技戰 半導體大老黃崇仁、盧超群都擔心經濟有影響「台灣無法置身事外」
晶圓代工2023趨勢 研調:3奈米先進製程進入架構轉換期、成熟製程多角化發展
Yahoo財經特派記者 呂俊儀:資深財經媒體工作者,曾任採訪團隊主管,專訪過長榮集團創辦人張榮發、鴻海創辦人郭台銘,也歷經台積電創辦人張忠謀退休記者會等大事件,堅持產出最專業、富有洞見的新聞。