OpenAI模擬真人說話AI技術 具應用潛力也藏隱憂

AI新創公司OpenAI宣布已開發一項生成式AI技術「Voice Engine」,只要簡短的真人錄音就能模擬出錄音者的聲音來說話。由於所生成出來的模擬人聲真假難辨,因此OpenAI暫時未有廣泛對外開放使用計畫。

Voice Engine只要一段15秒語音樣本,就能複製出與錄音者相似度極高的說話聲音。加上文字輸入後,就能透過文字轉語音的技術,以模擬出來的錄音者聲音把文字內容說出來。

這種由AI合成出來的人聲,還能轉換成說出錄音者母語以外的其他外語,又同時能保留錄音者的口音和語調。

OpenAI表示這項AI技術,可用來幫助那些因疾病或其他因素,導致說話有困難的人用自己的聲音講話。另外,企業也能在與外國公司接洽過程中,使用這技術把其資訊轉換成對方的語言來加強溝通。

但Voice Engine模擬出來的真人聲音接近難以分辨程度,因此令人憂慮具備這功能的AI聊天機器人,可能被有心人士在選舉或其他重要場合,用來散播虛假資訊的工具。

OpenAI承認這種生成式模擬真人聲音的技術確實存在嚴重風險,尤其在重要選舉時會令人擔心出現虛假訊息的問題。由於有各種可能的風險,因此OpenAI目前暫時沒有對外廣泛地開放使用這技術的計劃。

OpenAI表示現階段仍必須採取多項措施,去防止這項AI技術被不當使用。目前只會小規模地向部份企業提供Voice Engine應用,透過反饋來協助改進使用方法和安全等問題,並思考如何讓不同產業都能好好地使用這AI技術。

廣告

目前OpenAI提供試用的企業,包括線上教育公司Age of Learning、敘事視覺化平台HeyGen、健康資訊軟體商Dimagi、AI通訊app開發商Livox、和健康系統商Lifespan。

更多中時新聞網報導
花246元消費就中獎!全家開出千萬發票 幸運門市在這裡
她1檔明牌賠掉300萬!謝金河看台股ETF之亂 嘆:台灣人1習慣害的
73萬軍公教快排假!五一勞動節變國定假日 但2福利持續縮水中