亞馬遜 推出全新語音模型Amazon Nova Sonic
亞馬遜9日宣布推出全新基礎模型Amazon Nova Sonic,其特色為,可將語音理解與語音生成統一於單一的模型中,使AI應用程式中的語音對話更貼近真人交流。
該公司表示,該模型透過Amazon Bedrock上的新API(應用程式界面),可以讓開發者簡化語音應用開發流程。例如,客戶可以開發跨產業的AI代理(AI agents),提供客戶服務通話自動化,並涵蓋旅遊、教育、醫療、娛樂等領域。
亞馬遜表示,從個人AI助手Alexa、AWS雲端服務,如Lex、Polly和Connect等,均要讓語音AI為客戶創造更多實際價值。除了能夠理解人類對話的微妙差異與複雜性。
有別於傳統模型需要複雜並協調多個模型,才能將語音轉為文字的語音識別。Nova Sonic採用全新方法,摒棄使用多個不同模型的方式,而是將理解與生成功能統一於單一模型中。
這種整合使模型能根據語氣、風格等聲音情境以及口語輸入調整生成的語音回應,進而實現更自然的對話。Nova Sonic甚至能理解人類對話的細微變化,包括說話者的自然停頓與猶豫,能在恰當時機做出回應,並能從容應對對話中的插話情況。
更多中時新聞網報導
川普關稅拿台灣祭旗 台廠為何站上海嘯第1排?專家算給你看 教戰3招避禍
年薪280萬工程師被裁 「現金+股票剩900萬」 他一算開銷超崩潰
《台北股市》天上掉禮物!外資敲進168億 台股有救了?