阿里雲發布多模態模型Qwen2.5-Omni-7B 即時回應字圖聲片
阿里巴巴旗下阿里雲最新推出Qwen2.5-Omni-7B模型,阿里巴巴介紹為「通義千問系列端對端多模態模型」,而且能在智能手機或筆記型電腦等終端裝置運行。阿里巴巴稱,即使Qwen2.5-Omni-7B使用70億個參數,即較公司本月初發布的通義千問QwQ-32B少78%,但依然可以提供「沒有妥協(uncompromised )」的性能和多模態處理能力,有利開發靈活和具成本效益的AI agents(智能體)。
香港經濟日報報導,所謂多模態模型(Multimodal Model)即可以處理的不同類型的數據形式輸入和輸出,如阿里巴巴介婀,Qwen2.5-Omni-7B能接收文字、圖像、語音和影片輸入,並即時以文字和自然語音回應。
阿里巴巴已將Qwen2.5-Omni-7B模型開源在Hugging Face 和GitHub,並且可在Qwen Chat上體驗。
阿里巴巴同時上載Qwen2.5-Omni-7B與其他專門於單一模態的模型,在不同評測中的評分表現,指出旗下模型使用Thinker-Talker架構,將文字生成與語音合成分開,減少不同模態之間的干擾。
阿里巴巴近來密集發布不同類型的AI大模型系統,包括1月推出的Qwen2.5-Max,並將多個模型開源。阿里巴巴最新表示,過去多年阿里雲已提供逾200個開源生成式AI大模型。
更多中時新聞網報導
大神專訪3-2》買到200元長榮淪水鬼 他改抱鴻海等3檔不怕被賣飛
全聯開出1張千萬發票!幸運門市曝光 花49元買布丁中獎
普發1萬元現金要來了?別只花錢 押這3種股票賺更多