首次實(shí)現(xiàn)中文文字生成,消息稱阿里通義萬相2.1視頻生成模型今晚開源
IT之家 2 月 25 日消息,據(jù)新浪科技援引知情人士消息稱,阿里巴巴將于今晚全面開源旗下視頻生成模型萬相 2.1 模型。
今年 1 月,阿里通義萬相推出了 2.1 版本模型升級,其在視頻生成、圖像生成兩大能力均有顯著提升。
在視頻生成方面,通義萬相 2.1 通過自研的高效 VAE 和 DiT 架構(gòu)增強(qiáng)了時(shí)空上下文建模能力,支持無限長 1080P 視頻的高效編解碼,首次實(shí)現(xiàn)了中文文字視頻生成功能,登上 VBench 榜單第一。
據(jù)介紹,通義萬相 2.1 支持中英文視頻,都可以一鍵生成藝術(shù)字,還提供多種視頻特效選項(xiàng),以增強(qiáng)視覺表現(xiàn)力,例如過渡、粒子效果、模擬等等。其還支持復(fù)雜運(yùn)鏡,可還原碰撞、反彈、切割、擠壓等真實(shí)世界的物理規(guī)律,例如雨滴落在傘上會濺起水花。
官方曾表示,通義萬相 2.1 支持中英文一鍵生成藝術(shù)字,還提供了多種視頻特效選項(xiàng),如過渡、粒子效果、模擬等等。
據(jù)IT之家此前報(bào)道,通義萬相去年 9 月宣布支持文生視頻、圖生視頻等,還有插畫設(shè)計(jì)、涂鴉作畫、局部重繪、短片創(chuàng)作、配樂生成等場景化能力。
最新推薦
閱讀排行榜
欄目索引
相關(guān)內(nèi)容