技術(shù)
導(dǎo)讀:阿里巴巴正式開源通義萬(wàn)相 Wan2.1-VACE,這是一款支持視頻生成與編輯的模型。
據(jù)《科創(chuàng)板日?qǐng)?bào)》報(bào)道,阿里巴巴正式開源通義萬(wàn)相 Wan2.1-VACE,這是一款支持視頻生成與編輯的模型,單一模型可同時(shí)支持文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時(shí)長(zhǎng)延展等全系列基礎(chǔ)生成和編輯能力。
據(jù)悉,本次共開源 1.3B 和 14B 兩個(gè)版本,其中 1.3B 版本可在消費(fèi)級(jí)顯卡運(yùn)行。
據(jù)了解,通義萬(wàn)相是阿里云通義系列 AI 繪畫創(chuàng)作大模型,可輔助人類進(jìn)行圖片創(chuàng)作,于 2023 年 7 月 7 日正式上線。在 2024 年 9 月 19 日的阿里云棲大會(huì)上,阿里發(fā)布了通義萬(wàn)相視頻生成大模型。該模型可以生成影視級(jí)高清視頻,而且更能聽懂中國(guó)話。
值得注意的是,今年 1 月初通義萬(wàn)相視頻生成模型宣布升級(jí)至 2.1 版,模型整體性能大幅提升,尤其是在處理復(fù)雜運(yùn)動(dòng)、還原真實(shí)物理規(guī)律、提升電影質(zhì)感及優(yōu)化指令遵循方面取得了顯著進(jìn)展。2 月 25 日,阿里巴巴宣布全面開源旗下視頻生成模型萬(wàn)相 2.1 模型。