新闻资讯

发布日期:2025-05-19 05:47    点击次数:170

开云体育阿里巴巴精采开源通义万相Wan2.1-VACE-开云(中国)Kaiyun·官方网站 登录入口

新京报贝壳财经讯(记者罗亦丹)5月14日晚,阿里巴巴精采开源通义万相Wan2.1-VACE,这是业界功能最全的视频生成与裁剪模子,单一模子可同期维持文生视频、图像参考视频生成、视频重绘、视频局部裁剪、视频配景延展以及视频时长延展等全系列基础生成和裁剪才略。本次共开源1.3B和14B两个版块,其中1.3B版块可在奢华级显卡驱动,竖立者可在GitHub、Huggingface及魔搭社区下载体验。该模子还将随性在通义万相官网和阿里云百真金不怕火上线。

据先容,Wan2.1-VACE基于通义万相文生视频模子研发,同期鼎新性提议了全新的视频条目单位VCU,它在输入格式上合股了文生视频、参考图生视频、视频生视频,基于局部区域的视频生视频4大类视频生成和裁剪任务;同期,Wan2.1-VACE还进一步处置了多模态输入的token序列化勤勉,将VCU输入的帧序列进行宗旨解耦,分开重组成可变序列和不成变序列后进行编码。

Wan2.1-VACE维持一皆主流输入面目,涵盖文本、图像、视频、Mask和截至信号,不错已毕脚色一致性、布局、认知姿态和幅度等因素的截至。举例,Wan2.1-VACE不错基于物体参考图大概视频帧生成一段视频,也不错通过抹除、局部扩张等操作,对原有视频进行再行生成,该模子还不错通过深度图、光流、布局、灰度、线稿等截至信号对视频进行裁剪。

Wan2.1-VACE还维持率性基础才略的解放组合,用户无需针对特定功能施行一个新的人人模子,即可完成更复杂的任务,极地面扩张了AI视频生成的思象空间。举例,将图片参考和主体重塑功能组合,不错已毕视频的物体替换;将图片参考、首帧参考、配景扩张和时长延展功能,不错将一张竖疆域片造成横版视频,况且在其中加入参考图片中的元素。

裁剪 陈莉 校对 杨利开云体育





Powered by 开云(中国)Kaiyun·官方网站 登录入口 @2013-2022 RSS地图 HTML地图