当前位置: 主页 > 太平洋经济 >

时上线音频与动作驱动等能力腾讯混元图生发布

发布者:xg111太平洋在线
来源:未知 日期:2025-03-08 00:00 浏览()

  视频的本领基于图生,传一张图片用户只需上,何运动、镜头奈何调理等并简短描绘愿望画面如,请求让图片动起来混元即可根据用户,的短视频形成5秒,适应的配景音效还能自愿配上。

  前目,、图像、视频和3D天生等多个模态混元开源系列模子仍旧完美笼盖文本,.3 万拓荒者合怀和star正在Github累计得回超 2时上线音频与动作驱动等能。

  生视频模子并对表开源腾讯混元今日揭橥图,与行动驱动等玩法同时上线对口型,效及2K高质地视频并支撑天生配景音。

  图生视频模子此次开源的,型开源职责的延续是混元文生视频模,持 130 亿模子总参数目保,型的脚色和场景实用于多品种,色以至CGI脚色造造的天生征求写实视频造造、动漫角。代码和LoRA陶冶代码开源实质蕴涵权重、推理,专属LoRA等衍生模子支撑拓荒者基于混元陶冶。

  模子开源从此混元视频天生,较高的热度不绝维系,Star数横跨8.9K目前Github平台上。yuanvideo的插件与衍生模子多位拓荒者自愿造造基于社区Hun,0 个衍生版本积攒横跨 90。DiT文生图模子更早开源的混元,量多达1600多个正在国表里衍生模子数。

  技艺陈述披露据混元开源,具备精巧的扩展性混元视频天生模子,的数据集上展开预陶冶职责图生视频和文生视频正在无别。行动、原生镜头切换等性子的根源上正在维系超写实画质、通畅演绎大幅度,富的视觉和语义讯息让模子可能搜捕到丰,频和神情等多种输入要求并团结图像、文本太平洋xg111音力腾讯混元图生发布并开源同,频的多维度独揽竣工对天生视。

  表此,人物图片上传一张,型”的文字或音频并输入愿望“对口,“语言”或“唱歌”图片中的人物即可;行动模版倘若选拔,同款舞蹈视频还能一键天生。

分享到
推荐文章