二分文章网 手机版
您的位置: 首页 > 实时讯息 >

腾讯混元视频生成工具HunyuanCustom宣布开源

0次浏览     发布时间:2025-05-09 11:48:00    

IT之家 5 月 9 日消息,腾讯混元宣布今天正式推出并开源全新的多模态定制化视频生成工具 Hunyuan Custom。该模型基于混元视频生成大模型(Hunyuan Video)打造,主体一致性效果超过现有的开源方案。

据介绍,Hunyuan Custom 融合了文本、图像、音频、视频等多模态输入生视频的能力,是一款具备高度控制力和生成质量的智能视频创作工具。

腾讯表示,Hunyuan Custom 模型能实现单主体视频生成、多主体视频生成、单主体视频配音、视频局部编辑等能力,其生成的视频与用户输入的参考主体能保持高度一致。

其中,单主体生成能力已经开源并在混元官网(IT之家附官网地址:
https://hunyuan.tencent.com/
)上线,用户可以在“模型广场-图生视频-参考生视频”中体验,其他能力将于 5 月内陆续对外开源。

有了 HunyuanCustom,用户只需上传一张包含目标人物或物体的图片,并提供一句文本描述(例如“他正在遛狗”),HunyuanCustom 就能识别出图片中的身份信息,并在完全不同的动作、服饰与场景中生成连贯自然的视频内容。

除了单主体以外,这个能力同样能实现多主体视频的生成,用户提供一张人物和一张物体的照片(比如一包薯片和一名男子的照片),并输入文字描述(比如“一名男子正在游泳池旁边,手里拿着薯片进行展示”),即可能让这两个主体按要求出现在视频里。

此外,HunyuanCustom 不止于图像和文本的配合,还具备强大的扩展能力。在音频驱动(单主体)模式下,用户可以上传人物图像并配上音频语音,模型便可生成人物在任意场景中说话、唱歌或进行其他音视频同步表演的效果,广泛适用于数字人直播、虚拟客服、教育演示等场景。

在视频驱动模式下,HunyuanCustom 支持将图片中的人物或物体自然地替换或插入到任意视频片段中,进行创意植入或场景扩展,轻松实现视频重构与内容增强。

此前大部分的视频生成模型主要能实现文生视频和图生视频。文生视频每次均根据本文提示词重新生成,很难持续保持人物和场景的一致性。而图像生成视频模型主要实现的是“让图片动起来”。例如,上传一张人物照片,最终生成的视频通常只能在照片的原始服饰、姿态和场景下做出一些固定表情或动作,服装、背景和姿态几乎无法修改。

但在部分场景下,创作者希望保持人物一致的情况下,改变人物所在的环境和动作。此前的视频生成模型无法实现,多模态视频生成模型 HunyuanCustom 则可以很好地满足创作者的需求,通过引入身份增强机制和多模态融合模块,真正实现了“图像提供身份,文本定义一切”。

参考资料:

  • 体验入口:https://hunyuan.tencent.com/modelSquare/home/play?modelId=192

  • 项目官网:https://hunyuancustom.github.io/

  • 代码开源:https://github.com/Tencent/HunyuanCustom

  • 论文地址:https://arxiv.org/pdf/2505.04512

相关文章

5G信号多个A带来哪些改变?最近,不少用户发现自己手机右上角的标识由“5G”变成了“5G-A”。多个A代表什么?又会带来哪些改变?5G-A,即5G-Advanced,也被称为5.5G网络,是传统5G的升级版。专家介绍,移动通信技术一般代际生命周期为10年。由于代与代之间技术差距太大,在这10年的中间

2025-05-09 15:51:00

IT之家 5 月 9 日消息,腾讯混元宣布今天正式推出并开源全新的多模态定制化视频生成工具 Hunyuan Custom。该模型基于混元视频生成大模型(Hunyuan Video)打造,主体一致性效果超过现有的开源方案。据介绍,Hunyuan Custom 融合了文本、图像、音频、视频等多模态输入生

2025-05-09 11:48:00

最近,不少移动和联通用户发现手机上出现了5G-A信号。5G-A是什么?对我们普通人来说又有什么用呢?▌5G-A走进大众生活 通信体验更快更优质5G-A和5G相比,能够在容量、速率、时延、定位、可靠性等方面实现大幅提升,可以带来更快、更优质的通信体验,并有望实现低成本千亿物联。赛迪顾问通信产业研究中心

2025-05-08 22:11:00

环球通信跟随北京媒体采访团一道参加数字中国建设峰会,现场报道:联通首设,先睹为快!中国联通打造数字中国建设峰会低空经济展区。| 环球通信| @好5G |通信行业最具影响力自媒体化身无人机飞行员纵览山河盛景,感受超低空飞行的速度与激情;紧急关头,无人机勇担急救先锋,15分钟紧急配送血液……这些颇具未来

2025-05-08 14:34:00

OpenAI天价收购案即将完成。爆料称,OpenAI将出资30亿美元吞并AI编程工具Windsurf,成为其迄今为止最大规模的收购。OpenAI史上最大一笔收购即将敲定。彭博爆料称,OpenAI将豪掷30亿美元,吞并了爆火编码神器Windsurf(前身为Codeium)。此前,早有外媒曝出了这笔交

2025-05-07 11:25:00