热门

UniAnimate

1年前发布 38 00

UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间，以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列，支持随机噪声输入和首帧条件输入，显著提高了生成长期视频的能力。此外，它还探索了基于状态空间模型的替代时间建模架构，以替代原始的计算密集型时间...

收录时间：

2025-05-29

打开网站手机查看

视频生成 # 人物动画 # 扩散模型 # 时间建模 # 视频生成 # 计算机视觉

UniAnimate

UniAnimate

UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间，以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列，支持随机噪声输入和首帧条件输入，显著提高了生成长期视频的能力。此外，它还探索了基于状态空间模型的替代时间建模架构，以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果，并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。

一丢导航 - 上一丢，不易丢

数据统计

相关导航

ComfyUI-LumaAI-API

ComfyUI-LumaAI-API是一个为ComfyUI设计的插件，它允许用户直接在ComfyUI中使用Luma AI API。Luma AI API基于Dream Machine视频生成模型，由Luma开发。该插件通过提供多种节点，如文本到视频、图像到视频、视频预览等，极大地丰富了视频生成的可能性，为视频创作者和开发者提供了便捷的工具。

CogVideoX-2B

CogVideoX-2B是一个开源的视频生成模型，由清华大学团队开发。它支持使用英语提示语言生成视频，具有36GB的推理GPU内存需求，并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入，目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署，能够根据文本提示生成视频，具有高度的创造性和应用潜力。

通义视频

通义视频是阿里云旗下通义万相平台推出的AI视频生成工具，于2024年9月19日的云栖大会上正式发布。通义AI生视频支持“文生视频”和“图生视频”两种创作模式，用户可以通过输入文本或图片上传，快速生成高质量的影视级视频内容。通义视频依托阿里自研的AI视频生成大模型，具备强大的风格泛化和动态生成能力，擅长概念理解与组合生成，可以根据用户需求生成不同风格的视频画面。通义万相AI视频还特别注重中式元素的表现，在制作中国风视频时表现出色。

Runway API

Runway API是一个强大的视频模型平台，提供先进的生成视频模型，允许用户在安全、可靠的环境中嵌入Gen-3 Alpha Turbo到他们的产品中。它支持广泛的应用场景，包括创意广告、音乐视频、电影制作等，是全球顶尖创意人士的首选。

Viggle AI Video

ViggleAI is a powerful AI-powered animation tool and image-to-video AI generator. It allows you to animate your characters for free and create stunning animations, even without any prior animation experience.

Creative Reality Studio (D-ID)

世界上第一个结合GPT-3、稳定扩散和D-ID独特人脸动画技术的平台。我们的生成式人工智能将在几秒钟内将您的想象变成一个说话的人物形象。

PAB

PAB 是一种用于实时视频生成的技术，通过 Pyramid Attention Broadcast 实现视频生成过程的加速，提供了高效的视频生成解决方案。该技术的主要优点包括实时性、高效性和质量保障。PAB 适用于需要实时视频生成能力的应用场景，为视频生成领域带来了重大突破。

AnimateAnyone

AnimateAnyone是一个基于深度学习的视频生成模型，它能够将静态图片或视频转换为动画。该模型由Novita AI非官方实现，灵感来源于MooreThreads/Moore-AnimateAnyone的实现，并在训练过程和数据集上进行了调整。

暂无评论

您必须登录才能参与评论！

none

暂无评论...