FIFO-Diffusion

11个月前发布 17 00

FIFO-Diffusion是一种基于预训练扩散模型的新颖推理技术,用于文本条件视频生成。它能够无需训练生成无限长的视频,通过迭代执行对角去噪,同时处理队列中一系列连续帧的逐渐增加的噪声水平;该方法在头部出队一个完全去噪的帧,同时在尾部入队一个新的随机噪声帧。此外,引入了潜在分割来减少训练推理差距,并通过前瞻去噪来利用前向引用的好处。

收录时间:
2025-05-29
FIFO-DiffusionFIFO-Diffusion

FIFO-Diffusion是一种基于预训练扩散模型的新颖推理技术,用于文本条件视频生成。它能够无需训练生成无限长的视频,通过迭代执行对角去噪,同时处理队列中一系列连续帧的逐渐增加的噪声水平;该方法在头部出队一个完全去噪的帧,同时在尾部入队一个新的随机噪声帧。此外,引入了潜在分割来减少训练推理差距,并通过前瞻去噪来利用前向引用的好处。

一丢导航 - 上一丢,不易丢

数据统计

相关导航

UniAnimate

UniAnimate

UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间,以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列,支持随机噪声输入和首帧条件输入,显著提高了生成长期视频的能力。此外,它还探索了基于状态空间模型的替代时间建模架构,以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果,并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...