
Animate Anyone是一种基于扩散模型打造的可控视频生成框架,通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像,以及一段提示词,就能生成对应的视频,而且改变提示词,生成的人物的背景和身上的衣服也会跟着变化。简单来说就是,一张图、一句话就能让任何人或角色在任何场景里跳舞。
用户可以通过多种方式来输入和控制视频内容。首先,通过文本提示,用户可以描述视频的场景设置、人物动作或特定主题。其次,用户可以上传人脸图像或其他身体特征的图像,以确保视频中的人物具有相似的外观特征。此外,用户还可以输入姿势或深度序列,以定义视频中人物的具体动作和姿态。最后,用户还可以上传服装样式图像,以指定视频中人物的穿着。
Animate Anyone的模型包括一个视频控制网络和一个内容导引器,它可以在保留身份信息的同时实现运动控制,使模型易于使用且能生成多样化的结果。无论是为了娱乐、广告制作还是艺术创作,只要有目标身份和姿势序列,就可以使用Animate Anyone创造独特的舞蹈视频。
论文链接:https://arxiv.org/pdf/2311.17117.pdf
项目地址:https://humanaigc.github.io/animate-anyone/
体验地址:https://huggingface.co/spaces/xunsong/Moore-AnimateAnyone
Animate Anyone的功能特点
- 高质量视频生成: Animate Anyone 基于先进的扩散模型,能够生成高质量的定制人类舞蹈视频。它精细地捕捉人物的姿态和动作,使得生成的舞蹈视频在细节上表现出色,达到了近乎真实的视觉效果。
- 自定义姿势与身份控制:用户可以通过输入自定义的姿势序列,精确控制生成视频中的人物动作。无论是简单的步伐还是复杂的舞蹈动作, Animate Anyone 都能够根据用户的输入进行准确模拟。同时,用户还可以上传人脸参考图像,以控制生成视频中的人物身份,确保人物面部特征和表情的保留。
- 运动控制与内容导引: Animate Anyone 具备运动控制和内容导引功能,能够确保生成的舞蹈视频在动作准确性和身份信息保留方面达到最佳效果。模型中的运动控制网络能够精确捕捉人物的运动轨迹,而内容导引器则能够确保视频内容的连贯性和一致性。
- 简单的文本与图像输入:用户可以通过简单的文本提示和图像输入来控制视频内容。文本提示可以帮助用户描述视频的场景设置、人物动作或特定主题,而图像输入则可以用于指定视频中人物的外观和服装样式。这种输入方式既直观又方便,使得用户可以轻松创建个性化的舞蹈视频。
- 多样化的应用场景: Animate Anyone 适用于多种应用场景,包括娱乐、广告制作、艺术创作等。无论是为了制作个人娱乐视频,还是为了商业广告或艺术创作,DreaMoving都能够提供高质量的舞蹈视频生成解决方案。
本地部署 AnimateAnyone,下载安装模型全流程演示攻略视频教程:
https://img.pidoutv.com/wp-content/uploads/2024/03/1424163892-1-16-1.mp4
数据统计
相关导航

日日新开放平台

Gen-3 Alpha
Gen-3 Alpha是Runway公司开发的一款先进的AI视频生成模型。它能够根据用户的输入(如文本描述、图像或视频片段)创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。

Magi
Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。该模型通过识别漫画页面上的面板、文字块和角色,实现了全自动的剧本生成功能。

神力霓裳
神力霓裳是阿里大文娱发布的自研影视妆造大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。

Lumiere
Lumiere是谷歌发布的一个文本到视频扩散模型,于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频,通过训练海量文本和视频数据,可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用,如图像到视频、视频修复和风格化生成。

百度智能云客悦
百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP(自然语言处理)、ASR(自动语音识别)、TTS(语音合成)等人工智能技术,提供公有云服务并支持同时面向多名用户,自动发起外呼通话的智能化产品。

Monica bots
Monica Bots是一款基于先进AI模型(如 GPT-4、Claude、Gemini 等)的多功能AI助手,能助力用户快速创建和部署智能助手(Bots)的平台,Monica Bots支持跨平台使用,包括浏览器插件(Chrome、Edge、Safari)、桌面端(Windows、macOS)和移动端(iOS、Android)。它集成了聊天、写作、翻译、数据分析、AI 绘图等多项功能,让即使没有技术背景的人也能轻松上手构建和管理自己的AI应用,满足各种场景需求。

WiseDiag-Z1
WiseDiag-Z1是由杭州智诊科技推出的全科医学通用大语言模型,专为医疗领域设计,具有730亿参数和强大的医学知识库。它在知名的医学大模型主流榜单中名列前茅,适用于大多数复杂场景的健康咨询。
暂无评论...