琴乐大模型

5个月前发布 7 00

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型。它可以通过输入中英文关键词、描述性语句或音频,能够直接生成立体声音频或多轨乐谱。

收录时间:
2024-11-29
琴乐大模型琴乐大模型

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型。它可以通过输入中英文关键词、描述性语句或音频,能够直接生成立体声音频或多轨乐谱。具体来说,琴乐大模型可以根据文本提示生成44.1kHz的立体声音频(wav)或多轨乐谱(MIDI),包括旋律轨、和弦轨、伴奏轨和打击乐轨等。它还支持对生成的乐谱进行自动编辑,如续写、重新生成指定轨、修改乐器类型等。

琴乐大模型 – 腾讯推出的人工智能音乐创作大模型

琴乐大模型的主要功能特点

  1. 音乐生成:通过输入中英文关键词、描述性语句或音频,琴乐大模型可以直接生成44.1kHz的立体声音频(wav)或多轨乐谱(MIDI),包括旋律轨、和弦轨、伴奏轨和打击乐轨。
  2. 自动编辑:支持对生成的乐谱进行自动编辑,如续写、重新生成指定轨、重新生成指定小节、修改乐器类型和节奏等。
  3. 高质量输出:在大规模双盲听测中,琴乐大模型在多维度主观评分上超越了业内其他音乐生成模型
  4. 多模态支持:模型包含多个模块,包括音频文本对齐模型、乐谱/音频表征提取模型、大语言模型、立体声生成模型和声码器等,能够实现高效、准确的音乐生成。
  5. 未来扩展:研究团队计划在模型中加入人声、歌词等要素的生成能力,以更好地服务音乐创作需求。

这个模型的应用非常广泛,可以帮助音乐人更高效地创作音乐,也可以为普通用户提供生成音乐的能力。目前,相关技术已经上线腾讯音乐启明星平台,供音乐创作者使用。

腾讯音乐天琴实验室面向QQ音乐、全民k歌、腾讯音乐人、酷我、酷狗等产品的多媒体与AI应用型技术研究与落地。负责的明星项目包括QQ音乐上的听歌识曲、哼唱识别、翻唱识别、歌词时间戳、臻品音质、DMEE、mv视频剪辑、字幕识别、明星识别;全民K歌上的唱歌评分、智能修音、智能音效、歌声合成;懒人畅听上的AI朗读、AI文稿;直播互动上的智能品鉴、高光识别、端云一体视频质量提升。同时还在探索元宇宙中的虚拟人技术,以虚拟形象、虚拟舞蹈、歌唱表情生成、音乐灯光秀等为核心的小天小琴兄妹虚拟人即将面世,敬请期待。

数据统计

相关导航

Segment Anything

Segment Anything

Segment Anything是一个基于深度学习的图像分割模型,它可以根据用户的输入提示(如点或框)生成高质量的物体遮罩。它可以用于为图像中的任何物体生成遮罩,无论是常见的物体(如人、车、猫等),还是罕见的物体(如火箭、恐龙、魔法棒等)。它的特点是具有强大的零样本性能,即它可以在没有见过的类别上进行分割,而不需要额外的训练数据。它的另一个优点是具有快速的推理速度,即它可以在几秒钟内处理一张图像,而不需要显卡或云计算资源。
知海图AI

知海图AI

知海图AI是知乎与面壁智能合作开发的中文大模型,于2023年4月13日开始内测。它的主要功能是对知乎热榜上的问题回答进行要素抽取、观点梳理和内容聚合,以便用户能够更快、更全面地了解知友们讨论的热点与焦点。知海图AI在特定场景中的表现与GPT-4相当,显示出强大的语言理解和内容总结能力。此外,知海图AI的发布也标志着知乎在大语言模型领域的进一步布局,旨在赋能创作者、讨论场、信息获取等多个业务场景。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...