ChatTTS-Forge一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。0400Ai工具箱AI开源项目# chattts# ChatTTS-Forge# tts
VideoSrtVideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。0270Ai工具箱AI开源项目# VIDEO# VideoSrt
Video-subtitle-remover基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现0220AI开源项目AI编程# AI
Whisper语音识别模型Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。0180Ai工具箱AI开源项目# AI开源# Whisper语音识别模型
V-JEPA创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。0170AIGC开发平台AI开源项目# AI开源项目# Transformer模型# V-JEPA
Coze on WeChat一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。0150Ai工具箱AI开源项目# Coze# wechat
VoiceStreamAI一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。0130AI开源项目AI编程# AI
EmotiVoiceEmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。0130AI开源项目AI编程# AI导航网# EmotiVoice
Grounded-SAMGrounded-SAM:将 Grounded DINO 与 Segment Anything、 Stable Diffusion和Recognize Anything 相结合 - 自动检测、分割和生成任何东西0120AI开源项目AI教程学习# Grounded-SAM# 未来百科
Emote Portrait Alive阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。0120Ai工具箱AI开源项目# Emote Portrait Alive# portrait
书生·物华2.0(3DTopia 2.0)采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。0120AIGC开发平台AI开源项目# AIGC工具导航# AI开源项目# 书生·物华2.0(3DTopia 2.0)
LiberSonora一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。0100Ai工具箱AI开源项目# LiberSonora
FUZZ由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。0100Ai工具箱AI开源项目# FUZZ# 音乐生成
Open WebUI一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。0100Ai工具箱AI开源项目# Open WebUI# WebUI
ChatGPT-MJ开源集合多个AI工具在一个平台上,ChatGPT Web Midjourney Proxy0100AI开源项目其他工具# ChatGPT Web Midjourney Proxy# ChatGPT-MJ# 其他工具
Atomic Agents一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。080Ai工具箱AI开源项目# AI Agent框架# Atomic Agents
Platon.AI – 柏拉图智能Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。070Ai工具箱AI开源项目
HandRefiner解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。070Ai工具箱AI开源项目# Hand# HandRefiner
Awesome-Ollama-Server一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言,能够方便用户进行服务检测和性能监控。060Ai工具箱AI开源项目# Awesome-Ollama-Server