BakeryBakery是一个专注于开源AI模型的微调与变现的在线平台,为AI初创企业、机器学习工程师和研究人员提供了一个便捷的工具,使他们能够轻松地对AI模型进行微调,并在市场中进行变现。该平台的主要优点在于其简单易用的界面和强大的功能,用户可以快速创建或上传数据集,微调模型设置,并在市场中进行变现。Bakery的背景信息表明,它旨在推动开源AI技术的发展,并为开发者提供更多的商业机会。虽然具体的定价信息未在页面中明确展示,但其定位是为AI领域的专业人士提供一个高效的工具。0560代码辅助# AI# 变现# 开源
LumberyardAmazon Lumberyard是一款开源的游戏引擎,无需版税或座位费用,与Twitch和AWS无缝集成,适用于各种类型的游戏开发,包括虚拟现实和增强现实。0500其它AI工具游戏# 开源# 游戏引擎
智趣AI甄选智趣AI甄选是一个专注于人工智能领域的综合性平台,旨在洞察行业发展前景,精选并展示国内外的AI产品与应用。平台提供丰富的学习资源,行业融合案例分析,助力用户洞悉AI发展趋势,与AI技术同行,共创未来。0500智能聊天机器人# AI搜索# AI数字人# 代码生成
博客园AI专区博客园是一个面向开发者的知识分享社区。自创建以来,博客园一直致力并专注于为开发者打造一个纯净的技术交流社区,推动并帮助开发者通过互联网分享知识,从而让更多开发者从中受益。博客园的使命是帮助开发者用代码改变世界0500AI博客论坛社区首页# AI博客论坛社区# AI学习网站# Code
TranscribroTranscribro是一款运行在Android平台上的私有、设备端语音识别键盘和文字服务应用,它使用whisper.cpp来运行OpenAI Whisper系列模型,并结合Silero VAD进行语音活动检测。该应用提供了语音输入键盘,允许用户通过语音进行文字输入,并且可以被其他应用显式使用,或者设置为用户选择的语音转文字应用,部分应用可能会使用它来进行语音转文字。Transcribro的背景是为用户提供一种更安全、更私密的语音转文字解决方案,避免了云端处理可能带来的隐私泄露问题。该应用是开源的,用户可以自由地查看、修改和分发代码。0490语音处理# android# 开源# 语音识别
SunoAI APISuno API是一个开源项目,允许用户设置自己的Suno AI音乐服务API。它实现了app.suno.ai的创建API,兼容OpenAI的API格式,支持自定义模式,一键部署到Vercel,并且拥有开放源代码许可证,允许自由集成和修改。0490音乐创作# AI音乐# API# 一键部署
FragmentsFragments是一个基于Next.js的开源模板,用于构建完全由AI生成的应用。它集成了E2B Sandbox SDK和Code Interpreter SDK,支持多种编程语言和框架,如Python、Next.js、Vue.js等,并支持多种人工智能大型语言模型(LLM)提供商,如OpenAI、Anthropic等。此模板特别适合希望快速启动并利用AI进行应用开发的开发者。0470开发者工具# AI# Next.js# Web开发
OLMo-2-1124-7B-SFTOLMo-2-1124-7B-SFT是由艾伦人工智能研究所(AI2)发布的一个英文文本生成模型,它是OLMo 2 7B模型的监督微调版本,专门针对Tülu 3数据集进行了优化。Tülu 3数据集旨在提供多样化任务的顶尖性能,包括聊天、数学问题解答、GSM8K、IFEval等。该模型的主要优点包括强大的文本生成能力、多样性任务处理能力以及开源的代码和训练细节,使其成为研究和教育领域的有力工具。0430文案写作# 开源# 文本生成# 机器学习
SciraScira 是一个基于 AI 技术的搜索引擎,旨在通过强大的语言模型和搜索能力,为用户提供更高效、更精准的信息检索体验。它支持多种语言模型,如 Grok 2.0 和 Claude 3.5 Sonnet,并集成了 Tavily 等搜索工具,能够提供网页搜索、编程代码运行、天气查询等多种功能。Scira 的主要优点在于其简洁的界面和强大的功能集成,适合对传统搜索引擎不满意、希望借助 AI 提升搜索效率的用户。该项目开源免费,用户可以根据自己的需求进行本地部署或使用其提供的在线服务。0430代码辅助# AI 搜索# 多语言支持# 天气查询
AI数字人分身系统小狐狸AI数字人分身系统是一款结合了人工智能技术的数字人口型同步产品,支持无限多开和贴牌OEM,适用于需要虚拟形象进行口型同步互动的场景。该产品背景基于人工智能技术的发展,特别是在虚拟主播和在线教育领域的应用需求日益增长。产品价格为3580元,定位于中高端市场,主要优点包括完全开源、支持自主二次开发和定制二次开发,以及免费搭建服务。0400视频创作# AI# 口型同步# 开源
MistoLineMistoLine是一个SDXL-ControlNet模型,能够适应任何类型的线条艺术输入,展示出高精度和出色的稳定性。它基于用户提供的线条艺术生成高质量图像,适用于手绘草图、不同ControlNet线条预处理器和模型生成的轮廓。MistoLine通过采用新颖的线条预处理算法(Anyline)和基于stabilityai/stable-diffusion-xl-base-1.0的Unet模型的重新训练,以及在大型模型训练工程中的创新,展现出在复杂场景下超越现有ControlNet模型的细节恢复、提示对齐和稳定性的优越性能。0400艺术创作# AI# 图像处理# 开源
Orpheus TTSOrpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统,旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力,适合各种实时应用场景。该产品是免费的,旨在为开发者和研究者提供便捷的语音合成工具。0400文案写作# 人工智能# 开源# 文本转语音
QwQ-32B-Preview-gptqmodel-4bit-vortex-v3该产品是一个基于Qwen2.5-32B的4位量化语言模型,通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时,显著降低了模型的存储和计算需求,适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景,如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。0380代码辅助# 内容创作# 多语言# 开源
Open Multi-Agent CanvasOpen Multi-Agent Canvas 是一个基于 Next.js、LangGraph 和 CopilotKit 构建的开源多智能体聊天界面。它允许用户在一个动态对话中管理多个智能体,主要用于旅行规划和研究。该产品利用先进的技术,为用户提供高效、灵活的多智能体交互体验。其开源特性使得开发者可以根据需求进行定制和扩展,具有很高的灵活性和可扩展性。0370智能聊天机器人# Next.js# 动态对话# 多智能体
s1-32Bs1是一个推理模型,专注于通过少量样本实现高效的文本生成能力。它通过预算强制技术在测试时进行扩展,能够匹配o1-preview的性能。该模型由Niklas Muennighoff等人开发,相关研究发表在arXiv上。模型使用Safetensors技术,具有328亿参数,支持文本生成任务。其主要优点是能够通过少量样本实现高质量的推理,适合需要高效文本生成的场景。0360文案写作# 开源# 推理模型# 文本生成
EaseVoice TrainerEaseVoice Trainer 是一个后端项目,旨在简化和增强语音合成与转换训练过程。该项目基于 GPT-SoVITS 进行改进,注重用户体验和系统的可维护性。其设计理念不同于原始项目,旨在提供更模块化和定制化的解决方案,适用于从小规模实验到大规模生产的多种场景。该工具可以帮助开发者和研究人员更高效地进行语音合成和转换的研究与开发。0350语音处理# 开源# 教育# 机器学习
Image/Manga Translator该项目可以将漫画/图片中的文字进行翻译,主要功能包括文本检测、光学字符识别(OCR)、机器翻译和图像修补。它支持多种语言如日语、中文、英语和韩语等,可实现近乎完美的翻译效果。该项目主要面向漫画爱好者和图像处理工作者,可以方便地阅读外语漫画或进行图像的多语言处理。此外,它还提供Web服务、在线演示和命令行工具等多种使用方式,具有良好的可用性。该项目代码开源,欢迎大家一起完善和贡献。0350智能翻译# OCR# 图像修补# 图像翻译
ComfyUI-MochiWrapperComfyUI-MochiWrapper是一个用于Mochi视频生成器的包装节点,它允许用户通过ComfyUI界面与Mochi模型进行交互。这个项目主要优点是能够利用Mochi模型生成视频内容,并且通过ComfyUI简化了操作流程。它是基于Python开发的,并且完全开源,允许开发者自由地使用和修改。目前该项目还处于积极开发中,已经有一些基本功能,但还没有正式发布版本。0340视频创作# Mochi模型# Python# 开源
kokoro-onnxkokoro-onnx是一个基于Kokoro模型和ONNX运行时的文本到语音(TTS)项目。它支持英语,并计划支持法语、日语、韩语和中文。该模型在macOS M1上具有接近实时的快速性能,并提供多种声音选择,包括耳语。模型轻量级,约为300MB(量化后约为80MB)。该项目在GitHub上开源,采用MIT许可证,方便开发者集成和使用。0340语音处理# ONNX# tts# 开源
OpenVoiceChatOpenVoiceChat是一个开源项目,旨在提供一个与大型语言模型(LLM)进行自然语音对话的平台。它支持多种语音识别(STT)、文本到语音(TTS)和LLM模型,允许用户通过语音与AI进行交互。项目采用Apache-2.0许可,强调开放性和易用性,目标是成为封闭商业实现的开源替代品。0340语音处理# 开源# 文本到语音# 自然语言处理
开源中国OSCHINA.NET 是目前领先的中文开源技术社区。我们传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台0340社区首页# java开源# OSC# perl开源
路灯IT技术博客一枚Java程序猿,IT独立博主,从2010年至今我们一直致力于各类技术学习交流分享。热爱技术,分享无限!B站,头条,各短视频平台,同名账号“后厂村路灯”欢迎关注。核心板块:编程技术,技术教程,绿色软件,最新电影,网赚项目,苹果微信多开、苹果开发等。0330博主推荐攻城狮# GBox# ios签名# j2ee
WeSTWeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和一个投影器组成,其中仅投影器部分可训练。WeST的开发灵感来源于SLAM-ASR和LLaMA 3.1,旨在通过简化的代码实现高效的语音识别功能。0330语音处理# 开源# 机器学习# 自然语言处理
ThinkPHPThinkPHP框架,原名FCS,是MVC结构的开源PHP框架,遵循Apache2开源协议发布,是为了敏捷WEB应用开发和简化企业应用开发而诞生的。 ThinkPHP框架的特性 0330开源程序站长助手# PHP开源框架# php框架# thinkphp
HuatuoGPT-o1-8BHuatuoGPT-o1-8B 是一个专为高级医疗推理设计的医疗领域大型语言模型(LLM)。它在提供最终响应之前会生成一个复杂的思考过程,反映并完善其推理过程。该模型基于LLaMA-3.1-8B构建,支持英文,并且采用'thinks-before-it-answers'的方法,输出格式包括推理过程和最终响应。此模型在医疗领域具有重要意义,因为它能够处理复杂的医疗问题并提供深思熟虑的答案,这对于提高医疗决策的质量和效率至关重要。0320文案写作# 医疗# 大型语言模型# 开源
Huginn-0125Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数,经过8000亿个token的训练,在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量,能够根据任务需求灵活增加或减少计算步骤,从而在保持性能的同时优化资源利用。该模型基于开源的Hugging Face平台发布,支持社区共享和协作,用户可以自由下载、使用和进一步开发。其开源性和灵活的架构使其成为研究和开发中的重要工具,尤其是在资源受限或需要高性能推理的场景中。0320代码辅助# 人工智能# 代码生成# 开源
genmoaigenmoai/models 是一个开源的视频生成模型,代表了视频生成技术的最新进展。该模型名为 Mochi 1,是一个基于 Asymmetric Diffusion Transformer (AsymmDiT) 架构的10亿参数扩散模型,从零开始训练,是迄今为止公开发布的最大的视频生成模型。它具有高保真运动和强提示遵循性,显著缩小了封闭和开放视频生成系统之间的差距。该模型在 Apache 2.0 许可下发布,用户可以在 Genmo 的 playground 上免费试用此模型。0320视频创作# 人工智能# 开源# 扩散模型
StarVectorStarVector 是一个先进的生成模型,旨在将图像和文本指令转化为高质量的可缩放矢量图形(SVG)代码。其主要优点在于能够处理复杂的 SVG 元素,并在各种图形风格和复杂性上表现出色。作为开放源代码资源,StarVector 推动了图形设计的创新和效率,适用于设计、插图和技术文档等多种应用场景。0310图像生成# SVG 生成# 图像处理# 多模态模型
DeepSeek JapaneseDeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型,专注于开源模型和创新训练方法。其 R1 系列模型在逻辑推理和问题解决方面表现出色,采用强化学习和混合专家框架优化性能,以低成本实现高效训练。DeepSeek 的开源策略推动了社区创新,同时引发了关于 AI 竞争和开源模型影响力的行业讨论。其免费且无需注册的使用方式进一步降低了用户门槛,适合广泛的应用场景。0310代码辅助# AI# 多模态# 开源
SuperCoder 2.0SuperCoder 2.0是一个开源的自主软件开发系统,利用大型语言模型(LLMs)和大型动作模型(LAMs)针对Python代码生成进行微调,以实现更高精度的一次性或少次编程。它结合特定于开发框架的软件护栏,如Flask和Django,与SuperAGI的通用智能开发代理一起,提供复杂的现实世界软件系统。SuperCoder 2.0还确保了您的知识产权和代码免受AI相关的滥用,并与现有的开发栈如Jira、Github或Gitlab、Jenkins、CSPs以及QA解决方案如BrowserStack/Selenium Clouds深度集成,确保无缝的软件开发体验。0290开发者工具# Python# 开源# 自助开发
AI Video Starting Kitvideo-starter-kit 是一个强大的开源工具包,用于构建基于 AI 的视频应用。它基于 Next.js、Remotion 和 fal.ai 构建,简化了在浏览器中使用 AI 视频模型的复杂性。该工具包支持多种先进的视频处理功能,如多剪辑视频合成、音频轨道集成和语音支持等,同时提供了开发者友好的工具,如元数据编码和视频处理管道。它适用于需要高效视频生成和处理的开发者和创作者。0290视频创作# AI# Next.js# Remotion
PrototypePrototype是一个用于快速搭建Django项目的模板,集成了OpenAI功能,通过Docker容器化实现便捷部署。它为开发者提供了一个高效的起点,能够快速启动并运行一个具备人工智能功能的Web应用。该模板通过简化环境配置和项目搭建流程,帮助开发者专注于核心功能的开发,同时利用OpenAI的强大能力扩展应用的智能化特性。项目开源且采用MIT许可证,适合希望快速开发智能Web应用的开发者。0290开发者工具# Django# OpenAI# 容器化
Light-R1-14B-DSLight-R1-14B-DS 是由北京奇虎科技有限公司开发的开源数学模型。该模型基于 DeepSeek-R1-Distill-Qwen-14B 进行强化学习训练,在 AIME24 和 AIME25 数学竞赛基准测试中分别达到了 74.0 和 60.2 的高分,超越了许多 32B 参数量的模型。它在轻量级预算下成功实现了对已经长链推理微调模型的强化学习尝试,为开源社区提供了一个强大的数学模型工具。该模型的开源有助于推动自然语言处理在教育领域的应用,特别是数学问题解决方面,为研究人员和开发者提供了宝贵的研究基础和实践工具。0290学习教育# 开源# 强化学习# 教育
PhpcmsPhpcms,中国领先的网站内容管理系统,采用模块化开发,支持多种分类方式,使用它可方便实现个性化网站的设计、开发与维护。 Phpcms的特色 全新框架 采用全球0290开源程序站长助手# phpcms# 内容管理# 内容管理系统
Llama-3.1-Tulu-3-70B-SFTLlama-3.1-Tulu-3-70B-SFT是Tülu3模型家族的一部分,专为现代后训练技术提供全面指南而设计。该模型不仅在聊天任务上表现出色,还在MATH、GSM8K和IFEval等多种任务上实现了最先进的性能。它是基于公开可用的、合成的和人类创建的数据集训练的,主要使用英语,并遵循Llama 3.1社区许可协议。0280文案写作# 后训练技术# 开源# 指令遵循
NeoBaseNeoBase 是一款创新的 AI 数据库助手,通过自然语言处理技术让用户能够以对话的方式与数据库进行交互。它支持多种主流数据库,如 PostgreSQL、MySQL、MongoDB 等,并且可以与 OpenAI、Google Gemini 等 LLM 客户端集成。其主要优点是简化了数据库管理流程,降低了技术门槛,使非技术用户也能轻松管理和查询数据。NeoBase 采用开源模式,用户可以根据自身需求进行定制和部署,确保数据安全性和隐私性。它主要面向需要高效管理和分析数据的企业和开发者,旨在提高数据库操作的效率和便捷性。0280数据分析# AI# 多数据库支持# 开源
easegen-fronteasegen-front 是一个开源的数字人课程制作平台,旨在通过结合最新的前端技术和人工智能,为教育工作者提供一个便捷、高效的课程内容制作和发布工具。该平台前端基于 Vue3 + Element Plus 构建,后端则基于 Spring Boot,支持智能课件制作和文档解析,是 AGI 时代超级个体践行者为 AI 发展做出的贡献。产品的主要优点包括开源、易用性强、技术栈先进,且适合全栈工程师和教育工作者使用。0280学习教育# Element Plus# spring boot# Vue3
SWE-RLSWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。0280代码辅助# 代码生成# 大型语言模型# 开源
SpeechGPT 2.0-previewSpeechGPT 2.0-preview 是一款由复旦大学自然语言处理实验室开发的先进语音交互模型。它通过海量语音数据训练,实现了低延迟、高自然度的语音交互能力。该模型能够模拟多种情感、风格和角色的语音表达,同时支持工具调用、在线搜索和外部知识库访问等功能。其主要优点包括强大的语音风格泛化能力、多角色模拟以及低延迟交互体验。目前该模型仅支持中文语音交互,未来计划扩展到更多语言。0280语音处理# 人工智能# 低延迟# 多情感
PocketFlowPocketFlow是一个极简的LLM框架,仅用100行代码实现,旨在让LLM能够自主编程。它强调高级编程范式,去除低级实现细节,使LLM能专注于重要部分。该框架可作为LLM的学习资源,因其简洁性,易于理解和上手。它采用嵌套有向图的核心抽象,将任务分解为多个LLM步骤,支持分支和递归决策。PocketFlow是开源项目,采用MIT许可证,具有高度的灵活性和可扩展性。0270代码辅助# LLM框架# 开源# 极简代码
DeepSeek-R1-Distill-Qwen-7BDeepSeek-R1-Distill-Qwen-7B 是一个经过强化学习优化的推理模型,基于 Qwen-7B 进行了蒸馏优化。它在数学、代码和推理任务上表现出色,能够生成高质量的推理链和解决方案。该模型通过大规模强化学习和数据蒸馏技术,显著提升了推理能力和效率,适用于需要复杂推理和逻辑分析的场景。0270代码辅助# 代码生成# 开源# 强化学习
茄椒茄椒Aubpe于2019年5月成立,是一家互联网公司,通过技术丰富互联网用户、商户、行业的生活与工作,助力企业、个体户、个人数字化升级。我们的使命是“让技术驱动 工作与生活”。0270交通旅游# html模板大全# itotii导航# 云工具
MegaParseMegaParse是一个强大的文件解析器,专为大型语言模型(LLMs)设计,以确保在解析过程中不丢失任何信息。它支持多种文件格式,包括PDF、PowerPoint、Word文档等,并且是开源的。这个工具的主要优点是速度快、效率高,且能够广泛兼容不同文件类型。MegaParse的背景信息显示,它是由QuivrHQ开发的,并且拥有活跃的社区和贡献者。产品是免费的,并且可以通过GitHub访问其源代码。0260办公助手# llms# PDF解析# 开源
PyTorch官网PyTorch开源机器学习框架,PyTorch是一种基于Python的开源机器学习库,它广泛应用于深度学习领域,支持构建动态计算图的多层神经网络模型,易于使用和调试,大幅提高了开发效率。0260AI开发框架AI编程开发# AI开发框架# 动态计算图# 应用
OpenNN官网它解决了能源、营销、健康等领域的许多实际应用。OpenNN是一款开源的机器学习工具包,拥有强大的算法和易用的界面,是实现机器学习的不二之选。0260AI开发框架AI编程开发# AIGC开发平台# AI应用接口API# AI开发框架
Llama-3.1-Tulu-3-8BLlama-3.1-Tulu-3-8B是Tülu3指令遵循模型家族的一部分,专为多样化任务设计,包括聊天、数学问题解答、GSM8K和IFEval等。这个模型家族以其卓越的性能和完全开源的数据、代码以及现代后训练技术的全面指南而著称。模型主要使用英文,并且是基于allenai/Llama-3.1-Tulu-3-8B-DPO模型微调而来。0260文案写作# 人工智能# 对话系统# 开源
DotomoDotomo是一款旨在帮助用户整理房间的应用程序。通过趣味性的方式提醒用户清理房间,例如将衣物比作叛乱者,灰尘比作文明等,使得整理房间的过程更加有趣和轻松。该应用的主要优点在于其独特的提醒方式和趣味性,能够激发用户的整理动力。产品背景信息显示,Dotomo由Arash Midus开发,目前处于测试阶段,用户可以通过TestFlight获取早期访问权限。价格方面,目前尚未明确,但作为一款趣味应用,预计会以免费或低价格的形式提供给用户。0260趣味游戏# 应用# 开源# 提醒
diagendiagen是一个利用人工智能技术,通过单一命令生成美丽、直观图表的工具。它支持多种图表类型,并能通过视觉反馈和批评自动优化图表。diagen的主要优点包括易用性、支持多种AI模型、自动图表细化以及支持多种图表类型。它背景于数据可视化和人工智能领域,旨在简化图表生成过程,提高效率。diagen是开源的,因此对于个人和企业来说,使用成本较低,适合需要快速生成高质量图表的开发者和数据分析师。0250数据分析# AI# 图表生成# 开源
llm-commitllm-commit 是一个为 LLM(Large Language Model)设计的插件,用于生成 Git 提交信息。该插件通过分析 Git 的暂存区差异,利用 LLM 的语言生成能力,自动生成简洁且有意义的提交信息。它不仅提高了开发者的提交效率,还确保了提交信息的质量和一致性。该插件适用于任何使用 Git 和 LLM 的开发环境,免费开源,易于安装和使用。0250开发者工具# git# LLM# 开发工具
xiaozhi-esp32xiaozhi-esp32 是一个开源的 AI 聊天机器人项目,基于乐鑫的 ESP-IDF 开发。它将大语言模型与硬件设备相结合,使用户能够打造出个性化的 AI 伴侣。项目支持多种语言的语音识别与对话,具备声纹识别功能,能够识别不同用户的语音特征。其开源特性降低了 AI 硬件开发的门槛,为学生、开发者等群体提供了宝贵的学习资源,有助于推动 AI 技术在硬件领域的应用与创新。项目目前免费开源,适合不同层次的开发者进行学习与二次开发。0250智能聊天机器人# AI# esp32# 开源
AgentlessAgentless是一种无需代理的自动解决软件开发问题的方法。它通过定位、修复和补丁验证三个阶段来解决每个问题。Agentless利用分层过程定位故障到特定文件、相关类或函数,以及细粒度的编辑位置。然后,Agentless根据编辑位置采样多个候选补丁,并选择回归测试来运行,生成额外的复现测试以复现原始错误,并使用测试结果重新排名所有剩余补丁,以选择一个提交。Agentless是目前在SWE-bench lite上表现最佳的开源方法,具有82个修复(27.3%的解决率),平均每问题成本0.34美元。0250代码辅助# 代码编辑# 开源# 机器学习
开源精选开源精选(www.ossnav.com)是一款专注于收录优质开源工具的导航网站,开源精选只收集每个软件工具类目中完全免费且超好用的开源软件,来服务于所有网络用户,力求软件简单免费好用,小白也能轻松使用,让所有人都能尽享数字自由!0250综合导航# 免费软件# 开源# 开源精选
automcpautomcp 是一个开源工具,旨在简化将各种现有代理框架(如 CrewAI、LangGraph 等)转换为 MCP 服务器的过程。这使得开发者可以通过标准化接口更容易地访问这些服务器。该工具支持多种代理框架的部署,并且通过易于使用的 CLI 界面进行操作。适合需要快速集成和部署 AI 代理的开发者,价格免费,适合个人和团队使用。0240开发者工具# AI# mcp# 代理框架
Ruyi-Mini-7BRuyi-Mini-7B是由CreateAI团队开发的开源图像到视频生成模型,具有约71亿参数,能够从输入图像生成360p到720p分辨率的视频帧,最长5秒。模型支持不同宽高比,并增强了运动和相机控制功能,提供更大的灵活性和创造力。该模型在Apache 2.0许可下发布,意味着用户可以自由使用和修改。0240图像生成# 人工智能# 图像到视频# 开源
DocWranglerDocWrangler是一个开源的交互式开发环境,旨在简化构建和优化基于大型语言模型(LLM)的数据处理管道的过程。它提供即时反馈、可视化探索工具和AI辅助功能,帮助用户更容易地探索数据、实验不同操作并根据发现优化管道。该产品基于DocETL框架构建,适用于处理非结构化数据,如文本分析、信息提取等。它不仅降低了LLM数据处理的门槛,还提高了工作效率,使用户能够更有效地利用LLM的强大功能。0230开发者工具# LLM# 交互式开发# 开源
audiblezAudiblez是一个利用Kokoro高质量语音合成技术,将普通电子书(.epub格式)转换为.m4b格式有声书的工具。它支持多种语言和声音,用户可以通过简单的命令行操作完成转换,极大地丰富了电子书的阅读体验,尤其适合在开车、运动等不方便阅读的场景下使用。该工具由Claudio Santini在2025年开发,遵循MIT许可证免费开源。0230语音处理# 开源# 有声书# 生产力工具
nanoPerplexityAInanoPerplexityAI是一个开源的实现,它是一个大型语言模型(LLM)服务,引用Google的信息。没有复杂的GUI或LLM代理,只有100行Python代码。0230搜索引擎优化# nanoperplexityai# Perplexity AI# 大型语言模型
Janus-Pro-1BJanus-Pro-1B 是一个创新的多模态模型,专注于统一多模态理解和生成。它通过分离视觉编码路径,解决了传统方法在理解和生成任务中的冲突问题,同时保持了单个统一的 Transformer 架构。这种设计不仅提高了模型的灵活性,还使其在多模态任务中表现出色,甚至超越了特定任务的模型。该模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建,使用 SigLIP-L 作为视觉编码器,支持 384x384 的图像输入,并采用特定的图像生成 tokenizer。其开源性和灵活性使其成为下一代多模态模型的有力候选。0230图像生成# Transformer# 图像生成# 多模态
Sana_600M_1024pxSana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度和强大的文本图像对齐能力,使得在笔记本电脑GPU上也能部署。它是一个基于线性扩散变换器(text-to-image generative model)的模型,拥有1648M参数,专门用于生成1024px基础的多尺度高宽图像。Sana模型的主要优点包括高分辨率图像生成、快速的合成速度以及强大的文本图像对齐能力。Sana模型的背景信息显示,它是基于开源代码开发的,可以在GitHub上找到源代码,同时它也遵循特定的许可证(CC BY-NC-SA 4.0 License)。0220文案写作# Nvidia# 图像合成# 开源
DeepCoderDeepCoder-14B-Preview 是一个基于强化学习的代码推理大型语言模型,能够处理长上下文,具有 60.6% 的通过率,适用于编程任务和自动化代码生成。该模型的优势在于其训练方法的创新,提供了比其他模型更优的性能,且完全开源,支持广泛的社区应用和研究。0210代码辅助# AI# 开源# 强化学习
AI 视频图文创作助手AI 视频图文创作助手是一个开源工具,旨在将视频和音频内容转化为多种格式的文档,帮助用户进行二次阅读和思考。该产品的主要优势在于其完全开源、无需注册,用户可以在本地处理音视频文件,降低了使用成本。它非常适合需要将视听内容转化为文本的学生、研究人员和内容创作者。0210视频创作# AI 助手# 开源# 文档生成
PusaPusa 通过帧级噪声控制引入视频扩散建模的创新方法,能够实现高质量的视频生成,适用于多种视频生成任务(文本到视频、图像到视频等)。该模型以其卓越的运动保真度和高效的训练过程,提供了一个开源的解决方案,方便用户进行视频生成任务。0210图像生成# 图像处理# 开源# 机器学习
Neural MagicNeural Magic是一家专注于AI模型优化和部署的公司,提供领先的企业级推理解决方案,以最大化性能和提高硬件效率。公司的产品支持在GPU和CPU基础设施上运行领先的开源大型语言模型(LLMs),帮助企业在云、私有数据中心或边缘环境中安全、高效地部署AI模型。Neural Magic的产品背景信息强调了其在机器学习模型优化方面的专业知识,以及与科研机构合作开发的创新LLM压缩技术,如GPTQ和SparseGPT。产品价格和定位方面,Neural Magic提供了免费试用和付费服务,旨在帮助企业降低成本、提高效率,并保持数据隐私和安全。0200生产力# AI# 企业级推理# 开源
IMMInductive Moment Matching (IMM) 是一种先进的生成模型技术,主要用于高质量图像生成。该技术通过创新的归纳矩匹配方法,显著提高了生成图像的质量和多样性。其主要优点包括高效性、灵活性以及对复杂数据分布的强大建模能力。IMM 由 Luma AI 和斯坦福大学的研究团队开发,旨在推动生成模型领域的发展,为图像生成、数据增强和创意设计等应用提供强大的技术支持。该项目开源了代码和预训练模型,方便研究人员和开发者快速上手和应用。0170图像生成# 人工智能# 图像生成# 开源
Skywork-o1-Open-PRM-Qwen-2.5-1.5BSkywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork团队开发的一系列模型,这些模型结合了o1风格的慢思考和推理能力。该模型专门设计用于通过增量过程奖励增强推理能力,适合解决小规模的复杂问题。与简单的OpenAI o1模型复现不同,Skywork o1 Open系列模型不仅在输出中展现出固有的思考、规划和反思能力,而且在标准基准测试中的推理技能有显著提升。这一系列代表了AI能力的一次战略性进步,将原本较弱的基础模型推向了推理任务的最新技术(SOTA)。0170代码辅助# AI推理# Hugging Face# 代码评估
Baidu PaddlePaddle飞桨PaddlePaddle是一个开源的深度学习平台,支持动态图和静态图,具备超大规模并行深度学习能力,提供一体化的推理引擎和系统化的技术服务和支持。0140商业AI生产效率# 开源# 深度学习平台
Alpaca羊驼(斯坦福最新模型)这是一个名为斯坦福CRFM的网站,其中有一篇关于开源指令跟随模型Alpaca的博客文章。该模型由研究人员开发,可以从LLaMA 7B模型的52000个指令跟随演示中进行微调。此外,该项目还有一个Github存储库,其中包含用于微调模型和生成数据的代码和数据。0140AI开发与编程# Alpaca# Github存储库# LLaMA 7B