热门

Huginn-0125

1年前发布 38 00

Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数，经过8000亿个token的训练，在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量，能够根据任务需求灵活增加或减少计算步骤，从而在保持性能的同时优化资源利用。该模型基于开源的Hug...

收录时间：

2025-05-29

代码辅助 # 人工智能 # 代码生成 # 开源 # 推理 # 深度学习 # 高效计算

Huginn-0125

Huginn-0125

Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数，经过8000亿个token的训练，在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量，能够根据任务需求灵活增加或减少计算步骤，从而在保持性能的同时优化资源利用。该模型基于开源的Hugging Face平台发布，支持社区共享和协作，用户可以自由下载、使用和进一步开发。其开源性和灵活的架构使其成为研究和开发中的重要工具，尤其是在资源受限或需要高性能推理的场景中。

一丢导航 - 上一丢，不易丢

数据统计

相关导航

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8是Qwen2.5-Coder系列中的一种大型语言模型，专门针对代码生成、代码推理和代码修复进行了优化。该模型基于Qwen2.5，训练数据包括源代码、文本代码关联、合成数据等，达到5.5万亿个训练令牌。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。该模型还为现实世界中的应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork团队开发的一系列模型，这些模型结合了o1风格的慢思考和推理能力。该模型专门设计用于通过增量过程奖励增强推理能力，适合解决小规模的复杂问题。与简单的OpenAI o1模型复现不同，Skywork o1 Open系列模型不仅在输出中展现出固有的思考、规划和反思能力，而且在标准基准测试中的推理技能有显著提升。这一系列代表了AI能力的一次战略性进步，将原本较弱的基础模型推向了推理任务的最新技术（SOTA）。

Qwen2.5-Coder-3B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码接地、合成数据等，显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型，拥有3.09B参数，36层，16个注意力头（Q）和2个注意力头（KV），全32,768令牌上下文长度。该模型是目前开源代码LLM中的佼佼者，编码能力与GPT-4o相匹配，为开发者提供了一个强大的代码辅助工具。

Momodel.cn

Mo是一个专注于 AI 技术学习和应用的平台，旨在为用户提供从基础到高级的系统学习资源，帮助各类学习者掌握 AI 技能，并将其应用于实际项目中。无论你是大学生、职场新人，还是想提升自己技能的行业专家，Mo都能为你提供量身定制的课程、实战项目和工具，带你深入理解和应用人工智能。

Qwen2.5-Coder-1.5B

Qwen2.5-Coder-1.5B是Qwen2.5-Coder系列中的一款大型语言模型，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型通过扩展训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，成为当前开源代码LLM中的佼佼者，编码能力媲美GPT-4o。此外，Qwen2.5-Coder-1.5B还强化了数学和通用能力，为实际应用如代码代理提供了更全面的基础。

PocketFlow

PocketFlow是一个极简的LLM框架，仅用100行代码实现，旨在让LLM能够自主编程。它强调高级编程范式，去除低级实现细节，使LLM能专注于重要部分。该框架可作为LLM的学习资源，因其简洁性，易于理解和上手。它采用嵌套有向图的核心抽象，将任务分解为多个LLM步骤，支持分支和递归决策。PocketFlow是开源项目，采用MIT许可证，具有高度的灵活性和可扩展性。

gait

gait是一个AI原生版本控制工具，它通过存储提示、上下文和代码的结合，帮助团队更容易理解和编辑AI生成的代码。gait自动保存AI代码生成对话，并通过版本控制与团队共享开发上下文。它支持GitHub Copilot和Cursor，并且提供了包括AI Blame、Codegen Analytics和Team Collaboration在内的多种功能。gait旨在通过AI技术提高开发人员的生产力，同时确保代码的版权和知识产权得到保护。

ChatTS-14B

ChatTS-14B 是一个专注于时间序列理解与推理的语言模型，旨在通过合成数据提高对时间序列数据的处理能力。该模型可以广泛应用于数据分析、金融预测等领域，为用户提供更深层次的时间序列洞察，具有良好的推理能力和准确性。

暂无评论

您必须登录才能参与评论！

none

暂无评论...