热门

s1-32B

11个月前发布 30 00

s1是一个推理模型，专注于通过少量样本实现高效的文本生成能力。它通过预算强制技术在测试时进行扩展，能够匹配o1-preview的性能。该模型由Niklas Muennighoff等人开发，相关研究发表在arXiv上。模型使用Safetensors技术，具有328亿参数，支持文本生成任务。其主要优点是能够通过少量样本实现高质量的推理，适合需...

收录时间：

2025-05-29

打开网站手机查看

文案写作 # 开源 # 推理模型 # 文本生成 # 自然语言处理 # 高效学习

s1-32B

s1-32B

s1是一个推理模型，专注于通过少量样本实现高效的文本生成能力。它通过预算强制技术在测试时进行扩展，能够匹配o1-preview的性能。该模型由Niklas Muennighoff等人开发，相关研究发表在arXiv上。模型使用Safetensors技术，具有328亿参数，支持文本生成任务。其主要优点是能够通过少量样本实现高质量的推理，适合需要高效文本生成的场景。

数据统计

相关导航

llmstxt-generator

llmstxt-generator 是一个用于生成LLM（大型语言模型）训练和推理所需的网站内容整合文本文件的工具。它通过爬取网站内容，将其合并成一个文本文件，支持生成标准的llms.txt和完整的llms-full.txt版本。该工具由firecrawl_dev提供支持进行网页爬取，并使用GPT-4-mini进行文本处理。其主要优点包括无需API密钥即可使用基本功能，同时提供Web界面和API访问，方便用户快速生成所需的文本文件。

EXAONE-3.5-2.4B-Instruct

EXAONE-3.5-2.4B-Instruct是LG AI Research开发的一系列双语（英语和韩语）指令调优的生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的通用领域中保持竞争力。该模型特别适合需要处理长文本和多语言需求的场景，如自动翻译、文本摘要、对话系统等。

EXAONE-3.5-32B-Instruct-AWQ

EXAONE-3.5-32B-Instruct-AWQ是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理，在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比，在通用领域保持竞争力。该模型通过AWQ量化技术，实现了4位组级别的权重量化，优化了模型的部署效率。

Llama-3.1-Tulu-3-70B

Llama-3.1-Tulu-3-70B是Tülu3模型家族中的一员，专为现代后训练技术提供全面的指南。该模型不仅在聊天任务上表现出色，还在MATH、GSM8K和IFEval等多种任务上展现出了卓越的性能。作为一个开源模型，它允许研究人员和开发者访问和使用其数据和代码，以推动自然语言处理技术的发展。

EXAONE-3.5-7.8B-Instruct-GGUF

EXAONE 3.5是LG AI Research开发的一系列双语（英语和韩语）指令调优的生成模型，参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理，在真实世界用例和长上下文理解方面展现出了最先进的性能，同时在与近期发布的类似大小模型相比，在通用领域保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于部署在小型或资源受限的设备上；2) 7.8B模型，与前代模型大小匹配但提供改进的性能；3) 32B模型，提供强大的性能。

Orpheus TTS

Orpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统，旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力，适合各种实时应用场景。该产品是免费的，旨在为开发者和研究者提供便捷的语音合成工具。

OLMo-2-1124-13B-DPO

OLMo-2-1124-13B-DPO是经过监督微调和DPO训练的13B参数大型语言模型，主要针对英文，旨在提供在聊天、数学、GSM8K和IFEval等多种任务上的卓越性能。该模型是OLMo系列的一部分，旨在推动语言模型的科学研究。模型训练基于Dolma数据集，并公开代码、检查点、日志和训练细节。

ultravox-v0_4_1-llama-3_1-70b

fixie-ai/ultravox-v0_4_1-llama-3_1-70b是一个基于预训练的Llama3.1-70B-Instruct和whisper-large-v3-turbo的大型语言模型，能够处理语音和文本输入，生成文本输出。该模型通过特殊伪标记<|audio|>将输入音频转换为嵌入，并与文本提示合并后生成输出文本。Ultravox的开发旨在扩展语音识别和文本生成的应用场景，如语音代理、语音到语音翻译和口语音频分析等。该模型遵循MIT许可，由Fixie.ai开发。

暂无评论

您必须登录才能参与评论！

none

暂无评论...