语言模型

共 16 篇网址

排序

发布更新浏览点赞

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

该产品是一个基于Qwen2.5-32B的4位量化语言模型，通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时，显著降低了模型的存储和计算需求，适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景，如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。

0330

代码辅助 # 内容创作 # 多语言 # 开源

INTELLECT-1 Chat

INTELLECT-1 Chat是一个由全球合作训练的10B参数语言模型驱动的聊天工具。它代表了人工智能领域中大规模语言模型的最新进展，通过分散式训练，提高了模型的多样性和适应性。这种技术的主要优点包括能够理解和生成自然语言，提供流畅的对话体验，并且能够处理大量的语言数据。产品背景信息显示，这是一个首次展示分散式训练可能性的演示，易于使用且富有趣味性。价格方面，页面提供了登录以保存和重访聊天的功能，暗示了可能的付费或会员服务模式。

0320

智能聊天机器人 # 人工智能 # 全球合作 # 分散式训练

LLMWare

LLMWare.ai是一个为金融、法律、合规和监管密集型行业设计的AI工具，专注于私有云中的小型专业化语言模型和专为SLMs设计的AI框架。它提供了一个集成的、高质量的、组织良好的框架，用于开发AI代理工作流、检索增强生成（RAG）和其他用例的LLM应用程序，包括许多核心对象，以便开发者可以立即开始。

0310

金融 # AI # 企业 # 合规

Llama 3.1 Nemotron Ultra 253B

Llama-3.1-Nemotron-Ultra-253B-v1 是一个基于 Llama-3.1-405B-Instruct 的大型语言模型，经过多阶段的后训练以提升推理和聊天能力。该模型支持高达 128K 的上下文长度，具备较好的准确性和效率平衡，适用于商业用途，旨在为开发者提供强大的 AI 助手功能。

0280

开发者工具 # AI # 开发工具 # 推理

OLMo-2-1124-13B-DPO

OLMo-2-1124-13B-DPO是经过监督微调和DPO训练的13B参数大型语言模型，主要针对英文，旨在提供在聊天、数学、GSM8K和IFEval等多种任务上的卓越性能。该模型是OLMo系列的一部分，旨在推动语言模型的科学研究。模型训练基于Dolma数据集，并公开代码、检查点、日志和训练细节。

0270

文案写作 # 人工智能 # 文本生成 # 机器学习

DeepSeek Japanese

DeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型，专注于开源模型和创新训练方法。其 R1 系列模型在逻辑推理和问题解决方面表现出色，采用强化学习和混合专家框架优化性能，以低成本实现高效训练。DeepSeek 的开源策略推动了社区创新，同时引发了关于 AI 竞争和开源模型影响力的行业讨论。其免费且无需注册的使用方式进一步降低了用户门槛，适合广泛的应用场景。

0260

代码辅助 # AI # 多模态 # 开源

HuatuoGPT-o1-7B

HuatuoGPT-o1-7B是由FreedomIntelligence开发的医疗领域大型语言模型（LLM），专为高级医疗推理设计。该模型在提供最终回答之前，会生成复杂的思考过程，反映并完善其推理。HuatuoGPT-o1-7B支持中英文，能够处理复杂的医疗问题，并以'思考-回答'的格式输出结果，这对于提高医疗决策的透明度和可靠性至关重要。该模型基于Qwen2.5-7B，经过特殊训练以适应医疗领域的需求。

0260

文案写作 # 中英文支持 # 医疗 # 推理

Llama3-Aloe-8B-Alpha

Aloe是由HPAI开发的一款医疗领域的语言模型，基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略，达到了与其规模相匹配的最先进水平。Aloe在好好看的和事实性指标上得分较高，这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估，以促进这些系统的安全使用和部署。

0250

医疗健康 # 事实性 # 伦理 # 医疗

Scribble AI

Scribble AI是一款可以在App Store上下载的文本生成器应用程序，使用OpenAI的GPT-3语言模型自动生成文本。

0240

AI写作与文本 # App store # GPT-3 # ipad

Google GLaM

GLaM是一种高效的语言模型，通过混合专家的方法，实现了在训练和使用过程中的高效性，具有多任务学习的能力。

0230

商业AI 生产效率 # 深度学习 # 语言模型

Eurus-2-7B-PRIME

PRIME-RL/Eurus-2-7B-PRIME是一个基于PRIME方法训练的7B参数的语言模型，旨在通过在线强化学习提升语言模型的推理能力。该模型从Eurus-2-7B-SFT开始训练，利用Eurus-2-RL-Data数据集进行强化学习。PRIME方法通过隐式奖励机制，使模型在生成过程中更加注重推理过程，而不仅仅是结果。该模型在多项推理基准测试中表现出色，相较于其SFT版本平均提升了16.7%。其主要优点包括高效的推理能力提升、较低的数据和模型资源需求，以及在数学和编程任务中的优异表现。该模型适用于需要复杂推理能力的场景，如编程问题解答和数学问题求解。

0220

文案写作 # 强化学习 # 推理能力 # 数学

SayCan by Google

SayCan是一种将语言模型与机器人操作相结合的方法，通过预训练的行为将语言模型与机器人的能力和环境联系起来，实现基于自然语言的复杂任务执行。

0220

商业AI 生产效率 # 机器人操作 # 语言模型

Flush AI

Flush AI是一款全面的AI艺术工作室，提供云端一站式解决方案，集成了各种AI图像模型和语言模型，帮助创作者们实现无限的创作可能性。

0210

AI绘画生成器图像AI # Model as a Service # 语言模型

InstructGPT

InstructGPT是一种强大的语言模型，经过训练后能够更好地遵循用户的指令，提供准确、真实和无毒的回答。它可以应用于在线客服、内容生成和语言理解研究等多个领域。

0180

商业AI 生产效率 # AI技术 # 语言模型

ChatGPT Everywhere

ChatGPT for Gmail and Google是一款Chrome浏览器扩展，可以在Google搜索和Gmail中使用ChatGPT智能助手，帮助用户获取准确、全面的答案和信息，提高工作效率。

0160

写作助手文本AI # 免费 # 智能助手 # 语言模型

Peach-9B-8k-Roleplay

Peach-9B-8k-Roleplay是一个经过微调的大型语言模型，专门用于角色扮演对话。它基于01-ai/Yi-1.5-9B模型，通过数据合成方法在超过100K的对话上进行训练。尽管模型参数较小，但可能在34B以下参数的语言模型中表现最佳。

0160

智能聊天机器人 # 对话生成 # 角色扮演 # 语言模型