【人工智能】OpenAI o1 竞争对手 S1 AI 模型的训练费用不到 50 美元，那么 S1 AI 模型是什么？

发布时间：2025-05-16 23:06

今年 1 月，中国人工智能初创公司 DeepSeek 以其成本效益高、最先进的人工智能模型引发了一场革命。该公司推出了两款模型 DeepSeek-V3 和 DeepSeek-V1，其性能可与 OpenAI 和谷歌的前沿模型相媲美，而且成本仅为大型科技公司所用模型的一小部分。

DeepSeek 为人工智能领域更审慎的创新铺平了道路。现在，一种新模型引发了人工智能界的好奇心。斯坦福大学和华盛顿大学的研究人员以微薄的 50 美元（约 4,400 卢比）云计算积分训练了一个名为 S1 的推理模型。

S1 是什么？

根据研究论文，S1-32B 模型是一个开源高级语言模型，专注于推理任务。它与其他 AI 模型的不同之处在于其“测试时间扩展”技术，该技术允许它在测试期间动态使用额外的计算资源来迭代其响应。据报道，S1 直接与 OpenAI 的 o1 推理模型竞争，因为它通过思考相关问题来生成提示的答案，这也使它能够检查自己的回答。这种方法不同于仅依赖于事先训练大型语言模型的传统方法。

例如，如果你让模型解释用Android平板电脑取代 iPhone 的成本是多少，它会将问题分解为几个步骤，其中可能包括检查目前有多少人使用 iPhone 以及制造 Android 平板电脑的成本是多少。

它是如何训练的？

S1 模型通过精心挑选的高质量数据集 S1K 进行训练，该数据集包含 1,000 个精心挑选的问题。这些问题是根据其难度、多样性和质量选择的。该数据集还包括数学、推理和科学方面的复杂问题。该模型开发的另一个关键方面是在这个小数据集上进行监督微调 (SFT)。根据研究论文，SFT 只需要在 16 个 NVIDIA H100 GPU 上进行 26 分钟的训练。尽管数据集很小，但由于使用了嵌入在预训练基础模型 Qwen2.5-32B-Instruct 中的知识，S1 实现了较高的推理精度。

S1 还基于现成的语言模型，该模型通过研究Google的Gemini 2.0 Flash Thinking Experimental 中的问题和答案进行推理训练。Google 模型展示了每个回答过程背后的思维，这使得 S1 的开发人员能够为他们的模型提供较少的训练数据——1000 个精心挑选的带答案的问题。他们本质上是教 S1 模型模仿 Gemini 的思维过程。

在性能方面，S1 已在三个推理基准（AIME24、MATH500 和 GPQA Diamond）上进行了评估。在测试中，该模型的准确性显着提高，并且优于 OpenAI 的闭源模型 O1 Preview。S1 模型在数学竞赛问题上的性能提升高达 27%。虽然早期的模型需要强化学习和大量数据集，但 S1-32B 表明仅使用 1,000 个样本进行有效训练就可以建立竞争性推理模型。

这对人工智能意味着什么？

S1 模型表明了透明度和开源贡献在人工智能开发中的重要性。随着 s1 的开发过程公开，研究人员希望在这一领域开展更多合作和创新。研究人员还表明需要克服测试时间扩展的限制，这表明需要探索替代的预算强制方法并应用强化学习技术来进一步增强推理能力。

简而言之，S1 是一个突破性的模型，它集高效的训练、创新的测试时间扩展和开源原则于一体。

免责声明：

本文所发布的内容和图片旨在传播行业信息，版权归原作者所有，非商业用途。如有侵权，请与我们联系。所有信息仅供参考和分享，不构成任何投资建议。投资者应基于自身判断和谨慎评估做出决策。投资有风险，入市需谨慎。

关注我们，一起探索AWM！

2025-02-01

2025-02-06

2024-12-14

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

网址：【人工智能】OpenAI o1 竞争对手 S1 AI 模型的训练费用不到 50 美元，那么 S1 AI 模型是什么？ https://m.mxgxt.com/news/view/1235135

⬅️上一篇：大众汽车向特斯拉竞争对手Rivi

➡️下一篇：德国总理：德国车企不应惧怕中国竞

【人工智能】OpenAI o1 竞争对手 S1 AI 模型的训练费用不到 50 美元，那么 S1 AI 模型是什么？

相关内容

随便看看

最新实时动态

热点实时动态

专题

推荐实时动态