解密 OpenAI o1:那些不为人知的幕后细节
上方蓝字关注我们
在今天与 OpenAI o1 团队的 AMA(Ask Me Anything) 活动中,我们了解到了以下几点,有网友进行了整理,翻译如下:
模型名称与推理模式
- OpenAI o1 的命名代表了 AI 能力的新高度,计数器重置为 1,数字“1”象征着新的起点
- “预览版”表示这是该模型的初期版本
- “Mini” 则代表 o1 的精简版,优化了运行速度
- o - 代表 OpenAI
- o1 并非一个完整的“系统”,而是一个经过训练,能够在得出最终答案前生成多重思维链的模型
- o1 的图标寓意为一个拥有超凡能力的外星人形象
o1 模型的大小与性能
- o1-mini 比 o1-preview 更小、更快,未来会向免费用户提供
- o1-preview 是 o1 的早期版本,大小并没有区别
- o1-mini 在科学、技术、工程、数学(STEM)任务中表现突出,但世界知识储备有限
- 在某些任务上(尤其是与编程相关的任务),o1-mini 的表现优于 o1-preview
- o1 的输入 token 是通过与 GPT-4o 相同的 tokenizer 进行计算
- 与 o1-preview 相比,o1-mini 能够探索更多的思维链
输入 Token 上下文与模型能力
- 更大的输入上下文即将在 o1 模型中提供
- 与 GPT-4o 不同,o1 能够处理更长、更开放式的任务,不需要过多分块处理输入内容
- o1 能够在提供答案之前生成更长的思维链,具备更强的推理能力
- 目前尚不能在 CoT(思维链)推理过程中暂停以添加更多的上下文内容,但这一功能将在未来的模型中探索
工具支持、功能和即将推出的特性
- 目前 o1-preview 还没有使用工具,但未来计划支持功能调用、代码解释器以及浏览功能
- 工具支持、结构化输出和系统提示将会在未来的更新中添加
- 未来版本中,用户有望能够控制模型的思维时间和 token 限制
- 正在计划为 API 添加流式传输和推理进展显示功能
- o1 拥有多模态能力,能够在诸如 MMMU 等任务中达到最先进的性能表现
思维链推理
- o1 在推理过程中生成隐形的思维链条
- 暂无计划向 API 用户或 ChatGPT 公布这些 CoT token
- CoT token 会被总结,但无法完全确保其忠实于实际推理过程
- 提示中的指令可以影响模型的思维方式
- o1 使用强化学习 (RL) 提高 CoT 推理表现,GPT-4o 通过提示无法达到 o1 的 CoT 水准
- 虽然思维链生成看起来更慢,但由于它总结了推理过程,生成答案的速度实际上更快
API 与使用限制
- o1-mini 对 ChatGPT Plus 用户每周有 50 次提示的限制
- 在 ChatGPT 中,所有提示的计数方式相同
- 更多的 API 访问级别和更高的使用限额将逐步推出
- 提示缓存功能是 API 中的热门请求,但尚无时间表
定价、微调与扩展
- o1 模型的定价预计将继续遵循每 1-2 年价格下调的趋势
- 批量 API 定价将在速率限制提升后提供
- 微调功能正在规划中,但尚无明确的时间表
- o1 的扩展受限于研究和工程人才
- 推理计算的新扩展范式将在未来的模型中带来显著的性能提升
- 逆向扩展目前尚不显著,但在个性化写作任务中,o1-preview 表现只略好于 GPT-4o(有时甚至略逊)
模型开发与研究见解
- o1 通过强化学习进行训练,以提升推理能力
- 该模型展现了在 lateral 任务(如诗歌创作)中的创造性思维和强大表现
- o1 在处理哲学推理以及广义推理能力(如破译密码)上表现令人印象深刻
- 研究人员使用 o1 创建了一个 GitHub 机器人,它能正确指派 CODEOWNERS 进行代码审核
- 在内部测试中,o1 自测了困难问题以评估其能力
- 更广泛的世界领域知识正在添加,未来的版本将会进一步改善
- o1-mini 未来的版本将会更新至 2023 年 10 月的数据
提示技术与最佳实践
- o1 的提示受益于包含边缘案例或推理方式的提示风格
- 与早期模型相比,o1 对提示中的推理提示更为敏感
- 在检索增强生成 (RAG) 中提供相关上下文能提升模型性能,而无关信息会削弱推理
用户反馈与未来改进
- 由于处于早期测试阶段,o1-preview 的使用限制较低,但未来会逐步增加
- 延迟与推理时间的改进正在进行中
o1 模型的显著能力
- o1 能够处理诸如“生命是什么?”等哲学问题
- 研究人员发现 o1 能够处理复杂任务,并从有限的指令中进行广泛的推理
- o1 的创造性推理能力令人印象深刻,如它自测能力以评估问题解决技能
OpenAI 发布自 GPT-4 以来最重磅的更新,性能达到博士级
已有超过2000名
读者加入交流群
我们还在等你
点这里关注我,记得标星哦~
CLICK TO SEE YOU LOOK THE BEST
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
网址:解密 OpenAI o1:那些不为人知的幕后细节 https://m.mxgxt.com/news/view/1446679
相关内容
【人工智能】OpenAI o1 竞争对手 S1 AI 模型的训练费用不到 50 美元,那么 S1 AI 模型是什么?73. AGI范式大转移:和广密预言草莓、OpenAI o1和self
刚刚,DeepSeek揭秘R1官方同款部署设置,温度=0.6!OpenAI推理指南同时上线
OpenAI“12天狂欢”!每日一款新品,AI领域掀起创新风暴
设计师的幕后故事:你不知道的那些细节
你想知道,电影幕后那些不为人知的秘密吗?
揭秘影视剧幕后的真实故事:那些你所不知道的细节
21深度丨OpenAI内忧外患中的自我救赎
OpenAI突发超级AI?和两家竞争对手的动态一起看看吧!
《娱乐圈大揭秘:那些不为人知的幕后故事》