智东西4月25日消息,据TechCrunch报道,OpenAI计划今年夏天开源一款全新的大语言模型,可供免费下载,并采用高度宽松的许可协议,几乎不限制使用或商业化。这将是该公司自GPT-2以来首款真正的开源模型。
该模型开发工作由OpenAI研究副总裁艾丹·克拉克(Aidan Clark)主导,尚处于早期研发阶段,其目标是打造一款类似于之前o系列模型的推理模型,并希望其性能超越Meta和DeepSeek的现有开源模型。
OpenAI在推进模型开源的过程中,面临着诸多竞争对手的压力。数据显示,Meta的Llama系列下载量截至今年3月已超过10亿次;DeepSeek的日活跃用户数量于今年2月突破2000万,已达到ChatGPT日活跃用户数的41.6%。
OpenAI创始人兼CEO萨姆·阿尔特曼(Sam Altman)此前曾表示,OpenAI在开源技术方面可能“站在了历史的错误一边”。此次计划发布开源模型,可以说是OpenAI在发展战略上的重大转变。
除了要在基准测试中表现出色,OpenAI这次还藏着一个杀手锏——把开源模型连接到OpenAI的云端模型(cloud-hosted model)上,当开源模型遇到难以处理的复杂问题时,就能调用OpenAI的云端大模型协助完成任务。阿尔特曼将这种功能称为“接力(handoff)”。
通过“云端接力”,开源模型的计算能力实现显著提升。目前还不清楚开源模型是否可以使用OpenAI模型的其他工具,比如网络搜索和图像生成功能。
据消息人士称,“接力”功能的想法由一位开发人员在OpenAI举办的开发者论坛上提出,OpenAI近期一直在收集开发人员社区的反馈意见,以完善其即将发布的开源模型。
OpenAI这一新功能不禁让人联想到苹果智能(Apple Intelligence)。这是苹果公司一系列AI技术和功能的统称,它整合了设备端模型和私有云数据中心的运行模型,可以在用户使用本地模型时,灵活配置和扩充计算资源,调用私有云端模型处理任务。
OpenAI计划推出这项“接力”功能,除了增加收入外,还可以将更多开源社区成员吸引到公司的优质生态系统中来。
目前,关于OpenAI开源模型的“接力”功能如何运作仍有许多未知之处,包括定价和速率限制等。该模型尚处于早期研发阶段,一些功能可能会发生变化,甚至无法实现。
消息人士透露,OpenAI正从零开始训练一个新模型,而非基于现有模型进行改造,预计开放模型的性能会低于OpenAI的o3,但在某些基准测试中会优于DeepSeek的R1推理模型。
就在本周,OpenAI宣布为所有用户开放深度研究(Deep Research)工具的全新“轻量级”版本,它由OpenAI的o4-mini模型提供支持,保留了完整版深度研究的多步骤推理、实时网页浏览、文档解析等核心功能,但响应速度更快、成本更低。
此前,该功能仅对Pro用户开放,它能帮助用户获得多步骤深度分析和结构化报告。如今,免费用户每月可体验5次轻量版深度研究工具,Plus和Team用户每月可以使用25次(含完整版和轻量版),Pro用户则多达每月250次。
OpenAI在X的一系列帖子中表示,轻量版深度搜索回复通常会更短,同时保持用户所期望的深度和质量。一旦达到完整版深度研究的使用次数限制,查询就会自动默认使用轻量版。
OpenAI在社交媒体X上发帖介绍深度研究“轻量版”性能
最近,聊天机器人领域涌现出大量深度研究工具,包括谷歌的Gemini、微软的Copilot和xAI的Grok,这些AI推理模型拥有思考问题和自我核实事实的能力,深受专业人士喜爱。
无论是推出全新开源语言模型,还是让所有用户免费体验轻量版深度研究,都体现了OpenAI在产品策略上的调整与革新。
前者是OpenAI在技术开源战略上的重大转变,后者是在应用服务层面进行优化。两者共同服务于OpenAI拓展用户群体、增强市场竞争力、完善AI生态布局的目标。
从开源模型的开发布局到深度研究工具的普惠升级,OpenAI一系列动作究竟能否助其稳固AI领域的头部地位,还有待观察。
来源:TechCrunch
本文来自微信公众号 “智东西”(ID:zhidxcom),作者:陈家阳,36氪经授权发布。