本站全国人工客服维修电话:400--117--9882(温馨提示:点击屏幕下方↓↓↓可直接拨打)
DeepSeek“轰炸”数日,OpenAI终于出手。
当地时间1月31日,人工智能(AI)巨头OpenAI正式发布推理模型o3-mini,支持low、medium和high低中高三种推理难度。
目前ChatGPT Plus、团队和Pro用户可以直接使用o3-mini,企业用户将于2月推出。所有付费用户可以在模型中选择o3-mini-high,以获得生成回复时间稍长的高智能版本。专业用户可以无限制使用o3-mini和o3-mini-high。
同时,免费用户也可以通过勾选 “推理”来使用o3-mini,这也是ChatGPT首次向免费用户提供推理模型。
ChatGPT免费用户也支持推理模型的使用。
作为此次升级的一部分,OpenAI把Plus和团队用户的速率限制,从o1-mini的每天50条信息提高到o3-mini的每天150 条信息。此外,o3-mini还能通过搜索功能查找最新答案,并提供相关的网络链接。OpenAI表示,这是公司在推理模型中整合搜索功能的早期原型。
OpenAI表示o3-mini是公司推理系列中最新、最具成本效益的模型,旨在推动高性价比推理的发展。
与o1类似,o3-mini针对STEM(科学、技术、工程、数学)推理进行了优化。o3-mini-medium的能力在数学、编码和科学方面与o1表现相当,响应速度更快。专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。测试人员在56%的时间里更喜欢o3-mini的回答,并观察到在困难的现实问题上重大错误减少了39%。o3-mini-medium在一些最具挑战性的推理和智力评估(包括AIME竞赛数学和GPQA博士水平的专家推理)上的表现与o1相当。同时,o3-mini的响应速度比o1-mini快24%,平均响应时间为7.7秒,而o1-mini为10.16秒。
不过o3-mini暂不支持视觉功能,开发者需要继续使用 o1进行视觉推理任务。
o3-mini与o1在AIME竞赛数学的得分对比。
模型发布后,OpenAI的核心团队也密集回答了网友的问题。
对于DeepSeek,OpenAI CEO山姆·奥特曼(Sam Altman)称:“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将不会像前几年那么大了。”
在另一个问答中,奥特曼表示,在开源权重模型和研究成果这个问题上,“我个人认为,我们已经站在了历史的错误一边,需要制定不同的开源策略。OpenAI并非所有人都认同这一观点,这也不是我们当前最首要的事项。”
山姆·奥特曼回答网友提问。
当被问及递归自我改进是一个渐进的过程还是一个艰难的起飞过程时,奥特曼表示个人认为快速起飞比几年前想的更有可能。
值得注意的是,此次新发布的o3-mini也展示了回答提问是的思考逻辑。对于思维链展示,有网友询问是否后续是否能看到模型思考的所有token,奥特曼表示很快就会展示一个更有用、更详细的版本,并感谢R1提供的最新信息。
有网友问及o3 mini价格与DeepSeek和Gemini相比仍然没有竞争力时,OpenAI API研究主管米歇尔·波克拉斯(Michelle Pokrass)的回答是:“o3-mini与美国托管的 DeepSeek版本相比具有竞争力。我们认为对于这种级别的智能来说,这是一个真正实惠的选择。”
此外,奥特曼还表示将会在推理模型中增加文件附件功能,同时,随着时间的推移,会考虑减少Plus会员价格的提高。
根据此前发布会上的表述,o3将会在mini正式发布后上线。那么究竟满血版o3何时上线?奥特曼依旧没有给出具体时间,只是称“我猜会是几周以上,几个月以下”。
此前,据外媒报道,OpenAI正以3000亿美元的估值寻求新一轮400亿美元的融资。本轮融资由软银领投,软银计划最多向OpenAI投资250亿美元。这一融资规模将打破OpenAI上一轮创下的硅谷单轮融资纪录,而公司的估值相较于上一轮的1500亿美元足足翻了一倍。
当地时间2月1日,奥特曼在o3-mini正式发布的消息下面跟帖表示:“很多人更喜欢这个而不是o1,而且它只是mini版本的模型。”