OpenAI又开卷!GPT-4o mini免费上线,更快、更便宜,大模型的“价格屠夫”?

最能打的多模态小模型

美东时间周四,OpenAI 宣布推出其迄今为止最强大的迷你版模型——GPT-4o mini。

OpenAI称,GPT-4o mini 具备文本、图像、音频、视频的多模态推理能力是目前最强的多模态小模型之一。

性能比GPT-4更好。GPT-4o mini 在 MMLU 上的得分为 82%,目前在LMSYS 排行榜上的聊天偏好方面优于 GPT-4 。

API降价60%。GPT-4o mini 的商用价格是每百万输入 token 15 美分,每百万输出 token 60 美分比之前的 Frontier 型号便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。

对此,OpenAI CEO 山姆・奥特曼表示,通往智能的成本已经too cheap to meter

网友也戏称,GPT-4o mini妥妥的大模型“价格屠夫”。


最能打的多模态小模型?


据OpenAI称,GPT-4o mini的数学、编码、视觉等推理能力非常好,是目前最强、最具成本效益的多模态小模型。

目前,GPT-4o mini 在 API 中支持文本和视觉,未来还将支持文本、图像、视频和音频的输入和输出。

该模型具有 128K 个 token 的上下文窗口,每个请求最多支持 16K 个输出 token,并且拥有截至 2023 年 10 月的知识。

OpenAI还表示,GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,并且支持的语言范围与 GPT-4o 相同。

它还在函数调用方面表现出色,这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序,并且与 GPT-3.5 Turbo 相比,它的长上下文性能有所提高。

测试数据显示,推理任务上,GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型机型。在MMLU上得分为82.0%,而谷歌的Gemini Flash为77.9%,Anthropic的Claude Haiku为73.8%。

在数学和编码方面,在MGSM测试中GPT-4o mini得分为87.0%,而Gemini Flash为75.5%,Claude Haiku为71.7%。

GPT-4o mini在衡量编码性能的Human Eval上得分为87.2%,而Gemini Flash的得分为71.5%,Claude Haiku的得分为75.9%。

在多模态MMMU上,GPT-4o mini得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

在安全方面,GPT-4o mini内置了多层过滤模式,可有效减少色情、种族歧视、不当言论等非法内容的输出,也首次使用了指令层级结构来全面提升模型的安全性能。

在定价上,GPT-4o mini 的商用价格是每百万输入 token 15 美分,每百万输出 token 60 美分。

也就是说,GPT-4o mini 生成一本 2500 页的书,价格只需要 60 美分。

OpenAI 也计划在未来几天推出 GPT-4o mini 微调版本。

目前,GPT-4o mini 已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。

在 ChatGPT 中,免费版、Plus 版和团队版用户从今天开始将能够使用 GPT-4o mini,以替代 GPT-3.5。企业用户也将从下周开始使用。


大模型成本2年骤降99%


OpenAI称,很高兴能够继续引领潮流。

其设想的未来是模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员铺平了道路,使他们能够更高效、更经济地构建和扩展强大的 AI 应用程序。

AI 的未来将变得更加易于访问、可靠,并嵌入到我们的日常数字体验中。

近几年,人工智能飞速进步,成本也在大幅降低。

OpenAI举例称,自 2022 年推出功能较弱的模型 text-davinci-003 以来,到如今的 GPT-4o mini ,每个 token 成本已下降了 99%。

OpenAI致力于继续沿着这条降低成本、同时增强模型能力的轨迹前进。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论