PG电子(PocketGames) OpenAI上新GPT-5.4 mini与nano, 性能面对旗舰, 资本仅需三分之一

发布日期：2026-03-18 15:27:59 点击次数：81

PG电子(PocketGames) OpenAI上新GPT-5.4 mini与nano，性能面对旗舰，资本仅需三分之一

3月18日音问，本日，OpenAI推出GPT-5.4mini和GPT-5.4nano模子。这两款模子针对快速、巨额量AI使命负载假想，属于低资本的大讲话模子居品。

适用于AI使命流的袖珍模子

6686体育官方网站入口

对好多AI使命流而言，高效的模子频频需要在性能、反应速率及器具调用才能之间得到均衡。

OpenAI暗示：“这些模子专为对延伸明锐的使命负载假想，在此类场景中，延伸径直影响居品体验。举例：需要快速反应的编程助手、扩张扶植任务的子智能体(Subagents)、捕捉并解读屏幕骨子的揣度机操作系统，以及能对图像进行及时推理的多模态应用。”

该公司指出：“在这些应用场景中，适用的模子频频并非参数范围最大的，而是反应赶快、能沉稳调用器具，且在专科任务中弘扬平时的模子。”

相较于GPT-5mini，GPT-5.4mini在编程、推理、多模态表现及器具使用方面有所进步，驱动速率约为前者的两倍。

GPT-5.4nano则是体积更小、速率更快的版块，主要针对分类、数据索要、排序及较粗浅的编程扶植任务。

性能弘扬

在评估体量较小、资本较低的模子时，性能和性价比是主要参考所在。OpenAI列举了新模子相较于旧模子的测试数据：

•在SWE-benchPro基准测试中，GPT-5.4mini得分为53.40%，而GPT-5mini为45.69%。

•在Terminal-Bench2.0测试中，GPT-5.4mini达到59.30%，而GPT-5mini为38.20%。

•在GPQADiamond测试中，GPT-5.4mini得分为85.48%，接近GPT-5.4的93.00%。

•OSWorld-Verified成果露馅，GPT-5.4mini得分为70.60%，高于GPT-5mini的42%。

测试成果露馅，GPT-5.4mini的通过率接近GPT-5.4的水平，且扩张速率更快。在估量模子正确处理问题才能的基准测试中，轻量级的GPT-5.4mini与全功能版GPT-5.4弘扬临近。

GPT-5.4nano的弘扬则介于上述两者之间。举例，其在SWE-benchPro上得分为52.39%，在TerminalBench2.0上为46.30%。数据低于GPT-5.4mini，但高于GPT-5mini。

子智能体与多模态任务

在智能体生态系统中，AI的架构不错模拟本质中的配合模式。举例，将才能较强的AI模子（如GPT-5.4Thinking）与速率较快、低资本的模子（如GPT-5.4mini）磋磨使用，访佛于资深工程师指导低级工程师协同使命。

智能体系统可组合不同范围的模子，PG电子(PocketGames)游戏官网由大模子负包袱务诡计，小模子崇敬扩张子任务。在此语境下，GPT-5.4mini可承担子智能体的使命，举例搜索代码库、审查文献及处理文档。

OpenAI暗示：“GPT-5.4mini具备多模态任务处理才能，适用于波及揣度机使用的任务。该模子能解读密集型用户界面的截图，以扶植完成揣度机操作任务。”

可用性与订价

GPT-5.4mini现已通过API、Codex和ChatGPT多个版块提供。免费版和Go级用户可通过附加菜单中的“Thinking”选项调用GPT-5.4mini。OpenAI暗示：“关于其他所灵验户，GPT-5.4mini将行为GPT-5.4Thinking触发速率浪漫后的备选模子。”

该公司暗示，针对设施员，GPT-5.4mini已遮掩Codex应用、号令行界面(CLI)、集成诞生环境(IDE)扩展及网页端。OpenAI指出，这款mini模子“仅蓦地GPT-5.4配额的30%，让诞生者能在Codex中以约三分之一的资本处理粗浅编程任务”。此外，Codex还可将任务交付给GPT-5.4mini子智能体，从而让推理强度较低的使命在低资本模子上驱动。

资本对比数据如下：

•GPT-5.4mini订价为每百万输入Token0.75好意思元，每百万输出Token4.50好意思元，领有40万词的高下文窗口(ContextWindow)。

•GPT-5.4nano仅通过API提供，价钱为每百万输入Token0.20好意思元，每百万输出Token1.25好意思元。

比拟之下，GPT-5.4的订价为每百万输入Token2.50好意思元，每百万输出Token15.00好意思元。

客户测试反馈

科技公司Hebbia勇猛于诞生匡助专科东谈主士行使当然讲话处理文档库的器具。其居品主要应用于金融、法律和科研等需要同期分析多份文档的领域。

Hebbia首席本事官AabhasSharma暗示：“在同类模子中，GPT-5.4mini提供了较为沉稳的端到端性能。在咱们的评估中，它在部分输出任务和援用调回率上的弘扬达到了预期，且资本有所裁汰。此外，其端到端通过率和开始归因才能在部分测试中高于体量更大的GPT-5.4模子。”

数字使命区Notion是一款常用的坐蓐力器具（本文即在Notion中撰写）。该软件为结构化和非结构化数据提供了和谐平台，用户可行使其构建零代码的信息料理微应用，用于跟踪著作创作、里面面容等。

NotionAI工程崇敬东谈主AbhisekModi暗示：“GPT-5.4mini在处理界讲明确的任务时，弘扬出较高的精确度。在页面剪辑方面，它处理复杂样式的才能接近GPT-5.2，而算力蓦地相对较低。”

Modi补充谈：“此前，频频唯有旗舰模子才能沉稳处缄默能体器具调用(AgenticToolCalling)。当今，像GPT-5.4mini和nano这么的袖珍模子也具备了联系才能。这将便于用户在Notion上构建自界说智能体(CustomAgents)时选择适应的模子。”（易句）

（本文由AI翻译PG电子(PocketGames)，网易剪辑崇敬校对）

上一篇：PG电子(PocketGames)游戏官网四川一高校放6天假让学生赏花恋爱、享受春天
下一篇：PG电子(PocketGames) 塞内加尔被判非洲杯决赛0-3负, 国脚嘲讽: 再给那些呜咽的东说念主3个球

PG电子(PocketGames) OpenAI上新GPT-5.4 mini与nano, 性能面对旗舰, 资本仅需三分之一

最新资讯

推荐资讯

友情链接：