
3月18日音问,本日,OpenAI推出GPT-5.4mini和GPT-5.4nano模子。这两款模子针对快速、巨额量AI使命负载假想,属于低资本的大讲话模子居品。
适用于AI使命流的袖珍模子
6686体育官方网站入口对好多AI使命流而言,高效的模子频频需要在性能、反应速率及器具调用才能之间得到均衡。
OpenAI暗示:“这些模子专为对延伸明锐的使命负载假想,在此类场景中,延伸径直影响居品体验。举例:需要快速反应的编程助手、扩张扶植任务的子智能体(Subagents)、捕捉并解读屏幕骨子的揣度机操作系统,以及能对图像进行及时推理的多模态应用。”
该公司指出:“在这些应用场景中,适用的模子频频并非参数范围最大的,而是反应赶快、能沉稳调用器具,且在专科任务中弘扬平时的模子。”
相较于GPT-5mini,GPT-5.4mini在编程、推理、多模态表现及器具使用方面有所进步,驱动速率约为前者的两倍。
GPT-5.4nano则是体积更小、速率更快的版块,主要针对分类、数据索要、排序及较粗浅的编程扶植任务。
性能弘扬
在评估体量较小、资本较低的模子时,性能和性价比是主要参考所在。OpenAI列举了新模子相较于旧模子的测试数据:
•在SWE-benchPro基准测试中,GPT-5.4mini得分为53.40%,而GPT-5mini为45.69%。
•在Terminal-Bench2.0测试中,GPT-5.4mini达到59.30%,而GPT-5mini为38.20%。
•在GPQADiamond测试中,GPT-5.4mini得分为85.48%,接近GPT-5.4的93.00%。
•OSWorld-Verified成果露馅,GPT-5.4mini得分为70.60%,高于GPT-5mini的42%。

测试成果露馅,GPT-5.4mini的通过率接近GPT-5.4的水平,且扩张速率更快。在估量模子正确处理问题才能的基准测试中,轻量级的GPT-5.4mini与全功能版GPT-5.4弘扬临近。
GPT-5.4nano的弘扬则介于上述两者之间。举例,其在SWE-benchPro上得分为52.39%,在TerminalBench2.0上为46.30%。数据低于GPT-5.4mini,但高于GPT-5mini。
子智能体与多模态任务
在智能体生态系统中,AI的架构不错模拟本质中的配合模式。举例,将才能较强的AI模子(如GPT-5.4Thinking)与速率较快、低资本的模子(如GPT-5.4mini)磋磨使用,访佛于资深工程师指导低级工程师协同使命。
智能体系统可组合不同范围的模子,PG电子(PocketGames)游戏官网由大模子负包袱务诡计,小模子崇敬扩张子任务。在此语境下,GPT-5.4mini可承担子智能体的使命,举例搜索代码库、审查文献及处理文档。
OpenAI暗示:“GPT-5.4mini具备多模态任务处理才能,适用于波及揣度机使用的任务。该模子能解读密集型用户界面的截图,以扶植完成揣度机操作任务。”
可用性与订价
GPT-5.4mini现已通过API、Codex和ChatGPT多个版块提供。免费版和Go级用户可通过附加菜单中的“Thinking”选项调用GPT-5.4mini。OpenAI暗示:“关于其他所灵验户,GPT-5.4mini将行为GPT-5.4Thinking触发速率浪漫后的备选模子。”
该公司暗示,针对设施员,GPT-5.4mini已遮掩Codex应用、号令行界面(CLI)、集成诞生环境(IDE)扩展及网页端。OpenAI指出,这款mini模子“仅蓦地GPT-5.4配额的30%,让诞生者能在Codex中以约三分之一的资本处理粗浅编程任务”。此外,Codex还可将任务交付给GPT-5.4mini子智能体,从而让推理强度较低的使命在低资本模子上驱动。
资本对比数据如下:
•GPT-5.4mini订价为每百万输入Token0.75好意思元,每百万输出Token4.50好意思元,领有40万词的高下文窗口(ContextWindow)。
•GPT-5.4nano仅通过API提供,价钱为每百万输入Token0.20好意思元,每百万输出Token1.25好意思元。
比拟之下,GPT-5.4的订价为每百万输入Token2.50好意思元,每百万输出Token15.00好意思元。
客户测试反馈
科技公司Hebbia勇猛于诞生匡助专科东谈主士行使当然讲话处理文档库的器具。其居品主要应用于金融、法律和科研等需要同期分析多份文档的领域。
Hebbia首席本事官AabhasSharma暗示:“在同类模子中,GPT-5.4mini提供了较为沉稳的端到端性能。在咱们的评估中,它在部分输出任务和援用调回率上的弘扬达到了预期,且资本有所裁汰。此外,其端到端通过率和开始归因才能在部分测试中高于体量更大的GPT-5.4模子。”
数字使命区Notion是一款常用的坐蓐力器具(本文即在Notion中撰写)。该软件为结构化和非结构化数据提供了和谐平台,用户可行使其构建零代码的信息料理微应用,用于跟踪著作创作、里面面容等。
NotionAI工程崇敬东谈主AbhisekModi暗示:“GPT-5.4mini在处理界讲明确的任务时,弘扬出较高的精确度。在页面剪辑方面,它处理复杂样式的才能接近GPT-5.2,而算力蓦地相对较低。”
Modi补充谈:“此前,频频唯有旗舰模子才能沉稳处缄默能体器具调用(AgenticToolCalling)。当今,像GPT-5.4mini和nano这么的袖珍模子也具备了联系才能。这将便于用户在Notion上构建自界说智能体(CustomAgents)时选择适应的模子。”(易句)
(本文由AI翻译PG电子(PocketGames),网易剪辑崇敬校对)




