OpenAI发布GPT-5.5性能全面升级
OpenAI推出GPT-5.5,智能体与编码能力显著增强,多项指标领先竞品,推动一体化服务落地。
据THE ELEC4月24日报道,OpenAI今日发布新一代大模型GPT-5.5,称其为迄今最智能、最直观版本,进一步向“超级应用”目标迈进。该模型聚焦企业级智能体、编码、知识工作及高阶数学科研等场景。
性能方面,GPT-5.5全面超越竞品:Terminal-Bench 2.0(编码/智能体)达82.7%,显著高于Claude Opus 4.7(69.4%)和Gemini 3.1 Pro(68.5%);FrontierMath(高阶数学)为35.4%,远超Claude Opus 4.7(22.9%)和Gemini 3.1 Pro(16.7%);GDPval(商业价值任务)达84.9%,OSWorld-Verified为78.7%,BrowseComp达84.4%。
关键升级包括:智能体与编码能力大幅增强,代码审核有效问题检出率由58.3%提升至79.2%;Token效率优化,降低运行成本并提升迭代空间;工具整合能力增强,可联动Notion、Slack及数据库等构建复杂工作流。
OpenAI表示,正推进ChatGPT、Codex与AI浏览器一体化整合,旨在打造用户与世界交互的统一入口。

