机构:Jalapeño开启OpenAI自研芯片时代,AI算力迈向全栈协同
模型与芯片协同开发正成为头部AI厂商的必然选择。
6月25日,金元证券发布了一篇电子行业的研究报告,报告指出,Jalapeño开启OpenAI自研芯片时代,AI算力迈向全栈协同。
6月24日,OpenAI与博通联合发布首款自研AI推理芯片Jalapeño。该芯片从最初设计到流片仅用时9个月,预计2026年底开始初始部署。
Jalapeño锚定大模型推理环节。该芯片由OpenAI定义芯片架构,博通负责芯片工程实现、网络及连接技术,Celestica参与板卡、机架和系统集成,主要面向ChatGPT、Codex、API及未来Agent产品的LLM推理负载。目前该芯片的工程样品已在目标频率及功耗下成功运行GPT-5.3-Codex-Spark。
OpenAI正由模型厂商向全栈AI基础设施厂商演进。Jalapeño围绕OpenAI实际运行的模型、核心算子、数据搬运、网络通信及调度需求进行软硬件协同优化,通过减少数据搬运,并平衡计算、内存和网络资源,提高芯片实际利用率。根据官方早期测试,其单位功耗性能有望显著优于当前先进加速器。随着推理环节逐步成为算力需求的主要增量,自研ASIC将帮助OpenAI降低单位Token成本,增强算力供应自主性,并缩短模型与基础设施的迭代周期。
模型与芯片协同开发正成为头部AI厂商的必然选择。
Google于2015年部署首代TPU,并逐步由推理扩展至训练、互连和系统集群;AWS先后推出Inferentia和Trainium,分别覆盖推理与训练;Meta则围绕推荐、排名和广告等内部负载开发MTIA,并强化芯片、PyTorch与模型架构协同。当模型调用规模足够大、负载趋于稳定后,厂商有动力将算法和业务特征固化至芯片设计中,以提升性能、功耗和成本效率。Jalapeño的发布意味着这一趋势正由云计算巨头延伸至头部模型厂商,AI芯片竞争也将由单一芯片性能,升级为模型、编译器、芯片、HBM、网络和机架系统的全栈竞争,并进一步拉动定制ASIC、先进制程、HBM、先进封装、高速交换及光互连需求。

