云巨头自研芯片布局推理新局
AI推理时代来临,云厂商调整芯片战略,AWS、谷歌、Meta等深化自研布局,降低对GPU依赖。
据THE ELEC 4月27日报道,随着AI重心从训练转向推理,全球云厂商加速自研芯片战略调整。谷歌云首次推出推理专用芯片TPU 8i,SRAM增至384MB、通信级减至7级,延迟显著下降,性能成本提升80%、能效翻倍;训练芯片TPU 8t则支持单集群百万级部署,速度提升3倍。
AWS将自研Graviton 5(192核)作为核心,支撑Meta下一代AI模型,使用数千万核CPU,使Meta跻身Graviton前五大客户,有效降低对英伟达GPU依赖。AWS同时商用Trainium 3芯片,搭载144GB HBM,实现“训完即部署”,宣称其为“全球最佳推理平台”,而Inferentia 3仅披露处于开发中。
Meta推进算力多元化,已签约未来5年采购100亿美元谷歌TPU及6GW AMD定制算力。英伟达则通过L4/L40S推理卡、投资Baseten及200亿美元获取Groq技术布局双线。Anthropic成为唯一获AWS(330亿美元)、谷歌(400亿美元、5GW算力、估值3500亿)、微软(50亿美元)三方同时投资的AI企业。

