云天励飞:公司的GPNPU把GPU灵活性与NPU高能效结合起来
使算力不再只是峰值堆叠,而是围绕推理SLA进行系统级优化。
有投资者向云天励飞-U(688343.SH)提问,注意到公司确立了独特的GPNPU技术路线(通用计算+高效NPU+3D堆叠)。在当前算力国产化替代的浪潮下,相较于传统的GPGPU,公司的GPNPU架构在能效比和成本把控上有何“杀手锏”?面对未来三年的AI推理芯片爆发期,公司如何凭借“算力积木”架构守住技术护城河,实现从“适应市场”到“定义标准”的跨越?
5月20日,公司回答表示,公司的GPNPU通过“通用计算+高效NPU+3D堆叠”的架构,把GPU的灵活性、NPU的高能效和近存计算的数据供给能力结合起来,使算力不再只是峰值堆叠,而是围绕推理SLA进行系统级优化:第一,用NPU级矩阵与Attention加速提高有效算力利用率;第二,用3D堆叠和近存数据通路降低KVCache、长上下文、视频生成等场景的数据搬运成本;第三,用算力积木架构,把芯片、存储、互联、板卡、服务器、超节点和软件组合成标准化产品单元,从而在不同市场以不同形态快速落地。

