格隆汇5月21日|有投资者在互动平台向云天励飞提问:公司多次提到 IFWA 软件栈可支持 vLLM、SGLang 等主流推理框架。请问目前是否已有客户在生产环境中基于标准开源 vLLM(未经修改)调用 GPNPU 芯片?未来是否有计划将 GPNPU 后端贡献至 vLLM 社区主干,以降低开发者使用门槛并提升生态融合度?
云天励飞回复称,IFWA软件栈是公司基于自研GPNPU芯片打造的自主可控、全栈优化的软硬件协同统一计算软件栈平台,面向AI大模型推理与异构加速,体现GPGPU的通用性和NPU的极致优化性能。公司基于GPNPU架构的新一代云推理芯片处于研发之中,IFWA软件栈未来会配合新一代的云推理芯片,兼容标准开源vLLM、SGLang等主流推理框架,让开发者能极速迁移与开放,降低开发者使用门槛。






