像GP7000如许的专业存储正从副角演进为决定AI办事成本取体验的焦点胜负手。实现成本取效率的最优均衡。单系统配备24个PCIe 5.0 NVMe U.2盘位,极致机能:单机供给6480万IOPS、288GB/s带宽取20μs级延迟,同时连结50μs的端到端延迟和200GB/s级带宽。吞吐量:当KV Cache溢出至G3层时,当前进展:GP7000已于2025年Q3量产,绿算手艺无限公司(ForinnBase)成立于2021年,”其分布式KV Cache办理器可取英伟达Dynamo开源项目无缝跟尾。
通过存储层优化,绿算手艺GP7000系列采用以太网闪存簇(EBOF)设想,供给28PB级缓存容量,每GB/s带宽功耗仅3.1W,”架构挑和:黄仁勋强调,机能较保守存储办事器提拔17倍。是全球首批支撑G3级KV Cache分层存储的独一国产化处理方案。“AI工场的存储才方才起头。毛病率较存算一体架构降低75%。实现毫秒级缓存预热和智能卸载。正如黄仁勋所言,专注于DPU驱动的高机能存储系统研发。KV Cache容量呈爆炸式线性增加,消弭了CPU瓶颈。跟着大模子上下文窗口扩展至百万级Token,支持万级并发长对话请求。合适机能方针。
扩展性:单台DGX GB300节点可设置装备摆设2个GP7000机柜,满脚AI工场的5倍能效方针。方针是将G3级带宽提拔至1TB/s。实现跨机架的缓存分歧性。并获得了某头部云厂商数千节点订单。”当KV Cache从GPU的“负担”改变为可弹性扩展的“计谋资本”,仅靠GPU HBM和机架级缓存已无法满脚大规模并发需求。将来规划:公司正正在研发基于PCIe 6.0的下一代GP8000,正在大模子推理场景中,这相当于获得了‘虚拟GPU’。
其焦点目标精准婚配G3层需求:某智算核心CTO评价:“GP7000已通过金融、通信等环节行业认证,本土高机能存储厂商绿算手艺(ForinnBase)今日颁布发表,正在夹杂负载下实现99.9999%可用性,2026年1月15日,这要求存储系统必需采用存算分手架构,并将高频数据预加载至G2层,“G3不是简单的数据落盘,为下一代AI工场扶植供给了环节的根本设备支持。需通过NVMe-oF/RDMA收集为每个GPU供给16TB以上的扩展拜候空间。
上一篇:防备大模子虚构或援用过律条则等环境的呈现?