news 2026/7/3 15:17:21

从IO500双榜第一,看国产存储的系统级突破

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从IO500双榜第一,看国产存储的系统级突破

作者:王聪彬

中国存储厂商再次站上全球榜单最高点。

6月24日,ISC 2026高性能计算大会公布最新IO500榜单,中科曙光ParaStor F9000全闪存储系统包揽生产型全节点榜单和10节点榜单双榜第一,也是首个达成此成就的中国厂商,实现了历史性的零突破。

成绩公布后,中科曙光北京公司总裁助理、分布式存储产品部总经理石静用八个字概括了自己的感受:“行稳致远、长期主义”。

生产型榜单,在真实业务中跑出来的成绩

从评价标准来看,IO500生产型榜单重点考察三个维度:第一是长期稳定性,系统在持续负载下是否保持性能不衰减;第二是复杂混合负载能力,能否同时处理大带宽顺序IO与高频小IO及元数据操作;第三是规模扩展一致性,在节点规模增加后性能是否仍然具备可预测性和可扩展性。

生产型榜单最大的特殊性在于“真实”。

首先是数据路径不能出现抖动,否则会被复杂负载迅速放大。与很多可以专门为测试优化的环境不同,IO500生产型榜单要求测试期间不能使集群中其他业务暂停。关键在于如何在不影响既有业务稳定性的前提下,依然把存储性能有效释放出来,并满足整体运行要求。

比如在这套生产系统里,本身就同时运行着多类应用。在此基础上叠加新测试或业务负载时,所有业务都会集中对存储系统形成压力。这背后体现的是系统在性能调度与多业务均衡方面的设计能力。

其次是多节点扩展后性能必须具备一致性,而不是局部最优。此次10节点榜单与全节点榜单虽然采用相同测试用例,但考察重点并不相同。前者注重扩展能力,后者注重单点效率。“带宽能力和元数据访问能力对存储系统压力的实现方式不同,如何用同一套存储架构应对不同类型的I/O压力,也是挑战所在。”石静说道。

最后是系统在高并发压力下必须保持长期稳定。IO500测试本身是一个持续时间较长的过程,相比短时间的性能冲刺,更关键的是在长周期运行中保持性能平稳,同时支撑多种业务并发运行。

从2U2N到PCle通道均衡设计,关键技术的自主创新

ParaStor F9000能够同时拿下两项榜单第一,背后离不开硬件架构和软件层面的创新。

硬件层面,ParaStor F9000采用全NVMe闪存架构,与市场上常见的2U24盘位全闪存储不同,中科曙光设计了独特的“2U2N”双子星架构,在2U空间内集成两个独立物理节点,每个节点都拥有独立的CPU、内存、网卡和SSD。

这种设计使数据路径实现简化,NVMe介质与高速网卡均直接连接CPU,中间不经过PCIe Switch转发,最大程度减少性能损耗,最大限度释放CPU的性能。

中科曙光还对SSD和高速网络所占用的PCIe通道进行了均衡设计,避免出现存储性能过剩而网络成为瓶颈,或者网络能力富余而存储跟不上的情况,实现存储介质性能与网络传输能力的同步释放。同时结合scaleFabric 400G高速网络,实现兼顾高带宽和低时延需求。

中科曙光高速网络互联产品部总工程师万伟表示,首款全栈自研400G无损高速网络scaleFabric采用原生无损RDMA架构,通过端到端零丢包保障低时延与高吞吐稳定性,并完全兼容InfiniBand生态,应用可无代码迁移。

软件层面,提供了精细化的QoS调度能力。针对不同业务场景,例如10节点测试与全节点测试,可以分别在文件系统、目录或计算节点维度设定带宽与IOPS的最低保障,同时支持突发资源机制,确保在高负载测试期间,核心业务性能稳定,同时避免对其他业务产生影响。

ParaStor F9000在关键技术上实现了自主创新。中科曙光北京公司分布式存储总架构师袁清波介绍,由于核心软硬件栈完全可控,使得存储系统可以在协议栈、数据路径、调度机制等多个层面进行深度协同优化,这也是ParaStor F9000能够在高负载场景下持续保持性能稳定的重要基础之一。

面向AI时代的存储系统底座能力

在AI体系中,存储正在从传统数据仓库转变为“AI数据引擎”。其角色不再局限于数据存放,而是延伸到数据流转调度、训练过程加速以及推理阶段支撑,尤其是在KV Cache、向量数据库以及高频访问数据路径中,存储已经深度参与计算过程。

ParaStor F9000专为AI训练场景量身打造,可提供从千卡到十万卡集群的整机柜交付方案,支持千亿级参数大模型部署时间缩短1倍,集群训练效率提升50%。

据介绍,ParaStor F9000首创AI存储三级协同方案,实现“以存提算、以存代算、以存降本”。

“以存提算”,本质是通过存储侧的数据路径优化与智能编排,把高频访问数据、训练关键数据尽可能前移到更高效的访问通道上,让GPU不再等待数据,而是持续获得稳定数据流,从系统层面提升算力利用率。

“以存代算”更多体现在对部分轻量数据处理与访问逻辑的下沉,比如在存储侧完成KV Cache相关数据的组织优化、向量检索加速以及部分预处理操作,把原本需要CPU参与的部分流程前移到数据层,减少计算链路中的无效搬运和重复计算。

“以存降本”则是通过数据分层与资源协同,让不同访问频率的数据落在不同介质与路径上,在保证性能的同时减少高成本资源占用,实现整体系统的资源最优配置。

自国家超算互联网核心节点启动建设以来,ParaStor F9000 已投入实际生产环境,目前该系统已在数万卡集群中稳定运行超过一年,在大模型训练科学计算与数据分析等关键场景中提供支撑。

可以说,国产存储在真实AI基础设施体系中,开始参与甚至在部分关键维度形成领先。并且这种领先是系统级能力、长期稳定性和规模化支撑能力的综合体现。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/3 15:16:59

OBS直播教程:OBS美颜常见的七个问题

做了两年多直播技术支持,关于OBS美颜插件的问题基本就那几个反复出现。obs美颜插件安装了不显示、摄像头被占用、黑边去不掉、美颜效果不生效——这些问题看着简单,但新手卡住就很崩溃。 今天把7个最高频的obs美颜教程问题整理出来,每个都给排…

作者头像 李华
网站建设 2026/7/3 15:16:50

6.30遇到的问题

1.个人资料修改头像,只能使用默认头像,上传的图片不能当头像2.我的钱包:绑定支付宝沙箱和银行卡,下完单之后,钱包余额不能自动扣除3.优惠券领取不能点击,打车界面看不到使用最优优惠券后的价格4.天气不能实…

作者头像 李华
网站建设 2026/7/3 15:16:21

3分钟掌握百度网盘高速下载:Python解析工具完全指南

3分钟掌握百度网盘高速下载:Python解析工具完全指南 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘几十KB/s的龟速下载而烦恼吗?baidu-…

作者头像 李华
网站建设 2026/7/3 15:17:48

Ansys.Electronics.2026 R1安装教程

软件简介: ‌Ansys Electronics‌是一款全球领先的电子设计自动化(EDA)软件平台,主要用于模拟、分析和优化各类电子产品的设计。该软件集成了多个专业工具,涵盖了电磁场仿真、电路设计、热和结构分析等多个方面&#…

作者头像 李华
网站建设 2026/7/3 15:23:04

大棚环境控制:温湿度、光照、CO₂ 的全自动调节

大棚环境控制:温湿度、光照、CO₂ 的全自动调节 灌溉是最基础的,大棚环境控制才是真正的多变量系统——温湿度、光照、CO₂ 浓度相互耦合,开窗通风降了温也降了湿,补光灯升温还费电。这篇讲四套执行器的联动策略和 PID 控制算法。…

作者头像 李华
网站建设 2026/7/3 16:12:01

光电经纬仪测量中的坐标系体系及其应用

引言 光电经纬仪作为一种高精度光学测量设备,在靶场测试、卫星跟踪、导弹试验等领域发挥着不可替代的作用。其核心任务是将设备观测到的目标影像信息转化为具有明确物理意义的三维空间坐标。这一转化过程涉及多个坐标系的定义、转换与综合应用,构成了一个完整而严密的数学框…

作者头像 李华