news 2026/4/22 3:20:30

开箱 NVIDIA DGX Spark:iPad mini尺寸实现千万亿次算力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
开箱 NVIDIA DGX Spark:iPad mini尺寸实现千万亿次算力

作者:毛烁

几天前,一位在行业深耕多年的朋友问我:现在满市场都是AIPC,究竟什么样的机器,才配得上“生产力”引擎,而不只是把“本地端侧智能”当卖点?

这个问题的关键,并不仅在于某一代芯片性能是否足够强,更在于算力的组织方式是否发生了变化。过去二十年,计算资源不断向云端集中,个人设备逐渐退化为算力入口。但在大模型时代,这种结构开始显现出系统性张力——模型规模、数据私有性与推理频率,正在加速算力重新下沉。

AIPC的出现,解决了部分本地推理问题,却仍受限于显存规模、内存割裂和模型生命周期不可持续,难以形成完整的计算闭环。本质上,算力依然是被预设、被封装的。

真正的分水岭,或许不是“PC 能不能跑 AI”,而是——个人是否能够拥有可持续演进的AI计算系统,能在本地完成推理、微调与优化,并长期沉淀数据与模型资产。

从这个意义上看,是否“每个人都应该有一台 AI 超算”

最近,我们正好拿到了一台不久前发布的NVIDIA DGX Spark——一台被压缩到桌面尺度的AI超算。

GB10的CPU部分,搭载了专为数据预处理和AI任务优化的20核心ARM处理器。这颗CPU的核心调度策略采用“10+10组合”——10个Cortex-X925超大核负责高负载的通用计算任务10 个 Cortex-A725高能效核负责处理后台进程和I/O 调度。

与之协同的,是基于 Blackwell架构的GPU核心。集成了6144个Blackwell Generation CUDA 核心,搭载了第五代Tensor Core和第四代RT Core。

最令人惊艳的在于其张量性能(Tensor Performance):在 FP4精度下,这1.2kg的“小盒子”能爆发出的峰值算力高达1 PFLOP(此为基于 FP4精度并结合稀疏性加速的理论值)。这意味着其单机的理论性能,已经能够支撑起200B(两千亿)参数级别的AI推理任务,或70B(七百亿级别的模型微调训练。

为了匹配这样的计算与互联能力,NVIDIADGX Spark在存储I/O配置上标配4TB NVMe M.2 SSD,并支持自加密(Self-Encrypting),用于保护模型权重与数据资产的安全;网络侧除万兆以太网外,还支持Wi-Fi 7,覆盖从本地集群到无线办公的多种使用场景。

在如此激进的性能释放下,GB10芯片的TDP被控制在140W,整机满载功耗约240W。结合仅其紧凑的体积,NVIDIA DGX Spark给出了清晰的答案——桌面级AI计算不再只是靠堆功耗换算力,而是通过系统架构、内存模型和高速互连,把单位能耗下的有效算力密度推到新的高度。

对于LLM开发者而言,NVIDIA DGX Spark最具”爆发力”的能力,在于其配备128GB LPDDR5x统一系统内存。这套内存采用256-bit位宽,总带宽达到273 GB/s,由CPU与GPU 共享同一物理内存池。

与传统“CPU 内存+独立显存”的割裂架构不同,统一的内存从根本上绕开了24GB、48GB显存所形成的硬性上限。系统可以根据实际负载动态分配内存资源,模型参数、KV Cache,以及中间张量无需在 CPU内存与GPU显存之间反复搬运,不仅降低了内存拷贝带来的时延,也显著简化了大模型部署与调优的复杂度。

对开发者来说,这意味着可以在单机环境中承载更大的模型规模,并获得更稳定、可预测的推理性能。

回到最初的问题:什么样的机器,才配得上“生产力引擎”?

前文所拆解的,并不仅是DGX Spark的性能参数,更是整套计算范式的变化。从统一内存打破显存墙,到CPU与GPU在同一物理内存池内协同调度;从单机即可承载数百亿参数模型,到通过高速互连实现近线性的算力扩展。这些设计共同指向一个事实——AI计算正在从“被调用的资源”,转变为“可长期拥有、持续演进的系统”。

当模型可以在本地完成推理、微调与迭代,当数据与权重不再只是临时加载的消耗品,而是可以长期沉淀、不断增值的资产,计算设备本身的角色也随之发生改变——它不再是终端,而是个人级算力基础设施。

从这个意义上看,“每个人都应该拥有一台AI超算”或许是大模型时代对生产力工具提出的现实要求。



版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 1:48:30

佳明自动驾驶系统成功实现小型飞机无人干预自动着陆

美国联邦航空管理局证实,佳明公司的自动着陆产品在首次实际紧急情况应用中取得成功,一架小型飞机在科罗拉多州落基山都市机场完全依靠自动化系统安全紧急降落。佳明紧急自动着陆系统的设计目标是在"飞行员无法驾驶的紧急情况下自动接管飞行的完全控…

作者头像 李华
网站建设 2026/4/20 14:26:06

运营述职 PPT 工具横评:效率与呈现谁更优

每到季度末,做运营述职 PPT 就成了运营人的噩梦。好不容易搞定了基础的数据整理,又要担心写不出吸引人的内容,熬夜熬到两眼发黑,内容框架还是一团乱麻。好不容易把内容凑齐了,又得在排版设计上绞尽脑汁,颜色…

作者头像 李华
网站建设 2026/4/17 14:44:32

基于微信小程序的新冠疫情防控信息管理系统毕设源码+文档+讲解视频

前言 本课题聚焦新冠疫情防控场景下信息管理的高效化需求,针对传统防控信息收集滞后、数据分散、交互不便等痛点,设计开发基于微信小程序的新冠疫情防控信息管理系统。系统以微信小程序为前端载体,结合Node.jsExpress后端框架与MongoDB数据库…

作者头像 李华
网站建设 2026/4/21 14:27:41

使用OpenGL绘制卡通效果的圣诞树

使用OpenGL绘制卡通效果的圣诞树引言1. 加载3D圣诞树模型1.1 模型准备1.2 使用Assimp库加载模型2. 使用OpenGL绘制圣诞树2.1 初始化OpenGL2.2 设置着色器3. 添加卡通效果3.1 卡通着色原理3.2 实现卡通着色3.3 添加轮廓线4. 增强圣诞气氛4.1 装饰品4.2 闪烁灯光4.3 雪花粒子系统…

作者头像 李华
网站建设 2026/4/18 2:11:14

算法讲解15:栈

栈:先进后出公式:卡特兰数:n个不同的元素按照某个顺序入栈,对应的合法的出栈顺序有几个?公式如下:C n__2n______n1题目:给出两个序列pushed和poped两个序列,其取值从1到n(n ≤ 10000…

作者头像 李华
网站建设 2026/4/21 12:58:41

Java计算机毕设之基于Springboot+Vue动漫推荐平台管理系统基于协同过滤算法的动漫推荐系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华