news 2026/4/6 3:08:12

马斯克全球最大GPU集群建成,Grok要起飞了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
马斯克全球最大GPU集群建成,Grok要起飞了!
来源:量子位

刚刚,全球首个GW级超算集群Colossus 2,正式投入运行

马斯克兴奋喊话:

这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。

网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」

有了这剂算力强心针,Grok的忠实拥趸已经提前开香槟,开始畅想Grok5的统治时代。

但在全网狂欢的背后,更多的人是苦不堪言——

2026年夏天,美国13个州的6700万居民,可能要因数据中心的存在被停电,没空调吹了。

全球首个GW级训练集群

老马的执行力太恐怖了。

不靠亚马逊,不靠微软,也没有「星际之门」计划,一己之力于孟菲斯平地建起一座1GW的超算集群。

前一代超算集群Colossus 1从无到有仅用了122天。

它配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。

而在此基础上翻了好几倍,功率达到1GW的Colossus 2,只花了仅仅不到一年。

1GW是什么概念?

一般来说,1GW可以为75万户家庭供电,相当于高峰时期的旧金山。

一座核电站的功率差不多也就是1GW。

如果按马斯克所说,今年4月份,Colossus 2将升级至1.5GW,最终总装机容量达到2GW,这个数字将与美国大多数主要城市的用电量相当。

按照规划,彻底完工后的Colossus 2将内置55.5万张GPU,远超Meta的15万、微软10万,以及谷歌的分布式基础设施。

而这庞大的资源,全部为Grok独自享用。

此前,曾有爆料称Grok 5的参数将达到惊人的6万亿左右,是Grok 4的两倍以上。

原因便是基于Colossus 2:

当时有观点认为Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。

如今,Colossus 2已正式上线,1GW的条件也正正好好满足

而随着前段时间xAI E轮融资200亿美元的进账,Grok 5的Scaling筹码还在进一步增加。这意味着更大的模型参数,更快的训练速度、迭代速度,部署速度。

当OpenAI还在为2027年的算力基础设施发愁时,xAI已经把一座「城市级」AI 工厂开机运行,将Grok 5提前扶上了市场心目中的下一个SOTA。

正如网友所说,AI时代,速度就是最强的护城河。

居民受不了啦!

不过,并非所有人都因这种「速度」受益。

据《华尔街日报》消息,美国非营利电网运营商PJM,未来可能在极端高温或严寒天气期间,轮流对区域内的居民断电。

这意味着,美国13个州的6700万人,在今年不得不迎来一个相当难熬的夏天。

要说清楚这个问题,得先明白PJM是干嘛的。

PJM,简单来说就是美国能源系统的交通指挥中心,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持供需平衡。

然而,大模型大力出奇迹的竞赛正在破坏这种平衡。

在数据中心建设热潮推动下,PJM预计未来10年电力需求将以年均4.8%的速度增长。

对一个多年需求变化不大的系统来说,这样的增速相当罕见。

一边需求激增,另一边,供给的增速却相当缓慢。新建电厂的速度甚至都跟不上老电厂的退役速度,电网容量面临饱和。

供需一旦出现偏差,电网频率就会波动,进而可能损坏发电厂等关键基础设施。

为避免这些风险,PJM只能两害相权取其轻,通过在用电高峰期轮流停电来卸压。

PJM也不是没想过其他办法。

去年9月,PJM发布了一系列提议,希望数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。

然而,亚马逊、谷歌、微软等几乎都表示了反对,认为这是对数据中心的歧视

值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus位于中南部,并不在PJM电网覆盖范围内。

同时,为减少对当地电网的冲击,xAI还部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/22 1:26:03

AI图像风格迁移新选择|DCT-Net GPU镜像实现高质量二次元虚拟形象生成

AI图像风格迁移新选择|DCT-Net GPU镜像实现高质量二次元虚拟形象生成 随着AI图像生成技术的快速发展,人像卡通化作为风格迁移的重要应用方向,正广泛应用于社交头像、虚拟角色设计和数字内容创作等领域。传统的卡通化方法往往依赖复杂的后期处…

作者头像 李华
网站建设 2026/4/4 13:40:36

IQuest-Coder-V1实战案例:游戏开发逻辑自动生成系统

IQuest-Coder-V1实战案例:游戏开发逻辑自动生成系统 1. 引言:AI驱动的游戏开发新范式 随着大语言模型在代码生成领域的持续突破,传统软件工程的开发流程正经历深刻变革。特别是在游戏开发这一高度依赖逻辑设计、状态管理和复杂交互的领域&a…

作者头像 李华
网站建设 2026/3/14 9:59:08

HY-MT1.5-1.8B术语干预功能:专业翻译场景应用指南

HY-MT1.5-1.8B术语干预功能:专业翻译场景应用指南 1. 模型背景与应用场景 随着全球化进程的加速,高质量、可定制化的机器翻译需求日益增长。特别是在医疗、法律、金融、科技等专业领域,通用翻译模型往往难以满足对术语一致性、上下文连贯性…

作者头像 李华
网站建设 2026/4/3 4:54:13

基于波特图的环路断开点选择策略:系统学习

如何选对环路断开点?波特图稳定性分析的“命门”详解在开关电源、DC-DC变换器甚至电机控制系统的开发中,我们常听到一句话:“这个系统看起来工作正常,但一碰负载就振荡。”问题出在哪?往往不是元件坏了,也不…

作者头像 李华
网站建设 2026/4/5 4:36:54

从录音到文本:Fun-ASR全流程操作真实体验

从录音到文本:Fun-ASR全流程操作真实体验 在远程办公、会议记录和内容创作日益依赖语音输入的今天,高效准确的语音识别系统已成为提升生产力的关键工具。通义实验室联合钉钉推出的 Fun-ASR,作为一套支持本地部署的大模型语音识别解决方案&am…

作者头像 李华
网站建设 2026/3/31 19:47:07

AI读脸术性能提升:多模型融合实战教程

AI读脸术性能提升:多模型融合实战教程 1. 引言 1.1 业务场景描述 在智能安防、用户画像构建、个性化推荐等实际应用中,人脸属性分析是一项基础而关键的技术能力。其中,性别识别与年龄估计作为非身份类生物特征分析的核心任务,广…

作者头像 李华