news 2026/5/5 19:26:31

Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

Amazon EC2 G7e实例现已正式可用,为生成式AI推理和图形工作负载提供高性价比与卓越性能。

Amazon EC2 G7e实例搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU,适用于空间计算、科学计算等多种GPU加速型工作负载。相较于Amazon EC2 G6e实例,Amazon EC2 G7e实例的推理性能最高可提升2.3倍。

与前代实例相比,Amazon EC2 G7e实例的核心升级如下:

NVIDIA RTX PRO 6000 Blackwell GPU:相比Amazon EC2 G6e,Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存,用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。

NVIDIA GPUDirect P2P:对于单块GPU内存无法承载的模型,用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术,通过PCIe互连实现GPU间的直接通信,从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外,与G6e实例搭载的L40s GPU相比,G7e实例的GPU间带宽最高可提升4倍,大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务,并且这些GPU提供的GPU内存总容量可高达768GB。

网络性能:Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍,可满足小规模多节点工作负载的运行需求。同时,多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问(RDMA),有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage,与Amazon EC2 G6e实例相比,实例吞吐量最高可提升至1.2Tbps,助力用户更快加载模型。

Amazon EC2 G7e规格参数

Amazon EC2 G7e实例最高可配置8块NVIDIA RTX PRO 6000 Blackwell服务器版GPU,GPU内存总量最高可达768GB(单块GPU配备96GB内存),并搭载Intel Emerald Rapids处理器,支持最高192个vCPU、1600Gbps网络带宽、2048GiB系统内存以及15.2TB本地NVMe SSD存储。

Amazon EC2 G7e实例具体规格参数如下:

您可借助Amazon Deep Learning AMIs(DLAMI)运行机器学习工作负载,启动Amazon EC2 G7e实例,并通过亚马逊云科技管理控制台、Amazon CLI及SDK进行操作,搭配Amazon ECS、Amazon EKS可获得托管式体验。该实例对Amazon SageMaker AI的支持功能即将上线。

现已可用

Amazon EC2 G7e实例现已在美国东部(北弗吉尼亚州)与美国东部(俄亥俄州)的亚马逊云科技区域可用。如需了解该实例区域部署情况及未来规划,请参阅亚马逊云科技区域功能页面的Amazon CloudFormation资源标签页中搜索。

Amazon EC2 G7e实例支持On-Demand Instances、Savings Plan及Spot Instances三种方式购买,以及Dedicated Instances与Dedicated Hosts两种部署模式。定价详情参阅Amazon EC2定价页面。

即刻前往Amazon EC2控制台上手体验!更多信息请参阅Amazon EC2 G7e实例页面

亚马逊云科技区域功能页面:

https://builder.aws.com/build/capabilities/explore?tab=cfn-resources&trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

Amazon EC2定价页面:

https://aws.amazon.com/ec2/pricing

Amazon EC2 G7e实例页面:

https://aws.amazon.com/ec2/instance-types/g7e/?trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

本篇作者

Channy

亚马逊云科技新闻博客首席博主、首席开发者布道师。

新用户注册海外区域账户,可获得最高200美元服务抵扣金,覆盖Amazon Bedrock生成式AI相关服务。“免费计划”账户类型,确保零花费,安心试用。

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

点击阅读原文查看博客!获得更详细内容!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 4:55:40

SVPWM算法(空间电压矢量)Simulink仿真实战

SVPWM算法(空间电压矢量)simulink仿真: 1.模块划分清晰,易于学习和理解算法; 2.采用7段式svpwm,用异步电机作为负载; 3.赠送svpwm原理详解文档; 4.提供技术解答,带你快速入门svpwm算法! SVPWM(空间电压矢量调制&#x…

作者头像 李华
网站建设 2026/4/29 1:53:54

高频头锁频器LC72131锁相环调台方案 一、方案特色 本方案由单片机+锁相环电路芯片LC72...

高频头锁频器LC72131锁相环调台方案 一、方案特色 本方案由单片机锁相环电路芯片LC72131构成。 采用锁相环电路控制高频头调谐,杜绝了温度变化、电压波动引起的高频头频率漂移、跑台问题,锁定频率。 可以控制高频头、收音板调台。 用旋转编码器进行调台操…

作者头像 李华
网站建设 2026/5/1 21:00:15

AIClient-2-API实战手册:3步解锁Claude免费使用的完整方案

AIClient-2-API实战手册:3步解锁Claude免费使用的完整方案 【免费下载链接】AIClient-2-API Simulates Gemini CLI, Qwen Code, and Kiro client requests, compatible with the OpenAI API. It supports thousands of Gemini model requests per day and offers fr…

作者头像 李华
网站建设 2026/4/30 9:04:17

AI项目落地实战:DeepSeek-R1蒸馏模型Web服务部署全流程

AI项目落地实战:DeepSeek-R1蒸馏模型Web服务部署全流程 你是不是也遇到过这样的问题:手头有个不错的开源大模型,想快速搭个Web服务做产品原型,但卡在环境配置、依赖冲突、GPU调用这些细节上?今天咱们就来解决这个痛点…

作者头像 李华
网站建设 2026/4/24 18:38:52

文件夹加密首选!Wise Folder Hider,隐藏锁定全拿捏

谁懂啊!之前安利的加密工具没法处理文件夹,一堆私密资料只能散着加密,麻烦到想跺脚。 今天补上这款Wise Folder Hider,直接把文件、文件夹的隐私保护需求全搞定,重点是它是限时免费版,不用破解不用折腾&am…

作者头像 李华
网站建设 2026/5/3 18:03:34

NOFX AI交易系统终极指南:从策略创建到风险管理的完整解析

NOFX AI交易系统终极指南:从策略创建到风险管理的完整解析 【免费下载链接】nofx NOFX: Defining the Next-Generation AI Trading Operating System. A multi-exchange Al trading platform(Binance/Hyperliquid/Aster) with multi-Ai competition(deepseek/qwen/c…

作者头像 李华