news 2026/3/18 17:12:47

AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日发布了一款突破性的轻量级文本到图像生成模型Nitro-E,以仅304M的参数量实现了高效AI绘图能力,尤其在推理速度上展现出惊人表现——其蒸馏版本在单张AMD Instinct MI300X GPU上可达到每秒39.3张图像的生成速度,且仅需4步推理即可完成,为AI图像生成领域带来了效率革命。

当前AI图像生成领域正面临着模型规模与性能之间的平衡难题。主流模型如Stable Diffusion系列参数量普遍在数十亿级别,不仅对硬件资源要求高,且生成速度难以满足实时应用需求。行业正迫切寻求轻量化、高性能的解决方案,以推动AI绘图技术在边缘设备、实时交互等场景的普及应用。在此背景下,AMD Nitro-E的推出恰逢其时,以"轻量高效"为核心定位,重新定义了轻量级文本到图像模型的性能标准。

Nitro-E的核心优势体现在三大维度:极致轻量化架构、突破性推理速度与创新技术设计。该模型采用全新的Efficient Multimodal Diffusion Transformer(E-MMDiT)架构,通过多重创新技术实现了效率突破。其采用高度压缩的视觉tokenizer和多路径压缩模块,显著减少了计算令牌数量;创新的Alternating Subregion Attention(ASA)技术通过子区域内注意力计算降低开销;而AdaLN-affine模块则实现了transformer块中调制参数的高效计算。这些技术共同造就了仅304M参数的轻量化模型体量。

在性能表现上,Nitro-E创造了新的效率纪录:基础版本在单张MI300X GPU上实现18.8张/秒的吞吐量(512px图像,批处理大小32),而蒸馏版本更是将这一数字提升至39.3张/秒,且将推理步骤从标准的20步大幅缩减至仅需4步。更值得关注的是其训练效率,Nitro-E从 scratch 训练仅需1.5天,在配备8张AMD Instinct MI300X GPU的单节点上即可完成,显著降低了模型开发成本。该模型系列包含三个版本:基础版Nitro-E-512px(20步推理)、蒸馏版Nitro-E-512px-dist(4步推理)以及采用Group Relative Policy Optimization (GRPO)策略优化的Nitro-E-512px-GRPO版本,满足不同场景需求。

Nitro-E的推出将对AI图像生成领域产生多重影响。首先,其极致的推理效率为实时图像生成应用铺平道路,有望推动AI绘图在直播、游戏、AR/VR等交互式场景的深度集成。其次,304M的轻量化模型为边缘设备部署提供了可能,使智能手机、嵌入式系统等终端设备也能运行高质量AI绘图模型。对于企业用户而言,Nitro-E极低的训练和推理成本将显著降低AI图像生成技术的采用门槛,尤其利好内容创作、设计、广告等行业的中小企业。

从技术趋势看,Nitro-E印证了AI生成模型"轻量化、高效率"的发展方向。AMD通过创新架构设计而非单纯增加参数量来提升性能的思路,可能成为未来模型优化的主流路径。该模型采用MIT开源许可,并已开放源代码和技术博客,这将加速高效扩散模型技术的研究与应用。随着硬件与软件协同优化的深入,我们有理由期待轻量级AI生成模型在保持质量的同时,实现更惊人的速度突破,推动AI创意工具向实时化、普及化方向加速发展。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/15 22:24:54

Equalizer APO终极音频调校指南:从入门到精通的全方位配置方案

Equalizer APO终极音频调校指南:从入门到精通的全方位配置方案 【免费下载链接】equalizerapo Equalizer APO mirror 项目地址: https://gitcode.com/gh_mirrors/eq/equalizerapo 想要彻底改变您的音频体验吗?Equalizer APO作为一款开源的高级音频…

作者头像 李华
网站建设 2026/3/13 22:40:38

智能家庭影院革命:Jellyfin Android TV如何让大屏娱乐回归纯粹?

智能家庭影院革命:Jellyfin Android TV如何让大屏娱乐回归纯粹? 【免费下载链接】jellyfin-androidtv Android TV Client for Jellyfin 项目地址: https://gitcode.com/gh_mirrors/je/jellyfin-androidtv 还在为不同设备间的媒体文件同步而烦恼吗…

作者头像 李华
网站建设 2026/3/18 6:39:50

网盘直链下载助手终极指南:一键获取真实下载链接的完整教程

网盘直链下载助手终极指南:一键获取真实下载链接的完整教程 【免费下载链接】Online-disk-direct-link-download-assistant 可以获取网盘文件真实下载地址。基于【网盘直链下载助手】修改(改自6.1.4版本) ,自用,去推广…

作者头像 李华
网站建设 2026/3/17 22:41:52

WinDbg Preview下载安装失败原因深度剖析

WinDbg Preview 下载失败?别急,一文看懂背后的技术真相你是不是也遇到过这种情况:急需用 WinDbg 分析一个蓝屏 dump 文件,结果打开 Microsoft Store 准备下载WinDbg Preview,点击“获取”后却卡在“准备中”不动了&…

作者头像 李华
网站建设 2026/3/17 2:33:01

NCMDumpGUI完整教程:轻松解密网易云音乐加密文件

NCMDumpGUI完整教程:轻松解密网易云音乐加密文件 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐的NCM加密文件无法在其他播放器中…

作者头像 李华
网站建设 2026/3/15 5:58:32

购买GPU算力租用服务:高效运行CosyVoice3语音模型的首选方案

购买GPU算力租用服务:高效运行CosyVoice3语音模型的首选方案 在生成式AI席卷内容创作领域的今天,语音合成技术正经历一场静默却深刻的变革。过去需要专业录音棚和数小时后期处理的配音任务,如今只需一段3秒音频、一条文本指令,就能…

作者头像 李华