news 2026/7/6 5:21:30

Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结

Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结


一、部署配置

项目
模型Qwen3.5-397B-A17B-FP8
架构MoE(512 experts, 10/token, 60 层, 48 linear + 12 full attn)
量化FP8
上下文256K(默认),优化后限 65K
硬件4×H100 8卡(32 GPU total)
TP8(单节点 8 卡一个 TP 组)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/6 5:20:33

AI Agent开发实战指南:从GitHub趋势项目到工程化落地

🚀 30款热门AI模型一站整合,DeepSeek/GLM/Qwen 随心用,限时 5 折。 👉 点击领海量免费额度 这次我们来看一个 GitHub 趋势榜单的深度解析。榜单本身只是一个结果,但背后反映的是 AI Agent 和 AI 编程领域的技术风向…

作者头像 李华
网站建设 2026/7/6 5:18:31

终极指南:VLC Android电视版 - 打造完美智能电视媒体中心

终极指南:VLC Android电视版 - 打造完美智能电视媒体中心 【免费下载链接】vlc-android VLC for Android, Android TV and ChromeOS 项目地址: https://gitcode.com/gh_mirrors/vl/vlc-android 在智能电视时代,用户常常面临格式兼容性差、操作复…

作者头像 李华
网站建设 2026/7/6 5:16:10

RAG 入门:检索增强生成是什么,解决什么问题

RAG 入门:检索增强生成是什么,解决什么问题大模型很聪明,但有两个硬伤:知识过时、不知道你的私有数据。RAG(检索增强生成)就是解决这个问题的——先从知识库检索相关内容,再让大模型基于检索结果…

作者头像 李华
网站建设 2026/7/6 5:08:20

攻克硬件兼容性难题:黑苹果EFI配置实战手册

攻克硬件兼容性难题:黑苹果EFI配置实战手册 【免费下载链接】Hackintosh Hackintosh long-term maintenance model EFI and installation tutorial 项目地址: https://gitcode.com/gh_mirrors/ha/Hackintosh 在非苹果设备上运行macOS系统是技术爱好者的共同追…

作者头像 李华
网站建设 2026/7/6 5:07:57

终极Windows系统优化工具:WinUtil深度解析与高级应用指南

终极Windows系统优化工具:WinUtil深度解析与高级应用指南 【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil 在当今数字时代&#xf…

作者头像 李华