GLM-4.5-Air-FP8开源：轻量高效智能体基座新体验-洪萨配资

导语

【免费下载链接】GLM-4.5-Air-FP8GLM-4.5系列模型是专为智能体设计的基座模型。GLM-4.5拥有3550亿总参数和320亿活跃参数，而GLM-4.5-Air采用更紧凑的设计，总参数为1060亿，活跃参数为120亿。GLM-4.5模型统一了推理、编程和智能体能力，以满足智能体应用的复杂需求。项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air-FP8

智谱AI正式开源GLM-4.5-Air-FP8模型，这款轻量级智能体基座以1060亿总参数、120亿活跃参数的紧凑设计，结合FP8量化技术，在保持高性能的同时显著降低部署门槛，为智能体应用开发带来新可能。

行业现状

随着大语言模型技术的快速迭代，智能体（Agent）已成为人工智能领域的重要发展方向。当前行业面临的核心挑战在于如何平衡模型性能与部署成本——一方面，复杂的智能体应用需要强大的推理、工具使用和多任务处理能力；另一方面，企业和开发者对模型的部署效率、硬件成本和运行速度有越来越高的要求。据相关调研数据显示，2024年全球智能体相关应用增长率超过150%，但部署成本和技术门槛成为制约其普及的主要因素。

在这样的背景下，模型优化技术（如量化、稀疏化）和架构创新（如MoE架构）成为突破瓶颈的关键。FP8量化技术作为新一代低精度计算方案，相比传统的BF16或INT4量化，能够在保持精度损失最小化的前提下，大幅降低显存占用和计算资源需求，成为轻量化部署的理想选择。

产品/模型亮点

1. 专为智能体设计的混合推理架构

GLM-4.5-Air-FP8采用创新的混合推理模型，提供两种工作模式：思考模式（Thinking Mode）适用于复杂推理和工具使用场景，模型会生成中间思考过程，提升任务规划和问题解决能力；非思考模式（Non-thinking Mode）则针对即时响应场景，直接输出结果以提高效率。这种设计使模型能灵活适应不同智能体应用场景，从复杂决策支持到实时交互应答均能胜任。

2. FP8量化带来的高效部署优势

作为系列中的轻量版本，GLM-4.5-Air-FP8通过FP8量化技术实现了性能与效率的平衡。与BF16版本相比，FP8格式将模型体积减少约50%，在H100 GPU上仅需2张即可实现基础推理，4张即可支持完整128K上下文长度，显著降低了硬件门槛。这种高效性使中小企业和开发者能够以更低成本部署高性能智能体，推动智能体技术的普及应用。

3. 兼顾性能与效率的参数配置

模型采用1060亿总参数与120亿活跃参数的MoE（Mixture of Experts）架构，在保持轻量化部署特性的同时，仍能提供强大的智能体能力。根据官方技术数据，GLM-4.5-Air在多项行业标准基准测试中取得59.8分的优异成绩，与同量级模型相比具有明显竞争力，证明了其"小而强"的产品定位。

4. 广泛兼容的商业与开发支持

GLM-4.5-Air-FP8采用MIT开源许可证，允许商业使用和二次开发，为开发者社区提供了灵活的应用空间。模型已集成到Hugging Face Transformers、vLLM和SGLang等主流推理框架，并提供详细的部署指南和API文档，降低了开发接入门槛。同时支持Lora等高效微调方法，便于开发者根据特定场景需求进行定制化优化。

行业影响

GLM-4.5-Air-FP8的开源将对智能体技术生态产生多重影响：

首先，降低智能体开发门槛。通过FP8量化和优化的硬件需求，更多企业和开发者能够参与智能体应用开发，加速行业创新。特别是中小企业和研究机构，无需大规模硬件投入即可构建高性能智能体系统。

其次，推动智能体技术标准化。模型统一了推理、编程和智能体能力，提供标准化的工具调用接口和推理流程，有助于形成行业通用的智能体开发范式。

再者，促进量化技术普及应用。作为FP8量化技术在智能体基座模型中的重要实践，GLM-4.5-Air-FP8的开源将推动低精度计算技术在大语言模型领域的进一步发展和应用，为行业树立高效部署新标杆。

最后，加速智能体商业化落地。轻量化部署特性使智能体技术能够更广泛地应用于边缘计算、嵌入式设备等资源受限场景，拓展智能体的应用边界，从云端服务延伸至终端设备。

结论/前瞻

GLM-4.5-Air-FP8的开源标志着智能体基座模型进入"高性能+轻量化"并行发展的新阶段。通过创新的混合推理架构、高效的FP8量化技术和开放的社区策略，该模型为智能体开发提供了兼具性能与效率的新选择。

展望未来，随着硬件技术的进步和模型优化技术的发展，智能体基座模型将继续朝着"更小、更快、更强"的方向演进。GLM-4.5-Air-FP8的开源实践，不仅为当前智能体应用开发提供了实用工具，也为行业探索高效能智能体技术路径提供了重要参考。对于开发者而言，这既是构建创新智能体应用的新起点，也是参与开源AI生态建设的重要机遇。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考