news 2026/4/23 17:32:03

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
百度文心大模型4.5全系列源代码开放 配套API服务同步上线

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

2025年6月30日,百度正式对外宣布文心大模型4.5系列完成开源工作,并同步推出API服务接口。此次开源行动涵盖10款不同规格的模型产品,参数规模从470亿混合专家(MoE)架构延伸至3亿轻量级稠密模型,全面覆盖文本生成、多模态交互等主流AI应用场景。开发者可通过飞桨星河社区、HuggingFace平台及百度智能云千帆大模型平台获取完整的模型权重与代码资源,所有开源资产均采用Apache 2.0协议授权,为商业应用与学术研究提供灵活支持。

百度文心大模型4.5开源家族在技术架构上实现重大突破,创新性地提出多模态异构模型设计。该架构专门优化大语言模型向多模态能力扩展的持续预训练流程,在确保文本任务性能不降反升的前提下,通过多模态混合专家预训练机制、高效训练推理引擎以及模态专属后训练策略等三大技术支柱,显著增强模型对跨模态信息的理解能力。全系列模型均基于飞桨深度学习框架开发,在大语言模型预训练阶段实现47%的FLOPs利用率(MFU),达到行业领先的计算效率水平。

如上图所示,该架构图清晰呈现了文心大模型4.5系列的产品矩阵,通过A47B、A3B和0.3B三个技术分支构建起完整的模型生态。这一模块化设计充分体现了百度在大模型架构创新上的系统性思考,为开发者提供了从超大规模到轻量化部署的全场景技术选择。

第三方评测数据显示,文心大模型4.5系列在12项国际权威基准测试中刷新性能纪录,尤其在指令理解准确率、世界知识覆盖率、视觉语义解析和跨模态推理速度等关键指标上表现突出。文本模型方面,其在MMLU、HumanEval等主流评测中全面超越DeepSeek-V3和Qwen3等竞品;多模态领域更实现突破性进展,依托精细化视觉感知能力与海量视觉常识库,成功构建"思考-执行"一体化认知框架,在VQAv2、Flickr30K等多模态评测中性能超越闭源的OpenAI o1模型。轻量化产品矩阵中,210亿参数的文心4.5-21B-A3B-Base文本模型与同量级Qwen3性能持平,而280亿参数的文心4.5-VL-28B-A3B多模态模型不仅在同参数开源模型中位列第一,甚至可与320亿参数的Qwen2.5-VL展开性能竞争。

作为国内AI技术研发的先行者,百度构建了从算力基础设施、深度学习框架、大模型算法到行业应用的全栈技术体系。此次开源行动中,基于飞桨平台多年积累的开源生态优势,同步发布文心大模型开发套件ERNIEKit和高效部署工具FastDeploy,形成覆盖模型训练、微调优化、推理部署的全流程技术支持。特别值得关注的是,该系列模型通过飞桨框架实现多芯片架构兼容,可无缝适配CPU、GPU及各类国产加速芯片,大幅降低企业级应用的部署门槛。这种"框架+模型"的双层开源模式,标志着我国大模型技术在生态开放度与产业实用性方面进入新阶段,将加速AI技术在智能制造、智慧城市、医疗健康等关键领域的深度渗透。

随着文心大模型4.5系列的开源,百度正在重塑AI产业的创新格局。Apache 2.0协议下的商业友好特性,结合飞桨生态丰富的工具链支持,预计将吸引超过10万家企业加入模型应用开发。这种开放式创新模式不仅有利于构建良性竞争的技术生态,更能通过开发者社区的集体智慧推动模型持续进化。未来,随着模型轻量化技术的成熟与垂直领域知识库的完善,文心大模型有望在边缘计算设备、嵌入式系统等终端场景实现规模化应用,最终形成"通用智能+行业专精"的多层次AI服务体系,为数字经济发展注入新动能。

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 12:32:27

PCB实战及拓展坞实现

差分信号走线设计要点保持对称性 差分对的走线应尽量保持对称,包括长度、宽度和间距。不对称会导致信号偏移,影响信号完整性。控制阻抗 差分阻抗需与传输线特性阻抗匹配,通常为90Ω或100Ω。使用PCB叠层计算工具确定线宽和间距,确…

作者头像 李华
网站建设 2026/4/23 14:44:54

突破AI记忆瓶颈:M3-Agent多模态智能体如何重塑长时序交互能力

突破AI记忆瓶颈:M3-Agent多模态智能体如何重塑长时序交互能力 【免费下载链接】M3-Agent-Control 项目地址: https://ai.gitcode.com/hf_mirrors/ByteDance-Seed/M3-Agent-Control 2025-09-13 17:03:27 一、行业痛点:当前多模态AI的"短期记…

作者头像 李华
网站建设 2026/4/16 8:01:57

在线课堂微信小程序毕设源码(源码+lw+部署文档+讲解等)

博主介绍:✌ 专注于VUE,小程序,安卓,Java,python,物联网专业,有18年开发经验,长年从事毕业指导,项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题,我会尽力帮助你。一、…

作者头像 李华