news 2026/3/25 16:17:14

手机也能跑的8B大模型!LFM2-8B-A1B高效登场

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
手机也能跑的8B大模型!LFM2-8B-A1B高效登场

手机也能跑的8B大模型!LFM2-8B-A1B高效登场

【免费下载链接】LFM2-8B-A1B项目地址: https://ai.gitcode.com/hf_mirrors/LiquidAI/LFM2-8B-A1B

Liquid AI推出全新混合架构大模型LFM2-8B-A1B,以83亿总参数、15亿激活参数的MoE(Mixture of Experts)设计,实现高端手机、平板等边缘设备的本地化部署,重新定义边缘AI的性能标准。

近年来,大语言模型正从云端向终端设备快速渗透。据市场研究机构Counterpoint数据,2024年全球AI手机出货量预计突破5亿部,终端侧AI计算需求呈现爆发式增长。然而现有模型普遍面临"性能-效率"两难:高性能模型往往体积庞大,轻量级模型又难以满足复杂任务需求。在此背景下,Liquid AI推出的LFM2-8B-A1B通过创新架构设计,在83亿总参数规模下仅激活15亿参数进行计算,成功破解这一行业痛点。

该模型的核心突破在于其独特的混合架构设计:融合18个双门控短程LIV卷积块与6个分组查询注意力(GQA)块,既保留卷积网络的局部特征提取效率,又具备Transformer架构的长程依赖建模能力。这种设计使模型在保持32,768 tokens上下文窗口的同时,通过量化技术实现了高端移动设备的流畅运行。官方测试数据显示,LFM2-8B-A1B在Galaxy S24 Ultra等旗舰手机上的解码速度超越Qwen3-1.7B等同类模型,同时在MMLU(64.84%)、GSM8K(84.38%)等权威 benchmarks上达到3-4B稠密模型水平。

多语言支持是另一大亮点,模型原生支持英语、中文、阿拉伯语等8种语言,特别优化了代码理解与知识问答能力。其创新的工具调用机制通过特殊标记实现函数定义、调用、执行和结果解析的全流程支持,为本地化智能助手、RAG应用、数据提取等场景提供强大技术支撑。开发者可通过Hugging Face Transformers、vLLM或llama.cpp等多种框架轻松部署,并提供完整的SFT和DPO微调教程,降低行业应用门槛。

LFM2-8B-A1B的推出标志着边缘AI进入"大模型本地化"新阶段。对于终端设备厂商,该模型可显著提升设备端AI交互体验而无需依赖云端;企业用户则能在保护数据隐私的前提下部署智能应用;开发者生态将因此加速形成针对特定场景的轻量化微调模型。随着边缘计算能力的持续提升与模型效率的优化,未来消费者有望在手机、汽车、智能家居等更多终端上体验到大模型带来的智能服务,推动AI应用从"在线依赖"向"离线可用"转变。

Liquid AI通过LFM2系列模型展示了MoE架构在边缘计算场景的巨大潜力。这种"大模型、小激活"的设计思路,或将成为平衡性能与效率的行业新标准,为AI技术的普适化应用开辟新路径。

【免费下载链接】LFM2-8B-A1B项目地址: https://ai.gitcode.com/hf_mirrors/LiquidAI/LFM2-8B-A1B

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/24 13:05:12

JFlash下载自动烧录脚本设计示例

JFlash自动烧录脚本实战:从手动操作到产线级自动化你有没有经历过这样的场景?产线上的工人一遍遍打开JFlash,点“连接”,选固件,点击“烧录”……重复上百次后,终于有人把文件选错了——结果一批板子功能异…

作者头像 李华
网站建设 2026/3/24 0:18:27

腾讯HunyuanCustom:开启多模态视频定制新纪元

腾讯HunyuanCustom:开启多模态视频定制新纪元 【免费下载链接】HunyuanCustom HunyuanCustom是基于HunyuanVideo的多模态定制化视频生成框架,支持文本、图像、音频、视频等多种输入方式,能生成主体一致性强的视频。它通过模态特定条件注入机制…

作者头像 李华
网站建设 2026/3/23 22:03:40

Keil新建工程核心要点:聚焦ARM Cortex-M

Keil新建工程核心要点:聚焦ARM Cortex-M在嵌入式开发的世界里,当你第一次点亮一块STM32板子、实现一个GPIO翻转,背后真正“点火启动”的,往往不是你写的main()函数,而是那一段看似神秘的汇编代码——启动文件。而这一切…

作者头像 李华
网站建设 2026/3/20 18:23:58

GLM-4-32B新模型:320亿参数实现代码推理大突破

GLM-4-32B新模型:320亿参数实现代码推理大突破 【免费下载链接】GLM-4-32B-0414 项目地址: https://ai.gitcode.com/zai-org/GLM-4-32B-0414 导语 GLM系列再添重磅成员——GLM-4-32B-0414系列大模型正式发布,凭借320亿参数规模在代码生成、复杂…

作者头像 李华
网站建设 2026/3/19 23:39:17

Qwen3-1.7B-FP8:17亿参数AI双模式推理新标杆

Qwen3-1.7B-FP8:17亿参数AI双模式推理新标杆 【免费下载链接】Qwen3-1.7B-FP8 Qwen3-1.7B的 FP8 版本,具有以下功能: 类型:因果语言模型 训练阶段:训练前和训练后 参数数量:17亿 参数数量(非嵌入…

作者头像 李华
网站建设 2026/3/23 3:14:51

腾讯开源HunyuanWorld-Voyager:单图生成3D探索视频新体验

腾讯开源HunyuanWorld-Voyager:单图生成3D探索视频新体验 【免费下载链接】HunyuanWorld-Voyager HunyuanWorld-Voyager是腾讯开源的视频扩散框架,能从单张图像出发,结合用户自定义相机路径,生成具有世界一致性的3D点云序列。它可…

作者头像 李华