news 2026/6/9 14:24:54

豆包风波后的破局者:智谱 AutoGLM 让“AI 手机”走向公共基建

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
豆包风波后的破局者:智谱 AutoGLM 让“AI 手机”走向公共基建

本期开源项目地址:https://github.com/zai-org/Open-AutoGLM

2025年12月,手机圈经历了一场从“豆包手机”的技术封锁,到智谱 AutoGLM 开源破局的过山车。这不仅是产品的迭代,更是一场关于流量分发权AI 代理(Agent)未来的深度博弈。

一、 豆包手机:被大厂围剿的“技术核试验”

豆包手机助手预览版发布后,凭借系统级 AI 引擎虚拟 AI 屏幕(后台静默操作)和云端协同三大技术,实现了“一句话调动手机功能”,引发全网抢购。

然而,这场创新迅速遭遇了“流量护城河”的反击。淘宝、美团、支付宝等主流 APP 随即出现登录异常或封号。

核心冲突:商业模式的重构

传统互联网依赖“流量漏斗”(点开APP→看广告→下单),而 AI 手机实现了“直连需求”(用户说话→AI 执行)。正如周鸿祎所言,当 AI 帮用户跳过了广告和首页,APP 的核心 KPI 面临失效。这是一场存量利益与新技术形态的决战。

二、 AutoGLM:开源破局,定义 AI 手机的“安卓时刻”

在封闭生态的博弈胶着之时,智谱 AI 于 12 月 9 日开源AutoGLM,将“手机操作”能力变成了全行业共享的基础设施。

什么是 AutoGLM?

这就好比给大模型装上了“手”和“眼”。它基于 visual-9b 模型,采用“Planner(规划)+ Grounder(定位)”架构,能像人一样看懂屏幕并模拟点击、滑动、输入。目前已支持微信、淘宝、美团等 50+ 款高频 APP。

AutoGLM vs 豆包手机:技术路线对比

维度豆包手机助手智谱 AutoGLM (开源版)
部署方式云端推理为主支持本地部署 (PC/端侧)
数据隐私需上传数据,存在黑盒数据不出设备,零上传
生态封闭性厂商封闭生态MIT/Apache-2.0 双协议开源
应用支持官方指定适配开发者可自由扩展垂直场景
抗风险能力易受大厂协议封锁模拟人类物理操作,更难被判定违规

三、 实战指引:如何拥有你的 AutoGLM

AutoGLM 的开源极大地降低了技术门槛,但对硬件仍有一定要求。

1. 硬件门槛

  • 显卡 (GPU):显存至少 8GB,推荐 16GB 以上(运行 9B 模型)。

  • 设备:Android 7.0+ 手机或模拟器(需开启 USB 调试)。

2. 部署极简流

无需从零编写复杂的视觉识别算法,开发者只需三步即可在本地跑通:

  1. 环境配置:Clone GitHub 仓库并安装依赖。

  2. 服务启动:使用vllm启动autoglm-phone-9b模型服务。

  3. 连接控制:通过 ADB 连接手机,即可用 Python 脚本发送指令。

    • 示例指令:agent.run("打开淘宝搜索无线耳机,然后去京东比价")

(详细代码与文档请访问 GitHub 仓库:zai-org/Open-AutoGLM)

四、 行业启示:从“平台闭环”到“直连需求”

AutoGLM 的开源标志着 AI Agent 正在经历它的“安卓时刻”:

  1. 对开发者:无需造轮子,可直接基于框架开发垂直领域的“AI 助理”(如专门抢票、专门比价的 Agent)。

  2. 对手机厂商:中小厂商无需自研底层模型,即可快速集成 AI 操控能力,甚至实现数据的私有化部署,主打隐私安全牌。

  3. 对商业模式:未来的 APP 可能需要主动提供 API 给 AI 调用,或者接受“混合模式”——用户想逛街时找 APP,想办事时找 AI。

总结

豆包撕开了旧秩序的裂缝,而 AutoGLM 则递给了所有人一把铲子。智谱的开源策略将技术从“巨头垄断”推向了“大众共创”。未来已来,这一次,手机真的开始“听”你的了。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 19:41:52

Python异步Redis客户端终极指南:快速上手与实战应用

Python异步Redis客户端终极指南:快速上手与实战应用 【免费下载链接】aioredis-py asyncio (PEP 3156) Redis support 项目地址: https://gitcode.com/gh_mirrors/ai/aioredis-py 在现代Web开发中,异步编程已经成为提升应用性能的关键技术。Pytho…

作者头像 李华
网站建设 2026/6/9 4:55:25

Conan依赖管理终极指南:从实战场景到企业级应用

Conan依赖管理终极指南:从实战场景到企业级应用 【免费下载链接】conan Conan - The open-source C and C package manager 项目地址: https://gitcode.com/gh_mirrors/co/conan 还在为C项目中的依赖地狱而头疼吗?不同平台编译环境配置复杂、第三…

作者头像 李华
网站建设 2026/6/9 18:37:27

如何快速获取Times New Roman字体:完整下载安装指南

如何快速获取Times New Roman字体:完整下载安装指南 【免费下载链接】TimesNewRoman字体文件下载 Times New Roman 字体文件下载 项目地址: https://gitcode.com/open-source-toolkit/74370 还在为文档排版发愁吗?想给你的作品增添专业气质&#…

作者头像 李华
网站建设 2026/6/6 11:51:29

Volumio 2终极指南:打造专业级高保真音乐播放系统

Volumio 2终极指南:打造专业级高保真音乐播放系统 【免费下载链接】Volumio2 Volumio 2 - Audiophile Music Player 项目地址: https://gitcode.com/gh_mirrors/vo/Volumio2 想要在树莓派或其他设备上构建一个专业级的开源音乐系统吗?Volumio 2作…

作者头像 李华
网站建设 2026/6/9 14:25:55

我的C盘满了,快爆了!我该怎么办?

我的C盘满了,快爆了!我该怎么办?your c: drive is full and your computer is slowing down or refusing to save files, this is a common and solvable problem, start by pausing and not deleting things randomly, i will walk you thro…

作者头像 李华
网站建设 2026/6/8 19:19:01

高效团队协作的完整指南:GPTs项目多人编辑实战手册

想要在GPTs项目中实现完美的团队协作吗?这个汇集了数百个专业GPT提示词的宝藏项目,为开发者团队提供了前所未有的协作机会。无论你是产品经理、开发工程师还是设计师,这里都有适合你的角色定位和工作流程。 【免费下载链接】GPTs GPTs - 一个…

作者头像 李华