news 2026/1/10 1:36:22

Mobile GUI Agent相关学习资料整理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Mobile GUI Agent相关学习资料整理

Mobile GUI Agent

通用 GUI 智能体基座 MAI-UI

大佬说

唐杰THU

实践派

大润发杀鱼工:RL的一整年

天晴:用 RL 做 LLM 后训练:半年踩过的坑与心得

周星星:Agent 元年复盘

无大算力时,LLM 还有哪些值得做的研究

论文

自所&腾讯团队首次揭示大模型RL新机制

RL、Pre-training、Mid-training 对模型能力提升的区别

理解 LLM RL 稳定性的 insight 和实用 recipe

GPT-5-Thinking新训练方法

总结内容

深挖PPO,聊聊前身TRPO

大模型强化学习算法的演进与对比 (PPO, GRPO, DAPO, GSPO, SAPO)

LLM模型评估方法

青稞AI:唐杰和 Karpathy 的共识:AI 应用的本质是替代或增强人类工种,而不是为了做 App 而做 App
深入理解 KL 散度

多模态大模型主流架构

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/2 10:49:46

GitHub Wiki文档维护:Miniconda-Python3.10生成自动化API文档

GitHub Wiki文档维护:Miniconda-Python3.10生成自动化API文档 在开源项目和团队协作日益频繁的今天,一个常被忽视却极其关键的问题浮出水面:代码更新了,但文档还停留在几个月前。这种“文档滞后”现象不仅让新成员上手困难&#x…

作者头像 李华
网站建设 2026/1/2 10:49:46

Docker build缓存利用:Miniconda-Python3.10加速镜像重建过程

Docker build缓存利用:Miniconda-Python3.10加速镜像重建过程 在数据科学与AI开发的日常中,你是否经历过这样的场景?刚刚修改了一行代码,却要重新跑一遍漫长的依赖安装流程——conda慢悠悠地下载PyTorch、numpy、pandas……哪怕这…

作者头像 李华
网站建设 2026/1/2 12:20:39

Dockerfile最佳实践:基于Miniconda-Python3.10构建最小AI镜像

Dockerfile最佳实践:基于Miniconda-Python3.10构建最小AI镜像 在现代AI项目开发中,一个常见的痛点是:“代码在我机器上跑得好好的,怎么一到别人环境就报错?”——这种“依赖地狱”问题不仅浪费时间,更严重影…

作者头像 李华
网站建设 2026/1/2 11:48:19

Python3.10性能评测:Miniconda环境下PyTorch训练速度实测

Python3.10性能评测:Miniconda环境下PyTorch训练速度实测 在深度学习项目开发中,一个常见的困扰是:同样的代码在不同机器上运行结果不一致,甚至无法运行。问题往往不出在模型本身,而是隐藏在环境配置的细节里——Pytho…

作者头像 李华
网站建设 2025/12/30 20:13:30

服务器操作系统:数字世界的坚实基石

服务器操作系统是专为服务器环境设计的系统软件,负责管理硬件资源、提供核心服务并保证业务应用的稳定、高效与安全运行。它与个人操作系统截然不同,其设计目标是极高的可靠性、可扩展性、可维护性和强大的网络与多用户支持能力,是支撑从网站…

作者头像 李华
网站建设 2025/12/30 20:13:14

重庆思庄Linux技术分享-sudo -i和sudo su的区别

我们在使用Linux时,经常会遇到关于用户权限的问题,每个文件都对不同的用户身份设定了不同的权限。最常见的场景就是:获取root权限来执行命令。而Linux中的su和sudo就是关于系统权限的命令,两者都可以让你使用root权限,…

作者头像 李华