news 2026/3/12 15:04:38

3个步骤搞定UI-TARS-desktop开发环境搭建:源码编译到运行全攻略

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
3个步骤搞定UI-TARS-desktop开发环境搭建:源码编译到运行全攻略

3个步骤搞定UI-TARS-desktop开发环境搭建:源码编译到运行全攻略

【免费下载链接】UI-TARS-desktopA GUI Agent application based on UI-TARS(Vision-Lanuage Model) that allows you to control your computer using natural language.项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop

想体验用自然语言控制电脑的黑科技吗?UI-TARS-desktop是一款基于视觉语言模型的GUI智能助手,能帮你通过文字指令完成各种电脑操作。本文将带你从零开始,用3个步骤完成开发环境搭建,包括源码编译、环境配置和运行调试,即使是技术小白也能轻松上手。

需求定位:你需要这款工具吗?

如果你符合以下任一情况,那这篇指南就是为你准备的:

  • 想开发能理解屏幕内容的AI助手
  • 希望通过自然语言控制电脑操作
  • 对Electron+TypeScript跨平台开发感兴趣
  • 需要本地化运行视觉语言模型应用

UI-TARS-desktop能让你告别繁琐的鼠标点击,直接用文字命令让电脑完成任务,无论是浏览器操作还是桌面应用控制,都能轻松实现。

准备工具清单:开发环境必备

核心工具安装

在开始前,请确保你的电脑已安装以下工具(版本要严格匹配哦!):

  1. Node.js v20.x

    • 目标:提供JavaScript运行环境
    • 操作:从Node.js官网下载对应系统安装包
    • 验证:打开终端输入node -v,显示v20.x.x即为成功
  2. pnpm v9.10.0+

    • 目标:高效管理项目依赖
    • 操作:安装Node.js后执行npm install -g pnpm
    • 验证:终端输入pnpm -v,显示9.10.0以上版本
  3. Git

    • 目标:获取项目源码
    • 操作:根据你的系统从Git官网下载安装
    • 验证:终端输入git --version,显示版本号即为成功

环境检测工具

为了确保环境配置正确,我们准备了一键检测脚本,复制以下命令到终端执行:

# 创建环境检测脚本 cat > env-check.sh << 'EOF' #!/bin/bash echo "=== UI-TARS环境检测工具 ===" node -v | grep -q "v20." && echo "✅ Node.js版本符合要求" || echo "❌ 请安装Node.js v20.x" pnpm -v | grep -q "9.10" && echo "✅ pnpm版本符合要求" || echo "❌ 请安装pnpm 9.10.0+" git --version > /dev/null && echo "✅ Git已安装" || echo "❌ 请安装Git" echo "==========================" EOF # 赋予执行权限并运行 chmod +x env-check.sh && ./env-check.sh

执行后如果看到三个✅,就可以放心进入下一步啦!

实施步骤:3步搭建开发环境

步骤1:获取源码

目标:将项目代码下载到本地 操作:

# 克隆代码仓库 git clone https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop cd UI-TARS-desktop

验证:执行ls命令,能看到appsdocspackages等目录即为成功

项目结构速览:

UI-TARS-desktop/ ├─ apps/ui-tars/ # 主应用目录(重点关注) │ ├─ src/main/ # 主进程代码 │ ├─ src/renderer/ # 界面渲染代码 │ └─ images/ # 应用截图资源 ├─ docs/ # 项目文档 └─ packages/ # 核心功能模块

步骤2:安装依赖

目标:一键安装所有项目依赖 操作:

# 配置国内镜像加速(可选但推荐) pnpm config set registry https://registry.npmmirror.com # 安装依赖 pnpm install

验证:终端显示Packages installed successfully,且项目根目录出现node_modules文件夹

避坑小贴士:如果安装过程卡住,按Ctrl+C终止后,删除node_modules文件夹和pnpm-lock.yaml文件,重新执行pnpm install

步骤3:启动开发环境

目标:运行应用并验证功能 操作:

# 进入主应用目录 cd apps/ui-tars # 启动开发模式 pnpm run dev

验证:等待编译完成后,会自动弹出应用窗口,显示UI-TARS Desktop欢迎界面

问题解决:避坑指南

依赖安装失败

点击展开解决方案

错误提示

ERROR: Cannot install in Homebrew on ARM processor in Intel default prefix (/usr/local)

解决方法:安装Rosetta 2(仅适用于Apple Silicon芯片Mac)

softwareupdate --install-rosetta

编译报错node-gyp相关

点击展开解决方案

错误提示

gyp: No Xcode or CLT version detected!

解决方法:安装Xcode命令行工具(仅适用于Mac)

xcode-select --install

启动后白屏

点击展开解决方案

可能原因:Vite配置错误或依赖缺失

解决方法

  1. 检查是否安装了所有依赖:pnpm install
  2. 清除缓存后重试:pnpm run dev -- --force
  3. 检查配置文件:apps/ui-tars/electron.vite.config.ts

权限配置:按模式选择

新手模式

macOS系统
  1. 将应用拖入应用程序文件夹:

  1. 开启必要权限:
    • 打开"系统设置" → "隐私与安全性"
    • 在"辅助功能"和"屏幕录制"中勾选UI-TARS

Windows系统
  1. 双击安装包,当出现SmartScreen提示时,点击"更多信息" → "仍要运行":

  1. 安装过程中全部点击"下一步"即可

高级模式(适合开发者)

如果你需要修改源码并调试,可以配置额外权限:

# macOS终端命令行授权(需管理员权限) sudo sqlite3 /Library/Application\ Support/com.apple.TCC/TCC.db "INSERT INTO access VALUES('kTCCServiceAccessibility','com.yourcompany.uitars',0,1,1,NULL,NULL,NULL,'UNUSED',NULL,0,1665687402);"

进阶技巧:开发提效指南

远程调试

需要在多设备上测试?使用以下命令启动远程调试模式:

pnpm run debug -- --remote-debugging-port=9222

然后在另一台设备的浏览器中访问http://<你的IP>:9222,即可远程调试应用。

热重载原理

UI-TARS-desktop使用Vite的热模块替换(HMR)功能,修改代码后无需重启应用:

  1. 渲染进程代码(src/renderer/):实时更新,无刷新
  2. 主进程代码(src/main/):自动重启主进程,保持窗口状态

效率加速器:使用VSCode的Electron插件,可以直接在编辑器中设置断点调试。

推荐开发工具

  1. VSCode:内置TypeScript支持和调试工具
  2. Electron DevTools:专门用于Electron应用的调试扩展
  3. PNPM Workspace:高效管理多包项目依赖

总结

通过以上步骤,你已经成功搭建了UI-TARS-desktop的开发环境!现在你可以:

  • 修改源码自定义功能
  • 调试新的视觉语言模型
  • 开发自己的自然语言指令功能

官方文档:docs/quick-start.md API接口定义:packages/ui-tars/sdk/src/index.ts 贡献指南:CONTRIBUTING.md

开始你的AI桌面助手开发之旅吧!遇到问题可以查阅项目文档或在社区寻求帮助。

【免费下载链接】UI-TARS-desktopA GUI Agent application based on UI-TARS(Vision-Lanuage Model) that allows you to control your computer using natural language.项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/8 21:28:29

Z-Image-Turbo工业设计应用:产品原型图生成部署实战

Z-Image-Turbo工业设计应用&#xff1a;产品原型图生成部署实战 1. 为什么工业设计师需要Z-Image-Turbo&#xff1f; 在工业设计工作流中&#xff0c;从概念草图到高保真原型图往往要经历多次反复&#xff1a;手绘→建模→渲染→修图→客户反馈→再修改。这个过程动辄数天&am…

作者头像 李华
网站建设 2026/3/8 18:01:13

Heygem批量模式实测:一次上传多视频省时省力

Heygem批量模式实测&#xff1a;一次上传多视频省时省力 在数字人内容生产需求爆发的当下&#xff0c;很多运营、教育、电商团队都面临一个现实困境&#xff1a;同一段产品介绍音频&#xff0c;要适配不同形象的数字人——销售顾问、讲师、客服、品牌代言人……如果用传统单个…

作者头像 李华
网站建设 2026/3/8 18:14:29

阿里通义Z-Image-Turbo显存不足?镜像免配置方案快速解决部署难题

阿里通义Z-Image-Turbo显存不足&#xff1f;镜像免配置方案快速解决部署难题 1. 为什么显存总在关键时刻“告急”&#xff1f; 你是不是也遇到过这样的场景&#xff1a;刚兴冲冲下载好阿里通义Z-Image-Turbo WebUI&#xff0c;满怀期待地执行bash scripts/start_app.sh&#…

作者头像 李华
网站建设 2026/3/11 16:27:11

Qwen-Image-2512上线后,团队协作效率大幅提升

Qwen-Image-2512上线后&#xff0c;团队协作效率大幅提升 当设计需求从“改个按钮颜色”变成“今天要上线37张节日海报”&#xff0c;当运营同事第三次在群里发来截图问“这张图能不能把‘限时抢购’换成‘早鸟专享’”&#xff0c;而设计师正卡在另一版主图的阴影渲染上——你…

作者头像 李华
网站建设 2026/3/9 18:58:57

ChatGLM3-6B监控体系:GPU温度与推理耗时实时可视化

ChatGLM3-6B监控体系&#xff1a;GPU温度与推理耗时实时可视化 1. 为什么需要监控ChatGLM3-6B的运行状态&#xff1f; 当你把ChatGLM3-6B-32k模型稳稳地跑在RTX 4090D上&#xff0c;享受“秒级响应”和“流式打字”的丝滑体验时&#xff0c;有没有想过——这块显卡此刻正承受…

作者头像 李华
网站建设 2026/3/8 20:12:25

DIY游戏手柄全攻略:ESP32无线控制技术实现与创新应用

DIY游戏手柄全攻略&#xff1a;ESP32无线控制技术实现与创新应用 【免费下载链接】ESP32-BLE-Gamepad Bluetooth LE Gamepad library for the ESP32 项目地址: https://gitcode.com/gh_mirrors/es/ESP32-BLE-Gamepad 想拥有一个完全自定义的游戏手柄却苦于成品设备价格高…

作者头像 李华