news 2026/5/5 17:32:24

Cursor智能体开发:工具调用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Cursor智能体开发:工具调用

既然你已经了解了上下文的工作方式,我们来看看 AI 模型如何不止于生成文本。它们实际上可以通过工具调用动态地执行操作并获取信息。

还记得我们把 AI 模型比作 API 端点吗?工具调用就像让这些模型具备自行调用其他API 的能力。就好比 AI 模型能学会新技能。

打个比方:想象你在电话里帮朋友做晚饭。你可以根据已有的知识给出指示,但你看不到他们冰箱里有什么,也尝不到正在做的菜。

再想象朋友给你发来冰箱里的照片,或告诉你烤箱的准确温度。因为拿到了实时信息,你就能给出更好的建议。这本质上就是工具调用为 AI 模型带来的能力。

工具调用的工作原理

当开发者构建 AI 应用时,可以定义供 AI 模型使用的特定“工具”。这些工具就像扩展能力,使模型不止能“思考并输出文本”。

你很可能已经在不知不觉中用过工具调用!当你让 ChatGPT 生成图片、搜索网页或运行代码时,背后用的就是这些工具。

其底层流程如下:

  1. AI 模型接收你的请求并识别到需要额外能力
  2. 它会按 JSON(结构化数据格式)生成一段特殊响应,指定要使用的工具及其参数
  3. 应用程序运行该工具并返回结果
  4. AI 模型将结果纳入上下文并继续对话

为什么工具对编码很重要

在构建软件时,工具非常强大,因为它们让 AI 模型能够:

  • 读取与写入文件到你的代码库
  • 搜索代码以查找相关函数或模式
  • 运行 shell 命令来测试代码或安装依赖
  • 访问文档或在网上搜索最新信息
  • 检查错误通过运行 linter 或测试

没有工具时,AI 模型只能使用你在上下文中明确提供的信息。有了工具,它可以主动探索并与代码库交互。

工具调用包含哪些内容?

每个工具都有三个主要组成部分:

  1. 名称,例如read_filesearch_web
  2. 描述,用于告知模型何时以及如何使用该工具
  3. 参数,即工具运行所需的输入

下面是一个工具定义可能的示例:

{ "name": "read_file", "description": "从代码库中读取文件内容", "parameters": { "filepath": "要读取的文件路径" }}

当 AI 模型需要使用该工具时,会生成如下响应:

{ "tool": "read_file", "parameters": { "filepath": "src/components/Button.tsx" }}

应用随后会读取该文件,并将其内容添加到对话上下文中,使模型理解你的 Button 组件并给出相关修改建议。

以下哪些是工具定义的核心部分?

Select all that apply

Name

Description

Parameters schema

Provider API key

CheckReset

工具的成本

还记得我们谈过的 token 和定价吗?工具调用会通过两种方式消耗 token:

  1. 工具定义会被包含在输入上下文中 (通常每个工具会占用几百个 token)
  2. 工具结果会被添加到输出上下文中 (具体取决于工具返回的内容)

这意味着大量使用工具的对话会更快填满上下文窗口,成本也会更高。但这种权衡通常是值得的,因为 AI 在能够访问实时信息时会有更强的帮助能力。

当发生工具调用时,AI 模型会重新评估直到工具调用本身为止的上下文。在 Cursor 这类工具中,这意味着你会看到更多缓存的输入 token 用量,因为我们会将上下文重新发送给模型。

工具调用会通过哪两种方式影响 token 使用?

Select all that apply

工具定义会增加输入 token

工具结果会增加输出 token

工具一旦定义,调用就是免费的

流式传输会消除 token 成本

CheckReset

超越内置工具

最近,一个名为 MCP (Model Context Protocol,模型上下文协议) 的新标准问世。可以把它理解为一种通用方式,让 AI 模型在不同应用间使用并集成各类工具。

就像 USB 成为连接设备与计算机的标准一样,MCP 旨在成为将工具连接到 AI 模型的通用标准。这意味着开发者只需构建一次工具,它们就能在多个不同的 AI 应用中运行。

例如,你可以用 MCP 连接 Figma 获取设计文件、连接 Linear 查看和管理任务,或连接数据库直接查询数据。你也可以创建自己的 MCP 服务器,以集成内部工具和 API。

现在你已经了解了工具调用,让我们看看当 AI 模型按顺序使用多个工具时会发生什么。这正是「智能体 (agents) 」大显身手的地方。

《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章,前6章涵盖深度学习基础,包括张量运算、神经网络原理、数据预处理及卷积神经网络等;后5章进阶探讨图像、文本、音频建模技术,并结合Transformer架构解析大语言模型的开发实践。书中通过房价预测、图像分类等案例讲解模型构建方法,每章附有动手练习题,帮助读者巩固实战能力。内容兼顾数学原理与工程实现,适配PyTorch框架最新技术发展趋势。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 2:49:28

RIVER Bench:视频交互延迟测试框架解析与实践

1. 项目背景与核心价值在视频处理领域,实时交互性能一直是衡量系统优劣的关键指标。传统视频处理基准测试往往聚焦于静态指标(如分辨率、帧率),而忽视了真实场景中的动态交互需求。RIVER Bench的诞生正是为了解决这一痛点——它首…

作者头像 李华
网站建设 2026/5/4 2:49:25

外包第一天就“看顺眼”组长,这事比需求变更还危险

来自:推荐一个程序员编程资料站:http://cxyroad.com副业赚钱专栏:https://xbt100.top2024年IDEA最新激活方法后台回复:激活码CSDN免登录复制代码插件下载:CSDN复制插件以下是正文。大家好,我是小路。最近看…

作者头像 李华
网站建设 2026/5/4 2:46:25

开发者工具精选:从Awesome列表到高效工作流构建指南

1. 项目概述:一个开发者工具的“藏宝图”如果你是一名开发者,无论是刚入行的新手,还是摸爬滚打多年的老手,我相信你都经历过这样的时刻:面对一个棘手的调试问题,或者想优化某个开发流程,却不知道…

作者头像 李华
网站建设 2026/5/4 2:42:25

2026届必备的五大AI辅助写作网站实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 大语言模型迭代之际,人工智能辅助学术写作成了现实,当下,…

作者头像 李华
网站建设 2026/5/4 2:39:25

基于Roslyn的C#代码库智能体导航地图生成器设计与实现

1. 项目概述:为智能体构建C#代码库的“导航地图”最近在折腾一个基于大语言模型的智能体项目,需要让它能理解、分析和操作一个规模不小的C#代码库。这听起来简单,但实际操作起来,我发现了一个核心痛点:智能体&#xff…

作者头像 李华
网站建设 2026/5/4 2:37:27

剑指Offer 60.n个骰子的点数

一、思路:题目要求是计算掷n个骰子时,所有可能点数出现的概率。这道题可以用动态规划dp来做。1.投掷n个骰子时,可能出现的总和最小值是n * 1,可能出现的总和最大值是n * 6。2.从最小值到最大值中,所有连续的整数都是可…

作者头像 李华