news 2026/2/5 6:13:30

微软 Foundry Local - 本地 AI 推理解决方案

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
微软 Foundry Local - 本地 AI 推理解决方案

软在其 2025 Build 大会上发布了 Foundry Local,能够在本地设备上执行 AI 推理,意味着可以利用本地的 AI 算力,如:CPU/GPU/NPU;也让用户在隐私方面得到了充足的保障,还能有改善成本效益!Foundry Local 默认除了支持 CLI外,还支持 SDK、REST API 和 Catalog API,用户可以自行基于 Foundry Local 进行开发。在未来 Foundry Local 还将内置对 Agent/MCP 的支持。

Foundry Local 还支持跨平台,除了能够运行在Windows 11 上,还能够运行在 macOS。由于需要本地存储和运行模型,请确保有足够的算力和存储,Foundry Local 支持硬件加速:NVIDIA GPU(2000系列或更高版本)、AMD GPU(6000系列或更高)、Intel iGPU、Intel NPU(32GB或更多内存)、高通 Snapdragon X Elite(8GB或更多内存)、高通 NPU,以及 Apple 系列。

要在本地以 Foundry Local 运行 AI 模型,首先需要安装 Foundry Local。

Windows:

winget install Microsoft.FoundryLocal

macOS:

brew tap microsoft/foundrylocal

brew install foundrylocal

运行模型只需要执行:

foundry model run <model>

在 Foundry Local 上可运行的模型有很多,可使用以下命令查看:

foundry model list

还可以加载 --filter 参数对显示列表进行筛选。

其他有用的参数还有:

foundry model info <model> 显示有关特定模型的详细信息

foundry model download <model> 在不运行模型的情况下只下载模型到本地缓存

foundry model load <model> 将模型加载到服务中

foundry model unload <model> 从服务中卸载模

要查看本地已经下载缓存的模型,可执行:

foundry cache list

image

要检查 Foundry Local 服务状态,可执行:

foundry service status

image

Foundry Local CLI 详细使用可参考:Foundry Local 文档。

Foundry Local SDK 目前支持 JavaScript、Python、C# 和 Rust,也可以使用 REST API 去调用 Foundry Local Service。这是一个用于演示或本地实验的示例项目,可能展示如何在本地环境中使用或集成“Foundry”相关功能。核心代码在https://github.com/andrewleader/FoundryLocalLabDemo/blob/main/FoundryLocalLabDemo/ExecutionLogic.cs:

封装 FoundryLocalManager,提供基础模型管理:

• StartServiceAsync:启动本地 Foundry 服务

• ListCatalogModelsAsync / ListCachedModelsAsync:列出目录/本地缓存模型

• DownloadModelAsync:按进度流式下载模型(IAsyncEnumerable<ModelDownloadProgress>)

• LoadModelAsync / UnloadModelAsync:加载/卸载模型

基于选定模型进行流式解析用户文本为结构化对象:

• ParseStudentProfileStreamingAsync:

• 通过 OpenAIClient + Microsoft.Extensions.AI 创建聊天客户端(使用 FoundryLocalManager 提供的 Endpoint 和 ApiKey)

• 构造一个包含字符串枚举的 JSON Schema,要求模型仅输出 JSON

• 发送提示词并以流式方式接收回复,边接收边通过 IAsyncEnumerable<StudentProfileUpdate> 返回中间文本增量

• 收集完整回复后,去除可能的 <think> 标签和 ```json 代码块围栏,处理嵌套对象,再用 Json.NET(含 StringEnumConverter)反序列化为 StudentProfile

• 最后返回一次包含解析好的 StudentProfile 的更新

image

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/5 11:13:29

手握方向盘急打方向时,你有没有想过轮胎和车身的相互作用到底藏着什么玄机?今天咱们用Matlab扒开车辆动力学的底裤,看看那个决定车辆会不会失控的神秘相平面

基于Matlab的车辆稳定性相平面图绘制程序 ①根据确定的简化魔术公式轮胎模型&#xff0c;建立车辆非线性二自由度运动微分方程&#xff0c;并进而对相平面图进行绘制。 ②包括横摆角速度与质心侧偏角的相平面&#xff0c;以及质心侧偏角速度与质心侧偏角的相平面。 附带说明文档…

作者头像 李华
网站建设 2026/2/3 0:05:20

三菱FX5U与3台三菱E700变频器通讯实战

三菱FX5U与3台三菱E700变频器通讯程序(SL5U-24) 通讯说明&#xff1a;用三菱FX5U的PLC实现与3台三菱E700变频器modbus通讯 器件&#xff1a;三菱FX5U PLC&#xff0c;3台三菱E700变频器&#xff0c;昆仑通态TPC7022NI触摸屏 功能&#xff1a;触摸屏上设置每台频率&#xff0c;监…

作者头像 李华
网站建设 2026/2/3 0:05:29

Profiling 专项

Profiling 工具 https://github.com/iovisor/bcc

作者头像 李华
网站建设 2026/2/3 0:17:04

如何完成一个方便简单的Arduino共阳极数码管实验(从0~9依次循环亮起)

文章目录 实验演示共阴极数码管和共阳极数码管的区别所需器材连接草图程序代码代码说明代码功能概述核心数据结构关键函数逻辑 小结 实验演示 共阴极数码管和共阳极数码管的区别 在开始实验之前&#xff0c;请让我简单解释一下共阴极数码管和共阳极数码管的区别&#xff0c;这…

作者头像 李华
网站建设 2026/2/3 1:02:25

Sniffnet容器化部署终极指南:3步搞定网络流量监控

还在为复杂的网络分析工具配置头疼吗&#xff1f;Sniffnet容器化部署让你在5分钟内拥有专业级网络流量分析能力&#xff01;告别环境依赖冲突&#xff0c;开启零基础网络分析新时代 &#x1f680; 【免费下载链接】sniffnet Sniffnet 是一个能让你轻松监测网络流量的应用。你可…

作者头像 李华
网站建设 2026/2/4 9:00:57

基于Python+Django的毕业设计选题系统(源码+lw+部署文档+讲解等)

课题介绍本课题聚焦高校毕业设计选题环节的管理痛点&#xff0c;设计实现一套基于 PythonDjango 框架的毕业设计选题系统。传统毕业设计选题多依赖线下提交、人工统计&#xff0c;易出现选题冲突、信息不对称、流程效率低等问题&#xff0c;难以适配高校规模化教学管理需求。系…

作者头像 李华