文章目录
- XHS-Downloader:小红书内容采集与下载,一个工具全搞定
- 1、 这个工具解决什么问题
- 2、 核心功能一览
- 3、 三种运行方式
- 4、 服务器模式
- 5、 用户脚本
- 6、 适合谁用
XHS-Downloader:小红书内容采集与下载,一个工具全搞定
XHS-Downloader 在 GitHub 上拿到了 11,683 Star。
这是一个专门针对小红书的内容采集和下载工具。能提取账号发布、收藏、点赞、专辑的作品链接,采集作品信息,下载作品文件。支持命令行、API、MCP 多种调用方式,也能通过浏览器用户脚本配合使用。
1、 这个工具解决什么问题
小红书没有提供官方的内容导出接口。想批量保存某个账号的作品,或者把收藏夹里的内容下载到本地,手动操作基本不现实。
XHS-Downloader 做的事情很直接:给它一个作品链接或者作者主页链接,它能把作品的图片、视频、文案信息全部拉下来。图文作品支持自定义下载格式,视频作品能选分辨率优先还是码率优先,livePhoto 也能单独处理。
已经下载过的作品会自动跳过,不会重复下载。
2、 核心功能一览
功能覆盖面比较全:
- 采集作品信息,提取下载地址,下载文件,一套流程走完
- 支持单次输入多个作品链接,程序自动提取有效链接
- 后台监听剪贴板,复制链接后自动触发下载
- 图文作品可以指定下载哪些图片,不用全部拉下来
- 文件断点续传,大文件下载中断后不用从头开始
- 下载记录持久化,下次运行自动跳过已下载内容
- 支持将每个作者的作品分文件夹存储,作者改名后自动更新文件夹名称
3、 三种运行方式
程序运行:Mac OS 和 Windows 10 以上用户可以直接下载可执行文件,解压后双击就能用。项目自带 GitHub Actions 自动构建,随时可以基于最新源码打包。
源码运行:需要 Python 3.12 以上版本。用 pip 或 uv 安装依赖后直接运行。源码方式适合需要二次开发的场景,项目提供了example.py作为调用示例。
Docker 运行:拉取镜像后创建容器即可,支持 TUI、API、MCP 三种模式。Docker 方式不支持命令行调用模式和剪贴板功能。
4、 服务器模式
项目内置了 API 和 MCP 两种服务器模式,方便程序化调用。
API 模式启动后访问http://127.0.0.1:5556/docs能看到自动生成的接口文档。核心接口是/xhs/detail,POST 请求,传入作品链接就能拿到作品信息,设置download参数为true可以同时下载文件。
MCP 模式提供了 Streamable HTTP 接口,可以直接接入支持 MCP 协议的 AI 工具,让 AI 助手帮你采集和下载小红书内容。
5、 用户脚本
除了主程序,项目还提供了 Tampermonkey 浏览器脚本。安装后可以在浏览器里直接提取推荐页面、账号主页、搜索结果的作品链接,也能一键下载作品文件。
脚本支持自动滚动页面加载更多内容,但默认关闭。开启后可能触发小红书的风控检测,需要自行评估风险。
脚本还能和主程序联动:主程序开启script_server参数后作为后台服务器运行,在浏览器中点击脚本菜单的「推送下载任务」,就能把当前页面的作品直接推给主程序下载。
6、 适合谁用
- 需要批量保存小红书作品素材的内容创作者
- 做竞品分析、需要采集特定账号内容的运营人员
- 想把收藏夹内容备份到本地的普通用户
- 有二次开发需求、想把采集能力集成到自己工具链里的开发者
号内容的运营人员
- 想把收藏夹内容备份到本地的普通用户
- 有二次开发需求、想把采集能力集成到自己工具链里的开发者