今天 GitHub 热榜第一名不是 AI Agent,不是通讯协议,是一个健身数据集。1,324 个健身动作,存成一个 JSON 文件,附带六种语言的指导说明。作者是土耳其开发者 hasaneyldrm。
先别急着划走,它不是你以为的那种"又一个数据集"。
这个项目的核心骨架是两个 HTML 文件,index.html和setup.html。前者是一个纯前端的运动浏览器,支持实时搜索、按肌群和器械筛选、无限滚动网格。后者才是真正让人眼前一亮的东西——一个给开发者用的设置向导。
打开setup.html,先选数据库。四种主流选择:SQL Server、PostgreSQL、MySQL 或 SQLite。浏览器会直接生成对应的CREATE TABLE语句,然后自动填好 1,324 条INSERT语句,一键导出.sql文件。注意,这全部在浏览器里完成,没有后端,没有服务器。
然后可以选择后端框架。Express.js、FastAPI、ASP.NET Core、Spring Boot、Laravel、Gin 六选一。它会生成完整的 API 客户端代码模板,你填一个 API 基础 URL,所有示例实时更新。JavaScript、Python、C#、Java、PHP、Go、cURL 的客户端代码全都有。
最后一步才是最有想法的地方。它会组合出一个结构化提示词,让你粘贴到 ChatGPT、Claude 或 Gemini 里,一次性让 AI 生成完整的生产级 REST API。不是生成骨架,是真的带着 CRUD、错误处理、数据库连接池的完整后端。
这个工作流的设计思路很清晰。项目作者显然不是只想给开发者扔一堆 JSON 数据了事——他想做的是让任何人从零搭建一个健身 App 后端的时间,从几天压缩到几十分钟。
数据本身来自 ExerciseDB v1,一个由 AscendAPI 维护的健身动作数据库。每条记录包含唯一 ID、名称、类别、目标肌群、协同肌群、所需器械和分步指导说明。按身体部位分了 10 个类别,上臂动作最多有 292 个,胸部 163 个,核心 169 个。
数据文件用起来很简单。Python 一行json.load就能加载全部 1,324 条记录,然后按类别、器械、目标肌群随便筛选。比如找出所有不需要器械的自重训练:
importjsonwithopen("data/exercises.json","r",encoding="utf-8")asf:exercises=json.load(f)bodyweight=[exforexinexercisesifex["equipment"]=="body weight"]print(len(bodyweight))# 325在这个 1,324 个动作里,325 个完全不需要任何器械。25% 的自重比例意味着如果要做一个居家健身 App,数据基本够用了。按器材分布来看,哑铃动作最多(294 个),其次是绳索(157 个)、杠铃(154 个),覆盖了从家庭到健身房的各种场景。
翻译是另一个不容易被注意到的亮点。hasaneyldrm 在原始英文数据的基础上,补了西班牙语、意大利语、土耳其语、俄语和中文的指导说明。中文翻译是 6 月 30 日刚加进来的,不是机器翻译那种生硬句子,动作说明读起来通顺自然。
但有一个必须说清楚的坑:这个仓库里没有任何图片或动画。
6 月 30 日的最新提交把所有媒体文件移除了。原因是因为存在多个相互冲突的版权声明。现在每条记录里的image和gif_url字段都是null,只保留了一个media_id指向原始 ExerciseDB 的媒体引用。浏览器里打开index.html能看到所有文字数据,但缩略图和演示动画的位置是空的。
用这个数据集做演示型产品的团队,需要自己解决动作演示素材的问题。官方给的替代路径是通过static.exercisedb.dev/media/{media_id}.gif获取原版媒体,但这需要你拥有 ExerciseDB 的访问权限。
还有一个边界条件值得注意:项目没有标准开源协议。README 里写得很直白——“本仓库不对基础运动内容主张所有权”,数据权利归属 ExerciseDB/AscendAPI。如果是商业用途,建议先搞清楚 ExerciseDB 的使用条款。
和同类的对比,说实话不太好找。大多数健身相关的开源项目要么是完整的健身 App(比如 wger,一个用 Django 写的健身管理器,5.4k Star),要么是 Kaggle 上的一次性数据集。像 exercises-dataset 这样——把数据 + 数据库建表 + API 框架代码 + LLM 生成提示词打通成一个完整开发者工作流的,暂未从公开渠道找到同等完成度的替代品。
这个项目适合谁。如果你正在做一个需要动作库的健身类 App 或小程序,这个数据集基本是开箱即用的数据结构。中国开发者会尤其受益——中文说明已经有了,SQL 导入工具支持国内常用的 MySQL,FastAPI 的示例代码也友好。零依赖的设计意味着你不需要配任何环境,浏览器打开就能评估数据质量。
不适合谁。如果你需要一个即插即用的健身动作演示组件——带视频或 GIF 播放功能的,这个项目目前没办法直接满足。你需要自己解决媒体素材,或者对接 ExerciseDB 的 CDN。如果你做的是医疗康复或物理治疗场景,这个数据集的动作分类粒度可能不够细。
最后hasaneyldrm 在仓库介绍中提到:这是一个"data-only setup wizard"。它不是要做一个健身 App,是要让做健身 App 这件事的前 80% 准备工作变成自动化的。从这一点看,它登顶热榜就没那么意外了——开发者用脚投票的时候,解决实际效率问题的工具永远比炫技的项目更有生命力。
项目地址:https://github.com/hasaneyldrm/exercises-dataset 同类参考:wger(https://github.com/wger-project/wger,6.4k Star,最后更新 2026-07-01)