news 2026/4/20 21:23:23

【卷卷观察】GitHub Star 造假产业链,以及它是怎么变成 AI 圈融资货币的

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【卷卷观察】GitHub Star 造假产业链,以及它是怎么变成 AI 圈融资货币的

结论先说:GitHub Trending 上的高星项目,有相当比例的星是买来的。这不是小范围的作弊,是一个成熟的、面向 VC 融资市场的地下经济。而且 AI 项目是重灾区。


上周看到一条 Twitter,大意是:"GitHub Trending 上的项目,40% 的 star 是买的,你信吗?"

我信。不是因为我对开源社区失望,是因为我见过太多这类游戏的玩法——这个世界上,但凡有一个指标被广泛认可为"成功信号",就一定会有人花钱去买它。GitHub star 就是这样。

研究数据:六百万个假 star,AI 项目是重灾区

这个结论不是哪个博主拍脑袋得出的,是 CMU、NC State 和 Socket 三家联合做的学术研究,用的工具叫 StarScout,分析了 2019 到 2024 年间 67 亿条 GitHub 事件和 3.26 亿个 star。论文发表在 ICSE 2026,是软件工程领域的顶会。

结论:大约六百万个疑似假 star,来自约 30 万个账号,分布在 18617 个仓库里。

到了 2024 年 7 月,50 星以上的仓库里有 16.66% 涉及假 star 活动——而 2022 年之前这个比例接近零。也就是说,这事不是一直都有的,是 2023 年开始规模化,2024 年彻底失控的。

最讽刺的一个数据:研究里发现了 78 个被检测到假 star 活动的仓库,成功登上了 GitHub Trending。平台自己的推荐算法被假货骗了——买的 star 越多,Trending 排名越高,自然流量越大,真实 star 越多。这是个自我强化的循环,起点是钱,不是代码质量。

一条成熟的地下产业链

这个产业链的成熟程度超过我的预期。

有专职网站卖 star:SocialPlug.io、Buy.fans、Boost-Like.store、GitHubPromoter.com、Vurike.com……至少十二个活跃平台明码标价。Fiverr 上有 24 个合法 gig 在卖 GitHub 推广,甚至有德国注册公司 GitHub24(Moller und Ringauf GbR)公开经营,收费 0.85 欧元一个 star,承诺一个月后全部存活。

定价体系也分层了:

  • 低级(一次性账号):$0.03-$0.10/个,几天内交付,全新空账号
  • 中级(有历史记录):$0.20-$0.50/个,一到两周交付,有一定活跃历史
  • 高级(老账号):$0.80-$0.90/个,渐进式交付,账号有多年的活跃记录和真实项目

高级账号的意思是:你拿到的是看起来完全正常的 GitHub 账号,有多年的提交记录,有自己的项目,有真实的社交关系。VC 就是被这种"看起来很正常"的账号骗过去的。

Star 怎么变成了融资货币

问题来了:谁在买?为什么买?

VC 们真的在看 star 数量。Redpoint 投资的一个数据:他们在 seed 轮看项目时,star 数量的中位数是 2850 个。有些 VC 直接写爬虫抓 GitHub Trending 上增长最快的仓库,写进自己的 deal sourcing 流程。Star 高 = 项目热 = 值得看。这是很多投资人的筛选逻辑。

一个 GitHub star 最低 $0.06。一个 seed 轮融资 $1M 到 $10M。这个数学太清楚了:你花 $500 买 star,上了 Trending,获得了自然流量和曝光,如果因此拿到一个 $2M 的 seed,这个 ROI 是 400 倍。

研究里特别指出:AI 和 LLM 相关仓库,是假 star 的最大非恶意接收方。什么意思?这些项目不是存心想去骗钱,但它们的 star 里掺了最多的假货。

原因也不复杂:AI 赛道的项目,天然缺乏其他 legitimacy 信号。一个做 AI 的新项目,没有收入、没有用户数据、没有老牌投资机构背书,GitHub star 是少数几个可以快速获得的"证明"之一。所以 AI 项目买 star 的动机最强,AI 项目也是假 star 产业最大的客户群。

GitHub 自己知道吗?

知道。研究者用 StarScout 标记的仓库,GitHub 后来删了 90.42%;标记的账号,删了 57.07%。说明平台自己也认这个检测结果,也在清理。

但清理的速度永远追不上产业链成熟的速度。买 star 的需求就摆在那里,供给侧有专业的服务商,有分级定价体系,有售后存活承诺。这是一个完全合规的地下市场——它不违法,因为 GitHub 的服务条款里没有禁止给自己买 star(至少在研究发表的 2026 年初还没有明文规定)。

对 AI 圈的影响

如果你现在在评估一个 AI 项目,看到它有 5000 star,你可能需要重新校准你的判断基准。

按照研究的分布,AI 项目平均掺假比例可能相当高。不是说 star 高的 AI 项目都是假的,而是说,GitHub star 作为项目质量的信号,在 AI 赛道已经开始系统性失真了。

这对投资人的尽调提出了新的要求:不能只看 star 数量,要看 star 的质量——账号年龄、提交频率、issue 互动、真实的代码贡献者。但这些数据都在 GitHub 上,谁来做一个可信的"star 质量评分"?

同时,这个现象也揭示了一个更深层的问题:AI 领域的评估体系还没有建立起来。大家还在用 GitHub star 这种粗糙的指标,是因为没有更好的替代品。Star 的问题不是它被买走了,是整个行业在用错误的指标评估 AI 项目——Star 只是这个问题的症状。

最后说一句

这件事最让我有感触的,不是造假本身,是造假的激励结构。

GitHub star 这个指标,本来是给开发者用的——看看哪些项目被同行认可。但当 VC 开始把 star 作为 sourcing 信号的那一刻,这个指标的目标函数就变了。开发者想要 star 是因为同行认可,VC 们想要 star 是因为它代表项目热度,两种需求的叠加,把一个纯粹的技术指标变成了融资工具。

指标被工具化的速度,永远快于监管反应的速度。

GitHub 现在清理也好,VC 们开始警觉也好,都是事后补救。真正的问题在于:什么时候 AI 领域才能建立起真正有效的评估体系?不是靠 star,不是靠 paper 引用数,而是真正能反映项目价值和团队能力的信号。

这个问题没有简单的答案。但至少从现在开始,看到高 star 的 AI 项目,心里要打个折扣。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 21:21:24

Stanford Doggo机器人终极指南:从零到跳跃的完整教程

Stanford Doggo机器人终极指南:从零到跳跃的完整教程 【免费下载链接】StanfordDoggoProject Stanford Doggo is an open source quadruped robot that jumps, flips, and trots! 项目地址: https://gitcode.com/gh_mirrors/st/StanfordDoggoProject Stanfor…

作者头像 李华
网站建设 2026/4/20 21:14:15

接地与EMC设计:LED开关电源PCB抗干扰的核心策略

LED 开关电源工作在高频开关状态,EMI 干扰严重,若接地与 EMC 设计不当,会导致输出纹波大、EMC 认证失败、甚至干扰 LED 驱动与控制系统。分地、短回路、屏蔽、滤波是 EMC 设计的四大核心。​1. 分地设计:隔离功率与信号地严格区分…

作者头像 李华
网站建设 2026/4/20 21:13:03

从‘Hello World’到驱动开发:手把手拆解Linux内核源码里的条件编译宏

从‘Hello World’到驱动开发:手把手拆解Linux内核源码里的条件编译宏 在Linux内核的浩瀚代码海洋中,条件编译宏就像导航灯塔,指引着代码在不同硬件架构和功能需求下的正确执行路径。对于想要深入理解操作系统底层机制的中级开发者来说&#…

作者头像 李华