news 2026/6/9 15:03:14

【技术核爆】Python 3.14 终于“杀”死了 GIL:NumPy 3.0 发布与多线程并发的终极解放

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【技术核爆】Python 3.14 终于“杀”死了 GIL:NumPy 3.0 发布与多线程并发的终极解放

背景分析:
如果说上一篇我们关注的是硬件(RTX 5090),那么这两天软件开发领域最大的震动,莫过于Python 3.14 (代号 “Pi”)的生态里程碑事件。2025年12月17日,数据科学基石NumPy 3.0和 Web 框架FastAPI 2.0同步宣布:全面适配 Python 3.14 的 “Free-Threading”(无 GIL)模式,并默认开启。

这标志着困扰 Python 开发者三十年的“多线程假象”彻底终结。本篇博客将深度剖析这一变革背后的技术细节——PEP 703 的落地与 Biased Reference Counting(偏向引用计数)机制


【技术核爆】Python 3.14 终于“杀”死了 GIL:NumPy 3.0 发布与多线程并发的终极解放

标签:#Python3.14 #NoGIL #Multithreading #NumPy3 #Performance


01. 历史性的一刻:当 CPU 的所有核心同时亮起

昨天(12月17日),我的 RSS 订阅源被一条消息刷屏了:NumPy 团队正式发布了 3.0 正式版,并在 Release Note 的第一行用加粗字体写道:“Fully compatible with Python 3.14 Free-Threading mode. The GIL is gone.”

作为一个写了十年 Python 的老程序员,看到这句话时,我的心情比当年看到 Python 2 停止维护还要激动。

长久以来,我们被GIL(Global Interpreter Lock,全局解释器锁)像幽灵一样缠绕。在 Python 3.13 之前,无论你的服务器有多少个核,同一时刻只能有一个 Python 线程在执行字节码。我们被迫使用笨重的multiprocessing,忍受进程间通信(IPC)的高昂开销,或者转身去写 Go 和 Rust。

但今天,在 Python 3.14 和 NumPy 3.0 的加持下,一切都变了。为了验证这一点,我连夜将生产环境的一个数据清洗脚本升级到了 3.14 环境,打开htop的那一刻,我看到了从未见过的壮观景象:128个 CPU 核心,全部 100% 满载。

这不仅仅是性能的提升,这是 Python 并发编程范式的革命。今天,我们就来硬核拆解一下:GIL 是怎么没的?以及在没有 GIL 的世界里,我们需要注意什么?


02. 深度深挖:GIL 消失背后的魔法——偏向引用计数 (Biased Reference Counting)

很多人以为“去掉 GIL”就是把那行锁的代码删掉。如果真这么简单,Guido 之父早就干了。

GIL 存在的根本原因是为了保护 Python 的内存管理机制——引用计数(Reference Counting)。如果多个线程同时修改一个对象的引用计数(比如a = b),没有锁的保护,会导致内存泄漏或程序崩溃。

Python 3.14 实现无锁并发的核心技术,叫做Biased Reference Counting(偏向引用计数)。这是一个非常天才的设计。

传统 vs 偏向:技术原理对比
特性传统 Python (GIL 时代)Python 3.14 (Free-Threading)核心差异
引用计数操作非原子操作,依赖 GIL 保护基于本地线程的偏向计数解决了多线程竞争引用计数的问题
锁机制一把大锁 (GIL) 控制所有细粒度锁 (Per-Object Locks)只有真正冲突时才锁,不再“一刀切”
内存分配pymalloc (主要单线程优化)mimalloc (微软的高性能分配器)专为高并发设计的内存分配器,减少锁竞争
对象垃圾回收Stop-the-world (STW)并行 GC垃圾回收不再卡顿整个进程
什么是“偏向引用计数”?

简单来说,Python 3.14 认为:绝大多数对象,在其生命周期内,只会被创建它的那个线程访问。

  1. 拥有者线程(Owning Thread):每个对象都有一个“拥有者”。拥有者修改引用计数时,不需要任何原子操作(Atomic Instructions),也不需要锁,速度极快。
  2. 非拥有者线程:如果其他线程想要访问这个对象,它使用显式的原子操作(比较慢),并设置一个“共享位”。
  3. 合并:垃圾回收器会在特定时刻,将这些分散的计数合并。

这种设计,让单线程程序的性能几乎没有回退(以前去 GIL 的尝试通常会导致单线程慢 30

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 7:25:20

go为什么设计成源码依赖,而不是二进制依赖

Go 选择源码依赖(Source-based Dependency) 而非二进制依赖(Binary Dependency)(如 Java 的 JAR 包或 C 的 .a/.so/.dll 文件),是经过深思熟虑的,主要基于以下几个核心原则&#xff…

作者头像 李华
网站建设 2026/6/7 6:32:28

从“能跑”到“可持续”:Java 在长期演进系统中的工程价值再思考

在技术更新频率越来越快的今天,Java 常常被贴上“成熟”“稳定”“传统”的标签。在一些新技术浪潮中,它甚至被误解为“不够前沿”。但在真实的大型系统、核心业务平台、金融级与工业级系统中,Java 依然是最常见、最可靠的选择之一。 如果仅从…

作者头像 李华
网站建设 2026/6/8 15:07:02

从“哑巴英语”到脱口而出:三条实战路径揭晓

“背了十年单词,一开口还是小学生。”——这句话戳中过太多人。口语之所以难,并非难在发音,而是难在“即时组织即时输出”的双线程任务。过去三个月,我靠每天 25 分钟“微习惯”训练,把雅思口语从 5.5 拉到 7.0&#x…

作者头像 李华
网站建设 2026/6/8 8:12:34

5.7W25Q64 实验(上)-嵌入式铁头山羊STM32笔记

目录 实验目标 实验目标: 通过 MCU 的 SPI 总线, 控制 W25Q64 存储一字节数据; 然后将存储的数据通过 SPI 读出来 上期纠错 问题 1:PA15 需要重映射,不能当做普通 IO 直接作为 CS 引脚 问题 2:PA15 初…

作者头像 李华
网站建设 2026/6/7 15:27:12

Groovy对业务能力扩展

一、前言因为之前在项目中使用了Groovy对业务能力进行一些扩展,效果比较好,所以简单记录分享一下,这里你可以了解:为什么选用Groovy作为脚本引擎了解Groovy的基本原理和Java如何集成Groovy在项目中使用脚本引擎时做的安全和性能优…

作者头像 李华