news 2026/4/19 3:11:52

0x5f3759df --比sqrt还快ovo

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
0x5f3759df --比sqrt还快ovo

- 0x5f3759df 是快速平方根倒数算法的核心,它通过位运算直接给出 1/√x 的初始近似值。
- 配合牛顿迭代法,只需 1~2 次迭代就能达到极高精度,整体速度超传统 sqrt 。
- 这种“位级黑科技”是当年程序员在硬件受限下的极致优化,至今仍是计算机科学中的经典案例。



一、神奇的 0x5f3759df

在快速平方根倒数算法中, 0x5f3759df 是那个让无数程序员拍案叫绝的魔法数字(Magic Number)。它能在没有浮点运算单元(FPU)的年代,用纯整数位运算就给出平方根倒数的一个极佳初始近似值,再配合牛顿迭代法快速收敛到精确结果,整体速度比传统 sqrt 快数倍。





二、算法核心代码解析

float Q_rsqrt( float number ) {
long i;
float x2, y;
const float threehalfs = 1.5F;

x2 = number * 0.5F;
y = number;
i = * ( long * ) &y; // 邪恶的浮点位级黑科技
i = 0x5f3759df - ( i >> 1 ); // what the fuck?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 第一次迭代
// y = y * ( threehalfs - ( x2 * y * y ) ); // 第二次迭代,可选

#ifndef Q3_VM
#ifdef __linux__
assert( !isnan(y) ); // bk010122 - FPE?
#endif
#endif
return y;
}



这段代码的关键思路:

1. 位级黑科技:把浮点数的二进制位直接当成整数来操作,这是实现近似的基础。
2. 魔法数字计算: 0x5f3759df - (i >> 1) 一步就给出了 1/√number 的初始估计值。
3. 牛顿迭代法:用 y = y * (1.5 - (x2 * y * y)) 迭代修正,一次迭代就能把误差降到千分之二以内。



三、浮点数格式与初始估计原理

要理解魔法数字的来源,先看 32 位单精度浮点数的结构:

- 符号位 s(1 位):0 为正,1 为负
- 指数位 E(8 位):存储 E - 127 (偏移量 127)
- 尾数位 M(23 位):存储小数部分,实际值为 1 + M/2²³

浮点数的数值公式:

x = (-1)^s \left(1 + \frac{M}{2^{23}}\right) 2^{E-127}


我们想求 y = \frac{1}{\sqrt{x}},两边取二进制对数并近似,最终可以推导出:

- 把浮点数 x 的整数表示 i 右移一位,再用魔法数字 0x5f3759df 去减,就能得到 y 的整数近似表示。
- 这个魔法数字是通过数学推导和大量实验找到的,能让初始估计的相对误差最小。




四、魔法数字的求解:三分搜索

魔法数字不是凭空来的,而是通过三分搜索在合理区间内找到的最优值。

if __name__ == "__main__":
mant = np.arange(0, 1 << 23, dtype=np.uint32)

# 给一个合理的搜索区间,围绕 0x5f3759df 一带
lo = 0x5f000000
hi = 0x5f900000

best_magic, best_err = ternary_search_magic(lo, hi, mant)
print(f"best_magic = 0x{best_magic:08x}")
print("最小最大相对误差 =", best_err)


实验结果对比(以 32 位为例):

来源 值 初始估计相对误差 一次迭代相对误差
数学证明值 0x5f37642f 3.421282e-02 1.775889e-03
三分查找 0x5f375a87 3.436540e-02 1.751287e-03
Magic Number 0x5f3759df 3.437577e-02 1.752338e-03
64位数学证明值 0x5fe6ec85e7de30da 3.421281e-02 -

可以看到,0x5f3759df 与理论最优值几乎一致,是工程上的最优选择。



五、实验效果:64位对比 Magic Number

在 64 位双精度浮点数中,也有对应的魔法数字 0x5fe6ec85e7de30da 。它同样遵循位运算近似 + 牛顿迭代的思路,只是浮点数的指数位(11 位)和尾数位(52 位)长度不同,魔法数字的取值也随之调整

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 16:20:00

基于西门子PLC1214C的三原料自动称重配料搅拌系统程序修改探讨

基于西门子PLC1214C三原料自动称重配料搅拌系统改程序仅用于学时探讨。 功能&#xff1a; 三个原料仓按照配比先称重&#xff0c;然后进入配料仓&#xff0c;配料仓有两个重量档位&#xff0c;可以手动选择&#xff0c;当原料在配料仓里满足档位要求&#xff0c;原料仓停止称重…

作者头像 李华
网站建设 2026/4/17 17:29:24

导师推荐9个AI论文软件,MBA毕业论文轻松搞定!

导师推荐9个AI论文软件&#xff0c;MBA毕业论文轻松搞定&#xff01; AI 工具助力论文写作&#xff0c;轻松应对学术挑战 随着人工智能技术的不断进步&#xff0c;越来越多的 M BA 学生开始借助 AI 工具来提升论文写作效率。尤其是在当前 AIGC&#xff08;人工智能生成内容&…

作者头像 李华
网站建设 2026/4/17 13:54:36

【必收藏】RAG知识库质量优化实战:评估指标对比与提升方法全解析

本文探讨了RAG知识库质量优化方法&#xff0c;对比了基于余弦相似度的评估指标与ragas框架的优缺点。通过召回率、正确度和是否基于知识三个指标评估知识库质量&#xff0c;并提出了改进方向&#xff1a;提升知识切片质量&#xff08;包括自洽性、纯净度等维度&#xff09;和调…

作者头像 李华
网站建设 2026/4/18 1:33:21

物联网数据集成 :Flow 可视化编排 双向数据桥接

引言&#xff1a;全新的数据集成能力 为物联网平台与应用提供高性能的实时数据处理与集成&#xff0c;一直是 EMQX 最重要的能力之一。最新发布的 EMQX 5.0 针对数据集成相关功能进行了深度的重构和优化&#xff0c;以期帮助用户更加轻松灵活地使用。 EMQX 5.0 将 Webhook、数…

作者头像 李华
网站建设 2026/4/18 3:35:08

基于多阶段参数辨识与蒙特卡洛不确定性传播的质子交换膜水电解槽电压退化预测和预后地平线评估集成算法(Python)

代码实现了一个完整的质子交换膜水电解槽&#xff08;PEMWE&#xff09;剩余使用寿命&#xff08;RUL&#xff09;预测与性能评估系统。整个流程从加载合成的PEMWE数据集开始&#xff0c;首先基于底层的物理退化模型计算真实的理论失效时间&#xff08;EOL&#xff09;。系统通…

作者头像 李华