嵌入式开发中的编译器优化实践：从-Os到函数内联的工程权衡-洪萨配资

1. 编译器优化：从“能跑”到“跑得好”的工程实践

在嵌入式开发或者对性能有极致要求的系统编程里，我们常常会面临一个灵魂拷问：这段代码，它“能跑”吗？答案是肯定的。但紧接着的第二个问题更关键：它“跑得好”吗？这里的“好”，通常指向三个维度：代码体积（ROM/Flash占用）、执行速度（CPU周期）以及功耗。很多时候，我们精心设计的算法和数据结构，其理论上的优雅会被编译器生成的“朴素”机器码拖累。这时，编译器优化就不再是一个可选项，而是从“实现功能”迈向“交付高质量产品”的必经之路。

我干了十多年嵌入式固件开发，从8位单片机到复杂的多核应用处理器都摸过。早期我也曾迷信“手写汇编效率最高”，但后来发现，现代编译器的优化能力远超大多数程序员的想象。它的核心原理，是在透彻理解你源代码语义的基础上，对程序进行一系列保持功能等价的变换。这些变换作用于编译过程的中间表示（IR）或最终的目标代码，目标就是让你的程序更小、更快、更省电。今天，我们不谈那些高深的编译理论，就聚焦在编译器后端那些实实在在的、能通过命令行选项控制的优化技术上。我会以一份经典的编译器手册片段为引子，带你深入理解像公共子表达式消除（CSE）、函数内联这些关键优化是如何工作的，更重要的是，在实际项目中，我们该如何权衡和运用它们。

2. 优化目标设定：在大小与速度间走钢丝

在深入具体选项之前，我们必须先确立优化的“指导思想”。编译器不是魔法，它无法同时让代码既无限小又无限快。这中间存在一个经典的权衡。

2.1 核心优化指令：`-Os`与`-Ot`

几乎所有现代编译器都提供了设定优化目标的顶层开关。在手册中，这体现为-O选项配合s（size）或t（time）参数。

-Os(Optimize for size)：这是许多嵌入式项目的默认选择，尤其是在Flash存储空间紧张的情况下。选择此选项，编译器会优先生成体积更小的代码。它可能会用更慢但更紧凑的指令序列替换掉更快但更长的序列，或者更倾向于调用共享的运行时库函数而不是展开内联代码。
- 底层逻辑：编译器内部有一个成本模型。当它面对多种实现同一功能的代码序列时，会估算每条路径的指令字节数。-Os模式下，它选择估算成本（字节数）最低的那条路径。例如，一个循环展开可能会更快，但重复的指令会使代码膨胀；-Os下编译器可能选择不展开，转而使用一个更小的循环结构。
- 实战心得：在资源受限的MCU（如Cortex-M0， Flash只有32KB）上，我几乎总是先开-Os。先把代码体积压到芯片容量以内，是项目能启动的前提。有时候，牺牲一点速度换来能塞进芯片，是更现实的选择。
-Ot(Optimize for time)：当系统对实时性要求极高，或者CPU主频是瓶颈时，此选项成为首选。编译器会倾向于生成执行速度更快的代码，即使这会让最终的程序变大。
- 底层逻辑：同样基于成本模型，但此时成本是预估的执行周期数。编译器可能会进行循环展开以减少分支判断开销，可能将频繁使用的小函数内联以消除调用开销，也可能选择使用处理器提供的、更快但可能编码更长的特定指令。
- 实战心得：在电机控制、数字信号处理（DSP）循环或通信协议栈的关键路径函数中，我会针对单个文件或函数使用-Ot。一个常见的做法是，全局使用-Os控制整体体积，然后通过编译器特有的#pragma或属性（如__attribute__((optimize(“O3”)))在GCC中）对热点函数单独启用速度优化。

注意：手册中特别强调，-O选项主要影响一些特定的代码序列选择。要想获得最佳的优化效果，必须结合其他优化选项（如寄存器分配、指令调度等）一起使用。单独使用-Os或-Ot效果有限，它更像是一个高层的指导方针。

2.2 定义优化集：`-OdocF`的函数级精细控制

手册中提到了一个非常强大的特性：-OdocF。这解决了工程师们的一个经典痛点——整个编译单元（一个.c文件）只能用同一套优化选项，但文件内不同函数的优化特性可能截然不同。

它解决了什么问题？假设一个文件里既有初始化时运行一次、但对大小敏感的配置函数，也有每秒运行成千上万次、对速度敏感的信号处理函数。全局用-Os，速度上不去；全局用-Ot，ROM可能不够。-OdocF允许你为编译器提供一个“选项套餐”，让它为每一个函数自动挑选能产生最小代码的组合。
工作原理：当你指定-OdocF="-Or|-Cni|-Cu"时，编译器会为当前编译单元内的每个函数，分别尝试编译这些选项的所有可能组合（-Or、-Cni、-Cu、-Or -Cni、-Or -Cu、-Cni -Cu、-Or -Cni -Cu以及基线无额外选项），并评估每种组合下该函数生成的代码大小，最后为每个函数选择最小的那个版本进行链接。
实战应用与限制：
```
// 假设我们编译时使用：-W2 -OdocF="-Or|-Cni -Cu|-Oc" // 编译器会为下面每个函数评估8种选项组合，并选取最优解。 void large_but_fast_func(void) { // 可能适合 -Or (寄存器优化) 和 -Oc (CSE) } void small_and_cold_func(void) { // 可能基线选项或 -Cni (无内联) 就是最小的 }
```
- 重要限制：-OdocF中指定的选项，其作用域必须仅限于函数内部。绝对不能包含影响整个应用或编译单元的选项，例如内存模型 (-M)、浮点格式、目标文件格式等。否则，为不同函数生成的目标代码可能因为ABI（应用二进制接口）不兼容而无法正确链接或运行。
- 性能代价：编译时间会显著增加。如果指定了N个选项集，理论上每个函数需要编译2^N次来评估。手册限制最多5个集合，这意味着最坏情况下一个函数要编译32次。这通常只在最终发布构建、追求极致体积优化时使用。

3. 核心优化技术解析：CSE与内联

设定好目标后，我们来看两种最经典且效果显著的优化技术。

3.1 公共子表达式消除（CSE）：`-Oc`

公共子表达式消除是一种经典的编译器优化，旨在消除程序中重复进行的相同计算。

它是什么？如果一段计算在某个作用域内（通常是一个基本块或函数内）被多次执行，且每次计算时其操作数的值都没有改变，那么这就是一个公共子表达式。CSE会识别出这种模式，将计算结果保存到一个临时变量中，后续所有使用该结果的地方都直接引用这个临时变量。

手册示例深度解读：

// 优化前 a = (b + c) * d; e = (b + c) * 10; // (b + c) 被重复计算 f = (b + c) + g; // 启用 -Oc 后，编译器可能生成类似如下的中间表示或代码： _tmp = b + c; // 计算一次，存入临时变量 a = _tmp * d; e = _tmp * 10; f = _tmp + g;

为什么需要它？显而易见的好处是减少了计算次数，提升了性能。尤其是在循环体内或复杂表达式中，节省的CPU周期可能非常可观。对于没有硬件乘法器的低端MCU，将一次昂贵的乘法替换为一次廉价的加载，意义重大。
潜在风险与-Oa（别名分析）选项：手册的警告至关重要。CSE优化的正确性依赖于一个关键假设：在两次相同的子表达式计算之间，其操作数的值没有被“偷偷”改变。而“偷偷”改变通常通过“别名”（Alias）发生。
```
int x; int *p; x = 7; // 计算 x+1 得到 8 p = &x; *p = 6; // 通过指针 p 别名修改了 x 的值！ // 如果编译器对 (x+1) 做了CSE并缓存了结果8，那么这里判断就会出错 if (x + 1 != 7) Error(); // 预期触发，但若CSE错误则不会
```
这就是-Oa选项存在的意义。它允许程序员告诉编译器关于别名行为的假设：
- -Oa addr(默认)：最保守。认为同一地址区域内的任何对象都可能重叠（互为别名）。CSE会非常谨慎。
- -Oa ANSI：假设代码严格遵循C99标准的别名规则（例如，int*和float*不能指向同一内存）。编译器可以进行更激进的CSE。
- -Oa type：假设只有相同类型的对象才可能重叠。
- -Oa none：假设程序中完全不存在别名。这是最激进但最危险的设置，除非你百分百确定（例如在高度可控的裸机环境中），否则不要使用。实操建议：对于大多数嵌入式项目，使用默认的-Oa addr是安全的选择。如果你确信代码符合严格别名规则，并且性能瓶颈确与CSE有关，可以尝试-Oa ANSI，但务必进行充分的测试（尤其是涉及指针操作和内存映射I/O的地方）。

3.2 函数内联：`-Oi`与`-Oilib`

函数调用是有开销的：参数压栈/传寄存器、跳转指令、保存返回地址、栈帧建立与销毁等。内联优化通过将函数体直接“复制粘贴”到调用处，消除了这些开销。

手动内联控制：-Oi
- 基本用法：-Oi选项本身会启用内联优化，但它只对那些被显式标记的函数生效。在C中，使用#pragma INLINE；在C++中，使用inline关键字。
```
#pragma INLINE static int add(int a, int b) { return a + b; } // 调用 add(5, 3) 处，代码会被直接替换为 return 5 + 3;
```
- 阈值控制：-Oi=c<n>是更实用的功能。它指示编译器，自动将所有函数体机器码大小估计小于<n>字节的函数进行内联，无论它们是否有inline标记。例如-Oi=c100会内联所有小于100字节的函数。
  - 如何估算？这个“字节数”是编译器在中间代码阶段的一个估算值，并非精确的机器码长度，但足够作为启发式判断的依据。
- 内联的限制：手册列出了编译器无法内联的情况，需要特别注意：
  1. 可变参数函数 (func(...))。
  2. 函数体内包含标签（Label）和goto（这会使控制流分析复杂化）。
  3. 函数体内包含内联汇编（编译器无法理解其语义）。
  4. 函数使用了局部静态变量（内联会导致多个副本，破坏静态语义）。
- 权衡的艺术：内联是以空间换时间的典型。它消除了调用开销，可能还带来更多的跨调用优化机会（因为调用者和被调用者的代码在同一个上下文里了）。但过度内联会导致代码急剧膨胀（“代码膨胀”），反而可能因指令缓存不命中而降低速度。-Oi=c<n>中的<n>就是一个重要的调节旋钮，需要根据目标芯片的缓存大小和性能分析结果来调整。
库函数内联：-Oilib这是嵌入式开发中一个极具价值的优化。我们频繁使用的strcpy,memset,memcpy,strlen等函数，调用开销可能比函数本身的工作量还大。
- 它能做什么：-Oilib告诉编译器，将对这些特定标准库函数的调用，替换为等价的、更高效的内联代码序列，或者替换为更专用的内部函数。
- 实战解析：
  - -Oilib=a(内联strcpy)：对于短字符串复制，内联一个简单循环远比调用库函数并处理其通用逻辑要快。
  - -Oilib=e,f(内联memset,memcpy)：手册说明了内联条件：结果未被使用、用于清零或复制、且长度在1-255字节范围内。满足时，调用会被替换为_memset_clear_8bitCount或_memcpy_8bitCount这样的专用内部函数，这些函数通常是用汇编精心编写的，效率极高。
  - -Oilib=g(移位优化)：将(char)1 << val替换为查表操作_PowOfTwo_8[val]。这对于没有桶形移位器的处理器是巨大的速度提升，但代价是引入了一个小型的查找表，消耗了ROM。此优化仅在-Ot（优化速度）模式下生效，完美体现了速度与空间的权衡。
- 使用建议：在性能关键的代码段，尤其是初始化、数据搬移、字符串处理频繁的地方，启用-Oilib通常能带来立竿见影的效果。你可以通过子选项精细控制内联哪些函数，例如-Oilib=ef只内联memset和memcpy。

4. 代码生成与低级优化控制

除了高级优化，编译器还提供了大量对最终机器码生成进行微调的选项，这些选项往往与具体的处理器架构和应用程序的特定需求紧密相关。

4.1 分支与跳转优化：`-OnBRA`

这是一个非常架构相关的优化。在某些处理器（如手册中提到的XGATE协处理器）上，短距离的函数调用可以用更短的BRA（分支）指令替代JAL（跳转并链接）指令，从而节省代码空间。

原理：JAL指令用于子程序调用，它会将返回地址存入链接寄存器。BRA是简单跳转。如果被调用的函数就在同一个编译单元内，且距离调用点足够近（在BRA指令的寻址范围内，如±512字节），那么用BRA跳过去，再在函数末尾用另一个BRA跳回来，可以节省指令编码空间。
何时禁用（-OnBRA）：如果你的链接器脚本（Linker Script）在链接阶段，可能会将调用者（caller）和被调用者（callee）的代码段放置到相距很远的位置，超出了BRA的跳转范围，那么编译器此时做的这个优化就是错误的，会导致运行时跳转失败。因此，当你不能保证链接布局满足条件时，需要使用-OnBRA禁用此优化，强制使用更通用但更长的JAL指令。
嵌入式开发启示：这个选项提醒我们，编译器和链接器是协同工作的。编译器的许多优化（尤其是与地址相关的）是基于对最终内存布局的假设。在嵌入式开发中，特别是使用自定义链接脚本进行精细内存分区时，需要留意这类优化是否仍然安全。

4.2 初始化优化：`-OnCopyDown`与`-OnCstVar`

这两个选项关乎启动代码和内存初始化，对嵌入式系统的启动速度和ROM占用有细微但重要的影响。

-OnCopyDown：涉及全局变量的初始化。通常启动代码（startup code）会做两件事：1).bss段清零（Zero Out）；2) 将.data段从ROM拷贝到RAM（Copy Down）。如果初始化值是0（如int i=0;），那么拷贝0这个动作是冗余的，因为清零阶段已经做过了。默认情况下，编译器会优化掉这些对0值的拷贝。-OnCopyDown选项会禁止这个优化。
- 何时需要：只有当你的启动代码只做了拷贝初始化（Copy Down），而没有做清零（Zero Out��时，才需要启用此选项。这种场景极其罕见，因为只拷贝不清零意味着未初始化的全局变量会包含随机值，非常危险。
-OnCstVar：涉及const常量。默认情况下，编译器会将所有使用const修饰的全局常量（如const int MAX_LEN = 100;）直接替换为它的字面值（100），并可能将这个常量本身从符号表中优化掉，节省ROM。-OnCstVar会禁用这个优化，强制编译器为常量分配存储空间并通过地址访问。
- 何时需要：1)调试需要：在调试器中，你希望看到这个符号并观察其地址。2)取地址操作：如果你的代码中确实需要对这个常量取地址（&MAX_LEN），编译器必须为其分配空间。不过，聪明的编译器通常能识别这种情况并保留常量。3)兼容性：极少数情况下，可能与某些依赖符号存在的链接脚本或工具不兼容。

4.3 树优化器禁用：`-Ont`

-Ont是一个“卸妆”选项，它禁用编译器前端在生成中间代码（语法树）时进行的大量窥孔优化和代数简化。这些优化非常基础但数量众多。

它禁用什么？手册里列举了一长串，例如：
- -Ont=b：禁用常量折叠。3+7不会被合并成10。
- -Ont=f：禁用条件简化。(a == 0)不会被转换成(!a)。
- -Ont=w：禁用死代码消除。if(1) { i=0; }中的if(1)不会被移除。
- -Ont=m,-Ont=n：禁用移位优化。例如，uL >> 40（对32位数右移40位）不会被直接优化为0。
为什么需要禁用？主要目的是调试和理解编译器行为。
1. 调试：当你进行单步调试时，希望源代码行与机器指令尽可能一一对应。激进优化可能会合并、重排、删除语句，导致调试器跳转诡异，变量“消失”（被优化到寄存器或常量中）。在调试版本中，我们通常使用-O0（禁用所有优化），而-Ont提供了更细粒度的控制。
2. 学习与排查：当你怀疑某个诡异的bug是编译器优化引入时，可以尝试禁用某类优化（如-Ont=s禁用*&p到p的简化），看问题是否消失，从而定位原因。
3. 生成“直白”的代码：在某些教育或验证场景下，需要编译器生成最直接、最符合程序员直觉的代码。

5. 实战配置、问题排查与经验谈

了解了这么多选项，如何组合使用？出了问题怎么查？

5.1 一个典型的嵌入式项目优化配置策略

以下是一个基于经验总结的配置模板，假设使用GCC类编译器（选项名可能不同，但思想相通），针对一个Flash为128KB，RAM为32KB的Cortex-M3项目：

# 全局基础配置 COMMON_FLAGS = -mcpu=cortex-m3 -mthumb -ffunction-sections -fdata-sections # 调试版本：无优化，便于调试 CFLAGS_DEBUG = $(COMMON_FLAGS) -O0 -g3 -DDEBUG # 发布版本：激进优化，追求最小体积和性能 CFLAGS_RELEASE = $(COMMON_FLAGS) -Os -flto -ffreestanding -fno-builtin # 针对特定热点文件的速度优化 CFLAGS_SPEED_CRITICAL = $(COMMON_FLAGS) -Ofast -DNDEBUG # 链接器标志：垃圾回收未使用的段 LDFLAGS = -Wl,--gc-sections -T linkerscript.ld # 在Makefile中针对不同文件应用不同优化 obj/main.o: src/main.c $(CC) $(CFLAGS_RELEASE) -c $< -o $@ obj/dsp_filter.o: src/dsp_filter.c $(CC) $(CFLAGS_SPEED_CRITICAL) -c $< -o $@ # 此文件对速度要求极高

关键点解释：

-Os：全局优先考虑代码大小。
-flto(Link Time Optimization)：链接时优化。允许编译器在链接阶段看到所有模块，进行跨模块的内联和优化，这是提升性能、减小体积的利器。
-ffunction-sections -fdata-sections配合-Wl,--gc-sections：将每个函数、变量放到独立的段中。链接器可以删除最终未被引用的段，有效消除死代码。
-fno-builtin：禁用编译器对标准库函数的内置优化实现。有时为了与自定义或经过裁剪的库链接，需要此选项。可与-Oilib的思想结合，我们可能提供自己的优化版memset。

5.2 常见问题与排查技巧

即使经验丰富，优化带来的问题也时常令人头疼。下面是一个速查表：

现象	可能原因	排查思路与解决方案
程序运行结果错误	1.别名冲突导致CSE错误(`-Oc`+ 指针滥用)。 2.过度激进的常量传播或死代码消除，误删了有副作用的代码（如`volatile`访问）。 3.未定义行为（UB）被编译器利用进行了“合法但意外”的优化。	1. 检查指针操作，确保符合严格别名规则。尝试使用`-fno-strict-aliasing`(GCC) 或调整`-Oa`级别。 2. 对硬件寄存器或共享内存的访问务必使用`volatile`修饰。使用`-O0`编译测试，看错误是否消失。 3. 使用`-Wall -Wextra -Werror`开启所有警告，消除所有UB（如符号整数溢出、未初始化的变量）。
调试时变量“不可用”或值不对	变量被优化到寄存器中，或整个表达式被常量折叠。	1. 调试版本务必使用`-O0 -g`。 2. 对于需要观察的变量，可尝试将其声明为`volatile`（会影响性能），或使用调试器查看寄存器内容。
启用优化后程序崩溃	1.栈溢出：内联或循环展开导致局部变量激增。 2.链接错误：LTO或`-ffunction-sections`导致某些“看似未使用”但实际必要的函数（如中断向量表引用、由汇编或链接脚本引用的函数）被误删。	1. 检查栈使用量分析报告。优化后需重新评估栈空间。 2. 在链接脚本中显式保留必要的段（如`.isr_vector`），或对关键函数使用`__attribute__((used))`(GCC) 防止被GC。
性能未达预期甚至下降	1.代码膨胀导致缓存抖动：过度内联 (`-Oi`阈值过大)。 2.错误的优化目标：对计算密集型循环使用了`-Os`而非`-Ot`。	1. 使用性能分析工具（如ARM DS-5 Streamline）定位热点函数，并针对性调整内联策略。 2. 进行差异化优化：全局`-Os`，对热点文件或函数单独应用`-Ot`或`-Ofast`。
编译时间过长	使用了`-OdocF`、高等级优化（如`-O3`）或LTO。	在开发迭代阶段使用较低优化等级（如`-Og`，GCC的调试优化）。仅在发布构建或性能分析时使用耗时长的优化选项。

5.3 来自踩坑经验的几点忠告

优化不是第一步：永远先写出正确、清晰、可维护的代码。不要为了迎合编译器优化而扭曲代码逻辑。优化是锦上添花，不是雪中送炭。
度量，不要猜测：优化前和优化后，一定要有客观数据。使用size命令查看.text,.data,.bss段的大小变化。使用性能分析器或高精度定时器测量关键函数/循环的执行时间。基于数据做决策。
理解volatile和内存映射I/O：在嵌入式系统中，对硬件寄存器的访问必须使用volatile，告诉编译器“这个值可能会在编译器不知情的情况下改变”，禁止对其进行优化（如缓存到寄存器、重排访问顺序）。错误使用volatile是优化导致硬件操作失败的常见原因。
关注链接器地图文件（Map File）：编译优化后的代码，最终由链接器布局到内存。查看map文件，你可以确认：
- 代码段(.text)和数据段(.data,.bss)的大小是否符合预期。
- 关键函数和变量是否被错误地GC（垃圾回收）了。
- 内存布局是否合理，是否存在对齐浪费。
保持可复现性：优化选项是构建配置的一部分。务必在Makefile或CMakeLists.txt中清晰记录所有优化选项，确保团队每个成员和持续集成（CI）服务器都能生成完全一致的可执行文件。

编译器优化是一个深邃的领域，今天探讨的只是后端优化的冰山一角。真正的精通来自于持续实践：为一个性能瓶颈函数反复调整选项、观察反汇编、测量周期数。这个过程有时枯燥，但当看到代码体积��小几个KB或关键循环速度提升20%时，那种成就感是实实在在的。记住，没有“最好”的优化选项，只有“最适合”你当前项目目标和硬件约束的选项组合。

嵌入式开发中的编译器优化实践：从-Os到函数内联的工程权衡

1. 编译器优化：从“能跑”到“跑得好”的工程实践

2. 优化目标设定：在大小与速度间走钢丝

2.1 核心优化指令：`-Os`与`-Ot`

2.2 定义优化集：`-OdocF`的函数级精细控制

3. 核心优化技术解析：CSE与内联

3.1 公共子表达式消除（CSE）：`-Oc`

3.2 函数内联：`-Oi`与`-Oilib`

4. 代码生成与低级优化控制

4.1 分支与跳转优化：`-OnBRA`

4.2 初始化优化：`-OnCopyDown`与`-OnCstVar`

4.3 树优化器禁用：`-Ont`

5. 实战配置、问题排查与经验谈

5.1 一个典型的嵌入式项目优化配置策略

5.2 常见问题与排查技巧

5.3 来自踩坑经验的几点忠告

华尔街将中际旭创等做成AI彩票，中国版“海力士交易”真要来了？

我的世界率土之滨联动时间介绍我的世界率土之滨什么时候联动

AI时代如何高效养号？ChatGPT+TikTok运营实战指南

终极指南：如何用QKeyMapper在Windows上实现零重启按键映射，让游戏办公效率翻倍

嵌入式安全引擎中断机制：从MPC8533E SEC看硬件错误处理设计

LLM 推理性能调优：从显存瓶颈到吞吐优化，大模型服务的工程化加速

1. 编译器优化：从“能跑”到“跑得好”的工程实践

2. 优化目标设定：在大小与速度间走钢丝

2.1 核心优化指令：-Os与-Ot

2.2 定义优化集：-OdocF的函数级精细控制

3. 核心优化技术解析：CSE与内联

3.1 公共子表达式消除（CSE）：-Oc

3.2 函数内联：-Oi与-Oilib

4. 代码生成与低级优化控制

4.1 分支与跳转优化：-OnBRA

4.2 初始化优化：-OnCopyDown与-OnCstVar

4.3 树优化器禁用：-Ont

5. 实战配置、问题排查与经验谈

5.1 一个典型的嵌入式项目优化配置策略

5.2 常见问题与排查技巧

5.3 来自踩坑经验的几点忠告

华尔街将中际旭创等做成AI彩票，中国版“海力士交易”真要来了？

我的世界率土之滨联动时间介绍 我的世界率土之滨什么时候联动

AI时代如何高效养号？ChatGPT+TikTok运营实战指南

终极指南：如何用QKeyMapper在Windows上实现零重启按键映射，让游戏办公效率翻倍

嵌入式安全引擎中断机制：从MPC8533E SEC看硬件错误处理设计

LLM 推理性能调优：从显存瓶颈到吞吐优化，大模型服务的工程化加速

2.1 核心优化指令：`-Os`与`-Ot`

2.2 定义优化集：`-OdocF`的函数级精细控制

3.1 公共子表达式消除（CSE）：`-Oc`

3.2 函数内联：`-Oi`与`-Oilib`

4.1 分支与跳转优化：`-OnBRA`

4.2 初始化优化：`-OnCopyDown`与`-OnCstVar`

4.3 树优化器禁用：`-Ont`

我的世界率土之滨联动时间介绍我的世界率土之滨什么时候联动