ARM64冷启动代码从零实现：点亮第一个LED示例-洪萨配资

从零点亮LED：深入ARM64冷启动的底层世界

你有没有想过，一块开发板上电后，第一行代码是在哪里执行的？
它如何让一颗沉睡的CPU苏醒？又是怎样通过几行指令，控制一个小小的LED亮起？

今天，我们不依赖U-Boot、不借助Linux，甚至不用任何引导框架——从零开始，在ARM64架构下亲手编写一段冷启动代码，点亮第一个LED。这不仅是一次动手实践，更是一场对处理器启动本质的深度探索。

上电之后，谁在掌控一切？

当你的开发板插上电源，芯片内部的电路瞬间被激活。但此时，CPU核心还处于“懵懂”状态：缓存未启用、内存控制器未配置、连堆栈都没有。那么，第一条指令从何而来？

答案是：复位向量（Reset Vector）。

几乎所有ARM64 SoC在上电或复位时，都会将程序计数器（PC）自动指向一个预设的物理地址。这个地址就是硬件定义的起点，也是整个系统软件栈的“创世点”。常见的复位入口包括：

0x00000000—— 某些Allwinner、Rockchip芯片使用此地址映射到片内ROM
0xffff0000—— 更现代的设计倾向于高地址，用于安全启动流程

在这个位置，我们必须放置一段极简却至关重要的代码——这就是所谓的冷启动代码（Cold Boot Code）。

而更关键的是：这段代码运行在EL3异常级别。

什么是EL3？为什么非它不可？

ARM64引入了四个权限层级，称为异常级别（Exception Level, EL）：

EL	名称	典型用途
EL0	用户态	应用程序运行环境
EL1	内核态	Linux/RTOS内核
EL2	虚拟化监控	Hypervisor
EL3	安全监控	安全启动、TrustZone切换

冷启动必须始于EL3，因为只有在这里，代码才拥有完全的系统控制权。你可以：

配置安全状态（Secure State）
设置页表和MMU
控制中断控制器（GIC）
切换执行状态（AArch64/AArch32）

换句话说，EL3是你能接触到的最接近硅片的软件层。一旦错过这个窗口，很多底层配置将再也无法修改。

构建我们的启动骨架：从汇编说起

现在我们知道，系统从EL3开始执行，目标是尽快建立基本运行环境，并跳转到C语言进行后续初始化。

下面是我们要写的第一个真正可执行的代码块——一个精简但完整的EL3启动入口。

.section ".vectors", "ax" .global vectors_start vectors_start: b reset_handler // 复位异常 → 进入主处理 b . // 未定义指令异常（保留） b . // 软中断（SVC） b . b . // SError中断 b . // IRQ b . // FIQ b . reset_handler: // Step 1: 设置堆栈指针 SP_EL3 ldr x0, =stack_top mov sp, x0 // Step 2: 将VBAR_EL3指向当前向量表 adr x0, vectors_start msr vbar_el3, x0 // Step 3: 关闭MMU、指令/数据缓存 mrs x0, sctlr_el3 bic x0, x0, #(1 << 0) | (1 << 2) | (1 << 12) // 清除 M(CPU enable), C(cache), I(icache) msr sctlr_el3, x0 // Step 4: 屏蔽所有中断 msr daifset, #0xf // DAIF = Debug, SError, IRQ, FIQ 全部屏蔽 // Step 5: 跳转到C函数继续初始化 bl c_startup hang: wfe // 等待事件，避免空跑耗电 b hang // 死循环挂起

这段代码做了什么？

定义异常向量表：8个异常入口，目前只实现复位；
设置SP_EL3：没有堆栈，C函数调用会直接崩溃；
安装VBAR_EL3：告诉CPU：“以后异常就来找我”；
清理SCTLR_EL3：关闭MMU和缓存，确保裸机访问安全；
关闭中断：防止意外触发异常导致死机；
跳入C世界：为复杂初始化铺平道路。

⚠️ 注意：VBAR_EL3要求地址按2KB对齐（低11位为0），否则会引发异常。这里用adr指令取相对地址，通常能满足对齐要求。

让硬件动起来：GPIO控制实战

终于到了激动人心的时刻——我们要让LED亮起来！

但别急，先搞清楚一个问题：为什么不能直接写GPIO寄存器？

因为在大多数SoC中，外设模块默认是“断电”的。你需要先打开它的时钟门控，才能访问其寄存器。否则，读写可能毫无反应，就像给一盏没通电的灯泡发信号一样徒劳。

以Allwinner A64为例，假设我们要控制PA0引脚上的LED：

模块	基地址	功能
CCU	`0x01c20000`	时钟控制单元
GPIOA	`0x01c20800`	GPIO控制器

第一步：打开时钟

#define CCU_BASE (0x01c20000UL) #define BUS_CLK_GATE_REG0 (*(volatile uint32_t*)(CCU_BASE + 0x60)) // 使能GPIOA时钟（bit0） BUS_CLK_GATE_REG0 |= (1 << 0);

这一步至关重要！如果没有开启时钟，后续所有操作都将失败。

第二步：配置引脚功能

每个GPIO引脚可以工作在多种模式（输入、输出、复用功能等）。我们需要通过CFG寄存器将其设为普通输出。

#define GPIO_BASE (0x01c20800UL) #define GPIO_CFG0 (*(volatile uint32_t*)(GPIO_BASE + 0x00)) #define GPIO_DAT (*(volatile uint32_t*)(GPIO_BASE + 0x10)) // PA0对应CFG0的[3:0]位 GPIO_CFG0 &= ~(0xF << 0); // 清除原配置 GPIO_CFG0 |= (0x1 << 0); // 设为输出模式（具体值查手册）

📌 提示：MUX值因厂商而异。有的芯片0x1表示输出，有的可能是0x3。务必查阅《SoC Technical Reference Manual》确认。

第三步：输出电平点亮LED

最后一步，写数据寄存器。

// 假设LED共阳极接法：低电平点亮 GPIO_DAT &= ~(1 << 0); // PA0 = 0 → LED ON // 或者如果是共阴极，则： // GPIO_DAT |= (1 << 0); // PA0 = 1 → LED ON

把这些封装成一个函数：

void gpio_init_and_light_led(void) { // 1. 开启GPIOA时钟 BUS_CLK_GATE_REG0 |= (1 << 0); // 2. 设置PA0为输出 GPIO_CFG0 &= ~(0xF << 0); GPIO_CFG0 |= (0x1 << 0); // 3. 输出低电平点亮LED（共阳极） GPIO_DAT &= ~(1 << 0); }

然后在c_startup()中调用它：

void c_startup(void) { gpio_init_and_light_led(); // ...其他初始化 }

如果一切顺利，上电瞬间，LED就会亮起！

如何构建并烧录镜像？

有了代码，还需要正确的构建流程。

编译工具链

使用标准的交叉编译器：

aarch64-none-elf-gcc -c start.S -o start.o aarch64-none-elf-gcc -c main.c -o main.o aarch64-none-elf-gcc -T linker.ld -o kernel.elf start.o main.o aarch64-none-elf-objcopy -O binary kernel.elf kernel.bin

链接脚本（linker.ld）

确保代码从正确地址加载：

ENTRY(vectors_start) MEMORY { RAM : ORIGIN = 0x00000000, LENGTH = 64K } SECTIONS { .text : { *(.vectors) *(.text) } > RAM .bss : { *(.bss) } > RAM } _stack_size = 0x1000; stack_top = ORIGIN(RAM) + LENGTH(RAM);

这样，.text段（包含向量表）就被固定在0x00000000，与SoC期望的复位向量一致。

烧录方式

根据开发板支持的方式选择：

使用USB刷机工具（如sunxi-fel）
写入SPI Flash或SD卡指定扇区
JTAG调试器直接加载到SRAM

常见坑点与调试秘籍

即使逻辑正确，也可能遇到“灯不亮”的尴尬局面。以下是几个高频问题及应对策略：

🔴 问题1：程序根本没运行

可能原因：链接地址错误，代码没放在复位向量处。
排查方法：检查.ld脚本是否把.text放到了0x00000000；确认SoC是否从该地址启动。

🔴 问题2：调用C函数后死机

可能原因：堆栈未设置。
解决办法：确保在bl c_startup之前已设置sp寄存器。

🔴 问题3：GPIO写无效

可能原因：忘记开时钟。
验证方法：尝试读回寄存器值，看是否能正常读写。

🔴 问题4：LED常亮或常灭

可能原因：电平极性理解错误。
建议：查原理图，确认LED是共阳还是共阴接法。

🔴 问题5：复位后行为不稳定

可能原因：SRAM内容未清零，.bss段残留旧数据。
修复：在C启动函数中手动清.bss：

extern unsigned int __bss_start__, __bss_end__; void clear_bss(void) { unsigned int *addr = &__bss_start__; while (addr < &__bss_end__) *addr++ = 0; }

更进一步：这不是终点，而是起点

点亮LED只是一个开始。当你掌握了冷启动的基本套路，接下来就可以做更多有趣的事：

✅ 添加串口输出

配置UART控制器，输出“Hello World”，告别盲调时代。

✅ 移植轻量级RTOS

比如FreeRTOS或Zephyr，实现多任务调度。

✅ 实现多核启动

唤醒其他CPU核心，完成PSCI CPU_ON调用。

✅ 启用MMU和虚拟内存

建立页表，开启分页机制，迈向操作系统的大门。

✅ 构建TrustZone环境

在EL3中划分安全世界与非安全世界，打造可信执行环境（TEE）。

写在最后

我们用了不到百行代码，完成了一次完整的ARM64冷启动旅程：

从复位向量出发，
在EL3中建立运行环境，
手动配置时钟与GPIO，
最终点亮了那颗小小的LED。

这看似简单，实则涵盖了嵌入式系统最核心的知识体系：
异常模型、内存映射、寄存器操作、时钟管理、外设控制。

掌握这些，你就不再只是“用别人写好的东西”，而是真正拥有了从硅片之上构建系统的自由。

如果你正在学习嵌入式开发、准备自研固件、或是想深入了解启动过程，不妨动手试一试。找一块支持ARM64的开发板，写一段属于你自己的启动代码。

当你看到那个LED亮起时，你会明白——
那是你亲手唤醒的一台机器。

欢迎在评论区分享你的实现过程，或者提出疑问。让我们一起把底层玩得更透。

ARM64冷启动代码从零实现：点亮第一个LED示例