第六章：异步访问的同步：6.1.2 dma_fence spinlock机制深度解析-洪萨配资

本节深度分析dma_fence的spinlock的实现和应用。

1. 为什么是指针而不是嵌入变量

struct dma_fence中的 lock 成员定义为：

spinlock_t*lock;

而非：

spinlock_tlock;

这是一个经过深思熟虑的设计决策。核心原因是：多个 fence 需要共享同一把锁以实现原子性操作。

2. 锁的职责

这把 spinlock 保护的是 fence 的状态转换临界区，具体包括：

操作	锁的作用
`dma_fence_signal()`	持锁设置 SIGNALED_BIT，遍历 cb_list 触发回调
`dma_fence_add_callback()`	持锁将 callback 挂入 cb_list
`enable_signaling()`	在锁持有状态下被调用
`dma_fence_remove_callback()`	持锁从 cb_list 摘除 callback

这些操作之间存在竞态：

CPU0: dma_fence_add_callback() CPU1: dma_fence_signal() spin_lock_irqsave(lock) spin_lock_irqsave(lock) 检查 SIGNALED_BIT 设置 SIGNALED_BIT 挂入 cb_list 遍历 cb_list，触发回调 spin_unlock_irqrestore(lock) spin_unlock_irqrestore(lock)

锁确保了这两个操作互斥：要么 callback 先挂上，signal 遍历时能触发它；要么 signal 先完成，add_callback 发现已 signaled 直接返回。

3. 共享锁的典型场景

3.1 GPU Ring 上的有序 fence

一个 GPU ring 产生的 fence 具有严格的时间顺序（seqno 递增）。当 GPU 完成到某个 seqno 时，interrupt handler 需要原子地signal 所有 <= 该 seqno 的 fence：

/* 所有 fence 共享 ring->fence_lock */dma_fence_init(&job1->fence,ops,&ring->fence_lock,ring->ctx,1);dma_fence_init(&job2->fence,ops,&ring->fence_lock,ring->ctx,2);dma_fence_init(&job3->fence,ops,&ring->fence_lock,ring->ctx,3);/* IRQ handler — 一次获锁，批量 signal */voidgpu_irq_handler(structgpu_ring*ring){u64 completed_seqno=read_hw_seqno(ring);spin_lock(&ring->fence_lock);/* 获取一次 */list_for_each_entry(fence,&ring->pending_fences,link){if(fence->seqno<=completed_seqno)dma_fence_signal_locked(fence);/* 无需再获锁 */}spin_unlock(&ring->fence_lock);}

如果每个 fence 嵌入独立的锁，批量 signal 就需要：

逐个获取/释放锁（性能差，且无法保证原子性）
或者嵌套获锁（死锁风险，lockdep 告警）

3.2 dma_resv 中的 fence 管理

dma_resv（reservation object）管理一组 fence。当 TTM 需要等待所有 fence 完成时，共享锁让操作更高效：

/* drm_sched_fence 共享 scheduler 的锁 */dma_fence_init(&sched_fence->scheduled,&sched_ops,&scheduler->lock,ctx,seqno);

3.3 独占锁的简单场景

并非所有场景都需要共享。对于"一个对象只有一个 fence"的情况，锁嵌入在拥有者对象中即可：

/* amdgpu_svm_bo：每个 bo 只有一个 eviction fence */structamdgpu_svm_bo{structdma_fenceeviction_fence;spinlock_tlock;/* 仅此一个 fence 使用 */};dma_fence_init(&svm_bo->eviction_fence,&ops,&svm_bo->lock,ctx,1);

这等效于嵌入变量，但 API 统一为指针形式。

4. 锁与生命周期

4.1 锁必须比 fence 活得久

dma_fence_signal()和dma_fence_release()都会访问 lock。fence 可能在 signal 后被立即 put 掉（refcount→0），但如果此时另一个 CPU 正在dma_fence_add_callback()中持有锁，lock 必须仍然有效。

因此锁的拥有者（ring、scheduler、svm_bo）的生命周期必须覆盖所有使用该锁的 fence：

ring 创建 ──────────────────────────────── ring 销毁 │ │ ├── fence1 创建 ─── signal ─── release │ ├── fence2 创建 ────────── signal ── rel │ └── fence3 创建 ─────────────── signal ────┘

4.2 signal 后的 lock 访问限制

根据dma-fence.h中的文档：

All data not stored directly in the dma-fence object, such as the
&dma_fence.lock … MUST NOT be accessed after the fence has been signalled

这意味着一旦 fence signaled，驱动可以释放锁的拥有者。但实际上这受 RCU grace period 保护——fence 的 release 使用kfree_rcu，确保所有并发的 lock 访问完成后才真正释放内存。

5. irqsave 语义

fence 的锁使用spin_lock_irqsave/spin_unlock_irqrestore：

/* dma_fence_signal 内部 */spin_lock_irqsave(fence->lock,flags);// ... signal 逻辑 ...spin_unlock_irqrestore(fence->lock,flags);

原因是 fence signal 可能发生在：

进程上下文：worker thread 主动 signal
中断上下文：GPU interrupt handler 中 signal

如果不禁 IRQ，进程上下文持锁时 IRQ 到来，handler 尝试获取同一把锁 →死锁。irqsave确保持锁期间本 CPU 中断关闭。

这也是enable_signaling文档中强调的：

This is called with irq’s disabled, so only spinlocks which disable
IRQ’s can be used in the code outside of this callback.

6. enable_signaling 与锁的交互

enable_signaling在锁持有状态下被调用，这保证了：

/* dma_fence_add_callback 内部简化逻辑 */spin_lock_irqsave(fence->lock,flags);if(test_bit(SIGNALED_BIT,&fence->flags)){// 已 signal，直接返回ret=-ENOENT;}elseif(!test_and_set_bit(ENABLE_SIGNAL_BIT,&fence->flags)){// 首次需要软件通知，调用 enable_signalingif(!fence->ops->enable_signaling(fence)){// 返回 false = fence 已完成或无法启用dma_fence_signal_locked(fence);ret=-ENOENT;}}if(ret==0)list_add_tail(&cb->node,&fence->cb_list);spin_unlock_irqrestore(fence->lock,flags);

整个 “检查状态 → enable_signaling → 挂 callback” 在同一把锁保护下原子完成，不存在窗口期。

7. 设计总结

设计选择	原因
指针而非嵌入	支持多 fence 共享锁，批量原子 signal
irqsave	signal 可能在 IRQ 中发生
锁在 fence 外部	生命周期由拥有者管理，长于 fence
enable_signaling 持锁调用	原子化"启用通知 + 挂 callback"流程

这套机制让 dma_fence 能适应从"单 fence 简单场景"到"数百个 fence 流水线处理"的所有 GPU 同步需求，同时保持 lockdep 友好和 IRQ 安全。