文章目录
- 一、规范编制背景
- 二、规范定位与架构
- 三、核心设计原则
- 四、API 鸟瞰图
- 五、关键条款逐条解读 + 源码级示例
- ① 【AP_SWS_SHWA_00909】Queue 创建——设备选择策略
- ② 【AP_SWS_SHWA_00211】Buffer 创建——零拷贝共享
- ③ 【AP_SWS_SHWA_00008】Accessor 创建——访问模式与同步
- ④ 【AP_SWS_SHWA_01409】Device 健康监控——功能安全核心
- ⑤ 【AP_SWS_SHWA_00917】超时等待——确定性保障
- 六、端到端用例:激光雷达点云降采样 + 安全监控
- 七、与 SYCL 2020 的“车规化差异”
一、规范编制背景
趋势
- L3/L4 自动驾驶算法(激光雷达点云滤波、BEV Transformer、SLAM)对算力需求 >100 TOPS,仅靠 CPU 无法满足。
- 主流 SoC 同时集成 CPU + GPU + FPGA/AI-Core,形成“异构计算”常态。
痛点
- 各芯片厂商 SDK(CUDA、OpenCL、ROCm、XRT)接口差异大,切换平台 = 重写代码。
- 传统 SYCL 依赖 C++ 异常,不符合 ISO-26262 ASIL-B/C “无异常” 要求。
- 异步执行出错时无统一错误码,难以做安全诊断和故障降级。
目标
AUTOSAR 在 AP R25-11 首次发布Safe Hardware Acceleration(SHWA)规范,提供:- 一套C++17 头文件级 API,同一份源码可在 Intel-GPU、NVIDIA-GPU、Xilinx-FPGA、CPU 仿真上运行;
- 异常-free(全部返回
ara::core::Result),支持 ASIL-D; - 与PHM、EM、State Management无缝集成,可上报健康状态、超时故障;
- 运行时监控设备温度/负载,预防热失控。
二、规范定位与架构
| 层级 | 内容 |
|---|---|
| 需求层 | RS SafeHardwareAcceleration(18 条需求) |
| 说明层 | EXP SafeHardwareAccelerationAPI(用例与最佳实践) |
| 实现层 | SWS SafeHardwareAcceleration(sws规范主要内容,API 接口定义) |
SHWA 以仅头库(header-only library)形式交付,运行在应用进程空间,不新增守护进程,因此:
- 不影响实时性;
- 可直接链接到 ASIL 分区,方便追溯。
三、核心设计原则
| 原则 | 具体表现 |
|---|---|
| 1. Exception-less | 所有方法标记noexcept,错误通过ara::core::Result或异步回调返回。 |
| 2. RAII + 单所有权 | Buffer/Queue/Accessor 只能std::unique_ptr管理,禁止拷贝。 |
| 3. 工厂方法 | 禁止使用构造函数,统一通过静态Create()返回结果,失败原因一目了然。 |
| 4. 异步错误必报 | 提交任务时必须提供AsyncErrorHandler,否则编译期拒绝。 |
| 5. 线程安全分级 | 单进程内对象不共享;跨线程读写同一 Buffer 时返回kResourceBusy。 |
四、API 鸟瞰图
namespaceara::shwa{classDevice;// 代表一个 GPU/FPGA/CPUclassDeviceMonitor;// 查询负载、健康度classQueue;// 任务队列(有序/乱序)classTaskHandler;// 内核代码入口classEvent;// 任务同步令牌template<intD>classBuffer;// 主机↔设备共享内存template<intD>classAccessor;// 访问器(Read/Write/ReadWrite)template<intD>classRange/Id;// 多维索引 & 范围}五、关键条款逐条解读 + 源码级示例
① 【AP_SWS_SHWA_00909】Queue 创建——设备选择策略
// 1. 挑选负载最低的 GPUautogpu=ara::shwa::Device::Create(ara::shwa::GpuSelector{}).Value();autoqueue=ara::shwa::Queue::Create(gpu,[](autoerrs){/* 异步错误回调 */for(auto&e:errs)PHM_Report(e);}).Value();规范要点
Create()返回Result<unique_ptr<Queue>>,失败立即感知。- 异步回调在任意线程触发,禁止抛异常,只能记录/上报。
② 【AP_SWS_SHWA_00211】Buffer 创建——零拷贝共享
constexprsize_t POINTS=300'000;autorange=ara::shwa::Range<1>::Create(POINTS).Value();autobuffer=ara::shwa::Buffer<float,1>::Create(range).Value();- Buffer 内部自动完成host↔device 内存分配与映射。
- 禁止直接访问,只能通过
Accessor读写,确保数据一致性。
③ 【AP_SWS_SHWA_00008】Accessor 创建——访问模式与同步
queue->Submit([&](ara::shwa::TaskHandler&h){autoacc=ara::shwa::Accessor<float,1,AccessMode::read_write>::Create(buffer,h).Value();h.ParallelFor(POINTS,[=](ara::shwa::Id<1>id){acc[id]=0.5f*acc[id]+1.0f;// 点云滤波});});AccessMode模板参数告诉运行时是否需要回写,避免冗余 DMA。ParallelFor等价于 CUDA__global__内核,由底层 SYCL/DPC++ 实现。
④ 【AP_SWS_SHWA_01409】Device 健康监控——功能安全核心
automon=ara::shwa::DeviceMonitor::Create(gpu).Value();if(mon.Status()!=DeviceStatus::kReady||mon.CurrentLoad()>80||mon.HealthStatus()==DeviceHealthStatus::OverTemp){// 触发降级:切换到 CPU 队列或降低帧率returnFallbackToCpu();}- 支持温度、ECC 错误、驱动失去响应等多维度状态。
- 与 PHM 联动:可上报
Checkpoint和HealthChannelFailure。
⑤ 【AP_SWS_SHWA_00917】超时等待——确定性保障
// 最长等待 50 ms,超时视为设备故障if(queue->WaitFor(50).HasError()){PHM_Report(ShwaErrorCode::kTimedOut);StateManagement_RequestStateChange(EGState::Degraded);}- 防止 GPU 挂死导致整条应用链失去响应。
- 超时错误码
kTimedOut属于rollback_semantics,应用可重试或切换设备。
六、端到端用例:激光雷达点云降采样 + 安全监控
#include"ara/shwa/..."#include"ara/phm/..."constexprsize_t N=300'000;intmain(){ara::core::Initialize();// 初始化所有 FC/* 1. 设备选择 */autodev=ara::shwa::Device::Create(ara::shwa::GpuSelector{}).Value();automon=ara::shwa::DeviceMonitor::Create(dev).Value();/* 2. 异步错误处理 */autoonErr=[](auto&errs){for(auto&e:errs)PHM_Report(e);};autoqueue=ara::shwa::Queue::Create(dev,onErr).Value();/* 3. 数据容器 */autorange=ara::shwa::Range<1>::Create(N).Value();autocloud=ara::shwa::Buffer<Point3F,1>::Create(range).Value();/* 4. 注册为受监督实体 */PHM_RegisterSE("LidarDownSampler",/*alivePeriod=*/50ms);while(true){PHM_Checkpoint(0);// Alive 监督/* 5. 健康度检查 */if(mon.HealthStatus()!=DeviceHealthStatus::Healthy||mon.CurrentLoad()>70){PHM_Checkpoint(1);// 降级路径continue;}/* 6. 提交 GPU 任务 */queue->Submit([&](ara::shwa::TaskHandler&h){autoacc=ara::shwa::Accessor<Point3F,1,AccessMode::read_write>::Create(cloud,h).Value();h.ParallelFor(N,[=](ara::shwa::Id<1>id){acc[id]=voxelGridFilter(acc[id]);});});/* 7. 超时等待 */if(queue->WaitFor(50).HasError()){PHM_Checkpoint(2);// 故障路径}}ara::core::Deinitialize();}安全证据链
- Alive 监督:周期 50 ms,丢失 3 次 → PHM 触发重启。
- Deadline 监督:WaitFor 50 ms 内必须返回,超时 → 切换到 CPU 队列。
- Logical 监督:HealthStatus 异常 → 跳过本次处理,不阻塞主循环。
七、与 SYCL 2020 的“车规化差异”
| 维度 | SYCL 2020 | SHWA(车规化) |
|---|---|---|
| 异常 | try/catch | ara::core::Result |
| 设备监控 | 无 | DeviceMonitor实时温度/负载 |
| 超时 | wait()阻塞 | WaitFor(ms)可配置 |
| 功能安全 | 通用计算 | 集成 PHM、EM、HealthChannel |
| 头文件 | <CL/sycl.hpp> | <ara/shwa/*.h> |
实现层允许直接复用 DPC++、hipSYCL、ComputeCpp,仅在上层做“汽车封装”,降低移植成本。