news 2026/5/9 4:35:32

端到端课程自用 6 规划 端到端的模型训练范式 AI 笔记

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
端到端课程自用 6 规划 端到端的模型训练范式 AI 笔记

概述

多任务

  • Traffic light head→ 红绿灯检测
  • OCR/ETC/...→ 指示牌分类/OCR、ETC口/抬杆检测
  • OCC head→ OCC感知(Occupancy感知)
  • OD Former (PETR)→ 动态障碍物检测 + 时序跟踪/预测
  • Map Former (MapTr)→ 静态车道线建图
  • Planner Former→ Planning规划 → 输出轨迹Trajectory
  • Transformer-based Head :
    在 OD Former 中:QKV 用于建模“物体-物体”、“物体-场景”之间的时空关系(如跟踪、预测)
    在 Map Former 中:QKV 用于建模“车道线-车道线”、“车道线-车辆”之间的关系(如建图一致性)
    在 Planner Former 中:QKV 用于建模“自车-障碍物-车道线”之间的交互,生成安全轨迹

训练的难点

多loss平衡
各种训练策略
多种数据标注

解决思路 多阶段训练

解决训练不稳定 复杂度爆炸
整体思路可以是训练感知和训练规划分开

感知阶段

预训练 image backbone 为主要训练对象 加上红绿灯检测 辅助任务 杆牌检测 多loss平衡
单帧训练 学习3D感知能力 backbone 学习率要小 多loss平衡 主要学习 bev backbone 解码器:od former PETR方法 map former Maptr方法 occ header
时序训练 学习率适当减小 backbone 可以freeze

规划阶段

先 freeze 其他模块
模仿人类驾驶轨迹
需要多种多样的数据 分布很重要 需要不同场景行为 左右转弯 掉头等

然后 感知与planning一起训练 把整体学习率变小
此时感知模块的loss weifht可以调小

planning强化学习 更小的学习率 仅训练planning

一段式端到端和两段式训练方法的对比和区别

两段式 的出现有历史背景 感知各种方法收敛之后 pnc数据驱动尚未成熟
把感知整合到一起 然后 规划成为一个独立模型
区别在于梯度在训练时候是否要反传

两段式训练阶段

仅训练planning
注意点同感知的训练
但是 可以把感知的数据推理结果作为输入

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 4:34:53

多模态大语言模型在视频推理中的高效优化实践

1. 项目背景与核心价值去年在部署一个视频内容分析系统时,我发现传统方案存在明显的效率瓶颈——当系统需要同时处理视频帧序列和文本描述时,计算资源消耗呈指数级增长。这促使我开始探索如何让多模态大语言模型(MLLM)在视频推理任…

作者头像 李华
网站建设 2026/5/9 4:32:41

磁盘碎片整理原理与实时优化技术详解

1. 磁盘碎片整理的底层原理与性能影响在机械硬盘时代,文件系统采用"先到先得"的空间分配策略。当新建一个Word文档时,系统会在磁盘上寻找第一个足够大的连续空闲区块来存储它。但随着文件的反复修改和删除,原本完整的空闲空间会被分…

作者头像 李华
网站建设 2026/5/9 4:31:15

ARM SME指令集:LD1W与LDNT1B深度解析与优化实践

1. ARM SME指令集概述在当今计算密集型应用如机器学习、信号处理和科学计算的推动下,现代处理器架构不断演进以提供更高的并行处理能力。作为ARMv9架构的重要组成部分,可扩展矩阵扩展(Scalable Matrix Extension, SME)代表了ARM在向量和矩阵处理领域的最…

作者头像 李华
网站建设 2026/5/9 4:31:14

SafeLink:基于智能合约与ERC-8004的AI Agent去信任协作协议

1. 项目概述:当AI Agent开始“雇佣”彼此在AI Agent的世界里,协作一直是个难题。传统的Agent间调用,要么是基于预设的、完全可信的API,要么就是“裸奔”式的请求-响应,缺乏一个能确保“一手交钱,一手交货”…

作者头像 李华
网站建设 2026/5/9 4:31:11

VERIENV框架:Web自动化测试与安全评估的合成网站技术

1. 项目背景与核心价值在Web自动化测试和安全评估领域,传统方法往往面临环境搭建复杂、测试覆盖率低、扩展性差等痛点。VERIENV框架的诞生,正是为了解决这些行业普遍存在的难题。这个框架最吸引我的地方在于它创造性地采用了合成网站技术,为智…

作者头像 李华