news 2026/5/9 4:35:32

端到端课程自用 6 规划端到端的模型训练范式 AI 笔记

张小明

前端开发工程师

1.2k 24

文章封面图 — 端到端课程自用 6 规划端到端的模型训练范式 AI 笔记

概述

多任务

Traffic light head→ 红绿灯检测
OCR/ETC/...→ 指示牌分类/OCR、ETC口/抬杆检测
OCC head→ OCC感知（Occupancy感知）
OD Former (PETR)→ 动态障碍物检测 + 时序跟踪/预测
Map Former (MapTr)→ 静态车道线建图
Planner Former→ Planning规划 → 输出轨迹Trajectory
Transformer-based Head ：
在 OD Former 中：QKV 用于建模“物体-物体”、“物体-场景”之间的时空关系（如跟踪、预测）
在 Map Former 中：QKV 用于建模“车道线-车道线”、“车道线-车辆”之间的关系（如建图一致性）
在 Planner Former 中：QKV 用于建模“自车-障碍物-车道线”之间的交互，生成安全轨迹

训练的难点

多loss平衡
各种训练策略
多种数据标注

解决思路多阶段训练

解决训练不稳定复杂度爆炸
整体思路可以是训练感知和训练规划分开

感知阶段

预训练 image backbone 为主要训练对象加上红绿灯检测辅助任务杆牌检测多loss平衡
单帧训练学习3D感知能力 backbone 学习率要小多loss平衡主要学习 bev backbone 解码器：od former PETR方法 map former Maptr方法 occ header
时序训练学习率适当减小 backbone 可以freeze

规划阶段

先 freeze 其他模块
模仿人类驾驶轨迹
需要多种多样的数据分布很重要需要不同场景行为左右转弯掉头等

然后感知与planning一起训练把整体学习率变小
此时感知模块的loss weifht可以调小

planning强化学习更小的学习率仅训练planning

一段式端到端和两段式训练方法的对比和区别

两段式的出现有历史背景感知各种方法收敛之后 pnc数据驱动尚未成熟
把感知整合到一起然后规划成为一个独立模型
区别在于梯度在训练时候是否要反传

两段式训练阶段

仅训练planning
注意点同感知的训练
但是可以把感知的数据推理结果作为输入

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/5/9 4:34:53

多模态大语言模型在视频推理中的高效优化实践

1. 项目背景与核心价值去年在部署一个视频内容分析系统时，我发现传统方案存在明显的效率瓶颈——当系统需要同时处理视频帧序列和文本描述时，计算资源消耗呈指数级增长。这促使我开始探索如何让多模态大语言模型（MLLM）在视频推理任…

作者头像

李华

网站建设 2026/5/9 4:32:41

磁盘碎片整理原理与实时优化技术详解

1. 磁盘碎片整理的底层原理与性能影响在机械硬盘时代，文件系统采用"先到先得"的空间分配策略。当新建一个Word文档时，系统会在磁盘上寻找第一个足够大的连续空闲区块来存储它。但随着文件的反复修改和删除，原本完整的空闲空间会被分…

作者头像

李华

网站建设 2026/5/9 4:32:37

基于Python与SQLite构建自动化个人预算管理系统：从数据采集到报告生成

1. 项目概述：一个“无聊”预算工具的诞生最近在GitHub上看到一个挺有意思的项目，叫guseducampos/boring-budget。光看名字，“无聊的预算”，你可能觉得这玩意儿能有多复杂？不就是个记账软件嘛。但作为一个在个人财务管理…

作者头像

李华

网站建设 2026/5/9 4:31:15

ARM SME指令集：LD1W与LDNT1B深度解析与优化实践

1. ARM SME指令集概述在当今计算密集型应用如机器学习、信号处理和科学计算的推动下，现代处理器架构不断演进以提供更高的并行处理能力。作为ARMv9架构的重要组成部分，可扩展矩阵扩展(Scalable Matrix Extension, SME)代表了ARM在向量和矩阵处理领域的最…

作者头像

李华

网站建设 2026/5/9 4:31:14

SafeLink：基于智能合约与ERC-8004的AI Agent去信任协作协议

1. 项目概述：当AI Agent开始“雇佣”彼此在AI Agent的世界里，协作一直是个难题。传统的Agent间调用，要么是基于预设的、完全可信的API，要么就是“裸奔”式的请求-响应，缺乏一个能确保“一手交钱，一手交货”…

作者头像

李华

网站建设 2026/5/9 4:31:11

VERIENV框架：Web自动化测试与安全评估的合成网站技术

1. 项目背景与核心价值在Web自动化测试和安全评估领域，传统方法往往面临环境搭建复杂、测试覆盖率低、扩展性差等痛点。VERIENV框架的诞生，正是为了解决这些行业普遍存在的难题。这个框架最吸引我的地方在于它创造性地采用了合成网站技术，为智…

作者头像

李华