3D融合检测总结-洪萨配资

|编码方式|核心问题|通俗理解|输出||-----------|---------|----------|--------||Point-based|每个点怎么提特征|一个点一个点处理|点特征||Pillar|怎么快速变 BEV|地面划格子，柱子编码|BEV特征||Voxel|怎么保留3D结构|空间切小立方体|3D/BEV特征||Range-view|怎么变成图像形式|按扫描角度展开|range特征图||Radar BEV|怎么和其他模态对齐|雷达俯视图特征|BEV特征||Radar query|怎么主动引导融合|雷达告诉网络看哪里|query特征|

|方法|Query代表什么||------------|------------------||BEVFormer|BEV网格位置||DETR3D|潜在目标||PETR|潜在目标 + 3D位置编码||LSS/BEVDepth|不是query主导，而是深度投影主导|

|方法|核心思想|是否显式估深度|Query类型|你怎么记||------------------|--------------------------------------|----------------------|------------|--------------||LSS|估深度，把图像 lift 到3D再 splat 到BEV|是|无明显query主导|猜深度再铺BEV||BEVDepth|强化 LSS 的深度估计|是|无明显query主导|更准的LSS||BEVFormer|BEV query 去图像中采样|不强依赖显式深度|BEV query|BEV格子主动看图像||PETR|3D位置编码 + object query|不以depth distribution为主|object query|给图像特征加3D位置感||DETR3D|object query + 3D reference point投影取特征|否|object query|目标query去多相机找证据||depth distribution|每个像素的深度概率|是|不是query|图像转3D的深度桥梁|

3D检测论文阅读速记： 一、雷达编码1. Point-based：逐点提特征，保留原始点属性。2. Pillar：x-y平面划柱子，快速生成BEV特征。3. Voxel：x-y-z三维体素划分，空间结构更细。4. Range-view：按角度展开成图像，用CNN编码。5. Radar BEV：雷达最终变成俯视图特征，用于融合。6. Radar query：用雷达生成查询，引导图像/BEV特征提取。 二、相机转BEV1. LSS：预测深度分布，把图像特征lift到3D再splat到BEV。2. BEVDepth：在LSS基础上强化深度估计和深度监督，添加了Lidar做深度监督。3. BEVFormer：BEV query主动到多视角图像里采样特征。4. DETR3D：object query通过3D reference point到图像中取特征。5. PETR：给图像特征加入3D位置编码，用object query预测3D框。6. depth distribution：每个像素在不同深度bin上的概率。7. camera query：由相机特征产生或主导的查询向量。 三、判断论文方法1. 有depth distribution/frustum/lift-splat：深度投影路线。2. 有BEV query/spatial cross-attention：BEVFormer路线。3. 有object query/reference point/decoder：DETR/PETR路线。4. 有pillar/scatter/pseudo image：PointPillars/BEV编码路线。5. 有voxel/sparse conv：Voxel路线。

|类型|核心思想|通俗理解|是否需要anchor|常见代表||----------------|----------|-----------|----------|-------------------||anchor-based|预设框 + 修正|先撒框，再微调|需要|PointPillars、SECOND||anchor-free|直接预测目标|不撒框，直接找|不需要|FCOS类思想||center-based|预测目标中心点|先找中心，再回归框|不需要|CenterPoint||DETR query-based|query主动找目标|一堆query去找物体|不需要|DETR3D、PETR|

在nodejs后端服务中集成taotoken实现多模型智能回复

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在Node.js后端服务中集成Taotoken实现多模型智能回复应用场景类，假设一个需要处理用户咨询的Node.js服务端应用&#…

李华

Claude Code + 大模型API（若CC-switch无法跳过登录解决办法）

1. 使用代理下载Claude Code 2. 大模型官网获取API密钥 3. 下载CC-switch设置API 具体参考以下视频： https://www.bilibili.com/video/BV1NvRyBzEhq/ 如果CC-switch不管用，无法跳过登录： Claude Code 可能在本地留下了登录缓存，导…

李华

免费图片去水印工具推荐：在线去水印软件哪个好用？2026实测盘点

图片上有水印，保存下来用不了——这种情况相信很多人都遇到过。无论是下载的素材图、截图的内容图，还是手机相册里带平台logo的照片，一旦有水印，二次使用就会很尴尬。好消息是，2026年可以用来去水印的工具不少&#xf…

李华

别再手动调格式了！用EndNote X9搞定毕业论文参考文献（附国标GB/T 7714样式配置）

EndNote X9 高效文献管理：从学术小白到毕业论文排版高手第一次写毕业论文时，我花了整整三天调整参考文献格式——手动编号、对齐作者姓名、统一期刊缩写，最后导师用红笔圈出十七处格式错误。直到实验室师兄扔给我一句"用EndNote"&…

李华

Anthropic联合创始人：AI递归自我改进2028年底前有60%概率发生，行业加速迈向自动化！

四年，从30秒到12小时Clark的核心论据是一批能力进展曲线。METR是专注AI能力评估的机构，追踪AI系统独立完成任务在50%成功率水平线上，熟练人员完成该任务所需时间。2022年，GPT - 3.5需30秒；2023年，GPT - 4推…

李华

入门总结：计算机视觉基础知识点梳理与常见问题解答

入门总结：计算机视觉基础知识点梳理与常见问题解答📚 本章学习目标：深入理解计算机视觉基础知识点梳理与常见问题解答的核心概念与实践方法，掌握关键技术要点，了解实际应用场景与最佳实践。本文属于《计算机视觉教程》…

李华