文章目录
- 学习进展
- 学习计划
学习进展
学习计划
- happy_llm 第六章 文档阅读
- 贝壳开源的 BelleGroup 数据集进行 SFT,Qwen-2.5-1.5B 模型作为 SFT 的基座模型。
- 李宏毅 深度强化学习 CRITIC部分
- minimind sft full and lora
- B站RethinkFun PPO充电视频观看,项目理解
- minimind ppo dpo运行
- happy_llm 第七章 agent部分学习
张小明
前端开发工程师
“行业研究的目的是找到未来爆发性增长的行业赛道与该赛道上有竞争力的公司。” 简洁、精准,直击核心,已经具备很强的战略洞察力。下面我将从语义优化、逻辑深化、结构拆解、应用场景四个维度为你全面升级和拓展,帮助你在投资、战略、创业或研…
博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…
近日 Meta 突然开源了它的 ShapeR 项目,ShapeR 可以利用基于对象多模态数据的 Rectified Flow Transformer,将普通图像序列转换为完整的度量场景重建,说人话就是:从随手拍的视频/多张照片里,把真实物体恢复成可用 3D 模…
个人认为原著写的非常难懂,所以精简总结如下: auto与代理类的问题: 当使用auto进行类型推导时,如果表达式返回的是代理类,auto会推导出代理类型而不是被代理的实际类型,可能导致未定义行为。 例如&#…
博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…
博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…