news 2026/4/26 4:03:58

前英伟达工程师撰写,被称为“目前最好的 AI 工程书”,它凭什么被一线大牛反复推荐?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
前英伟达工程师撰写,被称为“目前最好的 AI 工程书”,它凭什么被一线大牛反复推荐?

最近读完了一本关于 AI Engineering 的书,说实话,这是我开年读过最值得推荐的 AI 相关书籍之一。

如果你和我一样,不是 AI 研究员,也不是机器学习专家,但每天都在和 LLM、Copilot、ChatGPT、RAG、Prompt 打交道,那这本书很可能正好写给你。

它不试图把你培养成一个机器学习工程师,而是站在软件工程师、技术负责人、产品与工程交叉角色的视角,系统地回答一个更现实的问题——当 AI 成为基础能力,我们到底该如何工程化地使用它?

1

不是机器学习教材,而是 AI 工程指南

先说清楚一件事,这不是一本 ML 入门书。如果你指望从中学到反向传播、损失函数推导、模型训练细节,那你大概率会失望。

但如果你的目标是:理解基础模型(Foundational Models)是如何被使用的;知道采样(sampling)、模型评估、模型安全在工程里意味着什么;明白 Prompt Engineering、Dataset Engineering、RAG、Fine-tuning 各自解决什么问题;或者是搞清楚为什么 AI 会幻觉、什么时候不该相信它。

那这本书的定位就非常准确!书里讲得最多的不是怎么训练模型,而是在真实的系统里,如何让 AI 变得可用、可控、可评估。这也是我认为它特别适合软件工程师的原因。

2

Prompt 工程不是岗位,是必备能力

书中对 Prompt Engineering 和 Sampling 的讲解非常实用。作者并没有神话提示工程师这个概念,而是很务实地指出:

  • Prompt 是接口设计

  • 采样策略会直接影响系统行为

  • 好的 prompt 能显著降低幻觉,但永远无法彻底消除。

这几点我是非常认同的。Prompt Engineering 不是一个职业,但一定是一项值得掌握的工程能力。只是,它永远不该被当成构建生产系统的全部。

RAG、Fine-tuning 这些技术,书里也有介绍。作者讲清楚了它们是什么、什么时候用,但并没有给你一种照着做就能上线的错觉,这一点反而让我觉得很诚实。

3

作者没有刻意回避 AI 的局限

这本书有一个我非常喜欢的地方,它没有回避 AI 的问题,反而把问题摆在了台面上。

  • 上下文为王

这句话从未像现在这样真实。为 LLM 提供清晰、详尽的上下文至关重要。但事情并不简单,上下文越长,模型就越有可能把注意力放在错误的部分上。

此外,LLM 更擅长执行出现在提示开头或结尾的指令,而不是中间部分,这就是位置偏差(position bias)。有一种提示技巧是:在用户输入之后重复一遍最初的指令。我原以为只有小孩才容易只记住最后听到的东西。

  • 学得越多,反而觉得自己知道得越少

这当然可能是因为信息量过大让人应接不暇,但我们也确实会遗忘。别担心,你并不孤单——我们的 LLM 朋友也一样。模型学会的任务越多,就越容易出现灾难性遗忘(catastrophic forgetting),也就是说,它在早期任务上的表现会明显下降。这或许能解释为什么我现在已经不太会解二次方程了。也许我也是个 LLM。

  • 好吧,我大概不是 LLM

不过,人们已经开始担心:用于训练 LLM 的内容可能会不够用了。确实,LLM消耗公开信息的速度已经超过了新内容的产生速度。

于是,合成数据(synthetic data,即 AI 自己生成的数据)被越来越多地用于训练模型,只要谨慎使用,它确实有帮助。但问题在于,合成数据只是模仿真实数据,因此得到的性能可能是表面的。

一个用其他模型生成的合成数据训练出来的模型,也许能直接给出答案,却未必真正理解为什么或怎么来的。但你千万别指望它会轻易承认自己不懂——如果你追问解释,它很可能会编一个幻觉出来。

这让我想起《黑天鹅》里提到的一个实验:让裂脑病人的一个大脑半球执行某个动作,然后再让另一个半球解释原因,病人往往会编出一个毫无意义的解释。总之,一些研究已经发现,合成数据的使用与模型性能下降存在相关性。我敢打赌,这样训练出来的代码库一定“非常精彩”。

理解 AI 能做什么、不能做什么,以及它的影响和限制,非常重要。这本书在这一点上解释得相当扎实。而这些限制,也正好引出了 AI 在软件开发中面临的更大问题。

众所周知,AI 本质上是概率性的。你见过那张概率很低,但永远不为零的梗图吗?这几乎就是 AI 的座右铭!只要概率不为零,不管多离谱,AI 都有可能生成出来。

4

对 AI 取代程序员的一些冷静的看法

作者本身并没有煽动程序员将被取代,但它间接解释了为什么这种说法经不起推敲。

我自己的结论是:AI 很擅长样板代码、局部算法、重复劳动,但是 AI 非常不擅长领域建模、架构权衡、质量判断。好代码仍然需要思考、经验和创造力。

如果你指望 AI 帮你设计一个合理的领域模型,那大概率会收获一堆看起来像对的错误代码。AI 放大能力,但前提是你本身得有判断力。

5

为什么强烈推荐这本书

总结一下,这本书特别适合:

  • 软件工程师 / 架构师 / Tech Lead

  • 正在把 AI 引入真实业务的人

  • 不想被营销话术洗脑、想看清 AI 工程本质的人

它不会让你马上变成 AI 专家,但会帮你建立一个非常重要的能力,知道 AI 能做什么,不能做什么,以及什么时候不该用它。我认为这是当下比多会几个 prompt 技巧更重要的事情。

但如果你想在喧嚣的 AI 叙事之外,找一本足够冷静、足够工程化、也足够现实的书,那我会非常愿意推荐你读一读它。

AI 有多有用,取决于使用它的人。而这本书,至少能让你成为一个更清醒的使用者。

《AI 工程》抢读版抢先上市!纸质版+电子版,一次付费两种体验。速速扫码加购吧~👇

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/26 4:03:52

为什么现在招聘C++程序员这么难?

有HR说:“招聘条件已经降到很低了,薪资也还不错,就是没人。”主题:为什么现在招聘C程序员这么难?https://www.zhihu.com/question/491876804【回答1】要不是我正在找工作,我就信你了,现实情况是…

作者头像 李华
网站建设 2026/4/26 4:02:34

⚡_实时系统性能优化:从毫秒到微秒的突破[20260120165914]

作为一名专注于实时系统性能优化的工程师,我在过去的项目中积累了丰富的低延迟优化经验。实时系统对性能的要求极其严格,任何微小的延迟都可能影响系统的正确性和用户体验。今天我要分享的是在实时系统中实现从毫秒到微秒级性能突破的实战经验。 &#…

作者头像 李华
网站建设 2026/4/18 8:52:09

实战案例:为未知usb设备(设备描述)编写Linux驱动

从零开始为未知USB设备编写Linux驱动:一次真实的内核级调试之旅你有没有遇到过这样的场景?手头有一个神秘的USB小盒子,可能是工厂送来的传感器模块、科研团队自制的数据采集板,或者某款早已停更的工业设备。插上Linux主机后&#…

作者头像 李华
网站建设 2026/4/26 1:38:00

IL-4/IL-4R信号通路:过敏性炎症的核心驱动与治疗靶点

一、IL-4/IL-4R通路的生物学基础 白细胞介素-4及其受体是调控2型免疫反应的关键分子。IL-4R是一种属于红细胞生成素受体超家族的跨膜蛋白,其功能复合物的形成依赖于与IL-4的结合。IL-4主要通过与IL-4受体α亚基的高亲和力结合,继而招募不同的共亚基&…

作者头像 李华
网站建设 2026/4/22 16:48:30

智能物流系统架构的AI推理优化:架构师的6大策略

智能物流系统架构的AI推理优化:架构师的6大实战策略 ——从延迟优化到成本控制,全面提升物流AI效能 摘要/引言 在智能物流系统中,AI推理是驱动决策的“引擎”——从仓储机器人的实时避障、分拣系统的物品识别,到运输路径的动态…

作者头像 李华
网站建设 2026/4/18 4:23:30

2026 年最新版 Java 面试题及答案整理(纯干货,超详细)

程序员一步入中年,不知不觉便会被铺天盖地的“危机感”上身,曾经的那个少年已经不在,时间就是这样公平。就算你能发明 Java 语言,随着时间的推移,你注定还是要成为慢慢变蔫的茄子,缓缓变黑的葡萄。 看着秋…

作者头像 李华