news 2026/1/25 9:36:32

如何为数据科学团队构建能力框架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何为数据科学团队构建能力框架

原文:towardsdatascience.com/how-to-build-a-competency-framework-for-data-science-teams-9b5271fd2b8e

2021 年,365 DataScience 对成千上万的领英个人资料进行了研究,以了解数据科学领域的趋势。几个真正引人注目的点是,“非常少数的个人(不到 2%)在同一个职位上工作超过 5 年” [1] 和“在我们的研究中,数据科学家在职位上的平均工作时间是 1.7 年” [1_]. 幸运的是,我没有在我的团队中看到这种流动,但我知道很多数据科学家,他们中的大多数认为‘角色不明确**’是他们最大的三个挑战之一。如果你觉得这种情况发生在你或你的团队中,我希望这篇文章能帮助你构建一个适应性强、公平且稳健的能力框架,以解决这个‘角色不明确’的问题。

PS:所有图片均由我创作,除非另有说明。

首先,为什么我们需要能力框架?

能力框架是一种团队用来沟通在特定角色或级别上需要、重视、认可和奖励的行为的机制。例如,对初级数据科学家的期望应该与资深数据科学家不同。对于两个相似的高级数据科学家也是如此,其中一个是个人贡献者,另一个是管理者。

如果你领导着一个数据科学团队,我可以保证你将收到诸如*‘我如何达到下一个级别?’,‘我需要做什么才能获得更高的奖金?’* 或‘我已经做了我被告知要做的一切,为什么我没有得到奖励?’这样的问题。当你领导团队时,你必须能够以公平和稳健的方式回答这些问题。你不能在第一季度说一件事,在第三季度说另一件事。对一位直接下属有效的方法必须对其他人也有效。垂直和水平角色需要被定义,并且对每个人都是透明的。总之,你需要一个稳固的能力框架。

让我引导你了解我构建能力框架的思考过程。自然地,我会专注于数据科学方面,但希望这甚至对其他学科也有帮助。

“简单”步骤:定义你的角色

下面的截图显示了 Skyscanner 的角色。虽然其他行业可能有更多级别的资深度(这里咨询业的 10 级层级)或拥有专门的 DS 角色(Facebook 的产品数据科学家),但我将坚持以下职业阶梯,因为我感觉许多公司实际上与此相关。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/01da770ef1333517b69e0e9e45117a9d.png

在 Skyscanner,我们的数据科学学科有 5 个等级。实际上,我们很少雇佣初级数据科学家,因此我们的资历混合从数据科学家及以上开始。值得注意的是,人们管理角色从某个资历级别开始。从数据科学家 IC 角色直接跳到 DS 经理角色的情况很少见。

在下一节中,我们将尝试捕捉我们对每个角色的期望。

“鹰眼视角”步骤:你在你的数据科学学科中寻找什么?

我们已经确定,你们团队中的任何成员都可能是初级 DS、DS、高级 DS 和首席 DS。现在我们需要了解我们对我们学科的核心能力有何价值

如标题所述,这项练习需要一种鹰眼般的视角。我们旨在提炼出可以描述数据科学家日常工作和他们可能未来发展的主要主题。这些领域将在稍后分解为更具体的要求,但此刻,我们需要专注于构建“基础支柱”。

从其他学科中汲取灵感

如果我刚才写的内容太模糊,让我们回顾一下*Monzo 寻找其工程团队的核心能力 [2](这个框架如Monzo 的文章 [3]中提到的,是公开的)或产品经理的核心能力 [4]*。我故意选择了工程和产品管理学科,因为这些是数据科学家最常与之合作的团队。我认为了解他们如何评估自己,并为数据科学学科制定相应的标准会很有趣。

Monzo

Monzo 建立了 4 个核心能力:范围、影响、技术技能和行为。对于每个能力,你还可以阅读它们在不同级别上的差异,但请记住我们处于“鹰眼视角”步骤。每个能力概述了它试图衡量的内容。例如,在行为方面,Monzo 将希望评估诸如影响力、沟通和领导力等方面的期望。此外,查看技术技能能力,你可以看到他们并没有列出具体的技能;这关乎于“你如何应用你的技术技能” [直接引用自文档]。实际上,他们提到之前的迭代过于详细,导致“工程师们将他们的进步限制在特定领域内,并且往往过于具体于业务中的某些领域” [直接引用自文档]

产品经理角色

Intercom 展示了一个可能的 PM 能力框架分解。查看他们的基础支柱,建议了 5 个领域:洞察驱动、策略、执行、驱动成果和领导行为。我真的很喜欢他们将这 5 个能力分解成更小、更专注的职位期望。例如,如果你看执行,他们会将其分解为(1)从问题开始(2)大处着眼,从小处着手(3)发货以学习(4)发货整个客户体验。

Skyscanner 的数据科学考察 6 个关键支柱+管理路径

阅读了一些外部例子后,让我们谈谈数据科学学科。在 Skyscanner,我们根据 6 个核心能力评估个人。以下列表也描述了每个能力的目标。

  1. **范围。**你正在解决的问题定义得有多好?你承担了多少领导责任?你计划得多远?

  2. **专业知识。**你是在学习还是在这个技能/领域上是大师?你是如何确保其他人从这种知识中受益的?

  3. **交付。**你对每个任务的责任程度如何?不仅要考虑你自己的交付,还要考虑你如何通过他人进行交付。

  4. **构建正确的事情。**理解业务背景并将其转化为价值。复杂性可能与价值一致,也可能不一致。

  5. **正确构建。**我的工作有多稳健、可扩展、成本效益高、易于理解?你是否遵循工程、建模和统计的最佳实践?

  6. **正确执行。**你如何确保你的解决方案与昨天一样好?你有哪些流程来应对系统故障?

  7. **管理路径。**你如何培养你的直接下属并帮助他们成长和实现职业目标。你如何构建高绩效团队。沟通是这里的关键方面,无论是从公司到团队还是从团队到公司。

我真的很喜欢这种分解。它比 Monzo 的例子稍微详细一些,但比 PM 的例子不那么限制性。想想你作为数据科学家的日常工作,我确信你做的任何事情都可以归入这些核心能力之一。

“明确定义”步骤:为每个核心能力设定清晰的资深级别边界。

现在是时候明确定义不同级别资深度的每个能力的期望了。我定义这一步成功的标准是两个维度:

  1. **不同资深级别之间没有重叠。**按照资深级别的升序(从初级数据科学家到首席数据科学家)阅读你的能力框架,应该清楚地显示出不同级别之间的进步跳跃。设定边界,如领导一个项目与多个项目或影响小队与其他团队相比,非常重要。我们不希望团队中存在混淆。

  2. **你不会为每个能力列出所有可能落入的清单。**在详细和一般之间找到平衡。明确的能力定义至关重要,但过于具体可能会使你的框架适应性降低或过时。例如,关于专业知识,你真的想列出所有可能的 ML 解决方案,如时间序列预测、推荐系统、地理空间模型或经典分类预测吗?我的感觉是这太具体了。

让我们深入了解我们在 Skyscanner 数据科学学科中定义的进步步骤。不幸的是,从演示的角度来看,Medium 本身不支持表格,所以我将不得不粘贴截图以展示特定示例。


范围 - 掌握不确定性的艺术

你正在解决的问题定义得有多好?你采取了多大程度的领导力?

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/db4319088526182fedccd57d40cddb27.png

范围维度的摘要表格


专业知识 - 培养你所擅长的

你是学习者还是某个技能/领域的专家?你是如何确保他人从这项知识中受益的?

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/94f44a63ec1e85d775027b92ae3594ba.png

专业知识维度的摘要表格


交付 - 让它发生,不要找借口

你对每个任务的负责程度是多少?不仅要考虑你自己的交付,还要考虑你如何通过他人进行交付。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/36888743ec031b55dd3d86aa49e9e34b.png

交付维度的摘要表格


构建正确的事物 - 专注于增加价值。

理解业务背景并将其转化为价值。复杂性可能与价值一致,也可能不一致。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/85dab3edd6327fe6df03fcbb79536e65.png

构建正确维度的摘要表格


构建正确 - 遵循最佳实践

我的工作有多稳健、可扩展、成本效益高、易于理解?你是否遵循了工程、建模和统计学的最佳实践?

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3d49809a654e4b4161653aa297ba9c21.png

构建正确维度的摘要表格


运行正确 - 你会下多少赌注,认为你的系统在 3 个月内能正常运行?

你如何确保你的解决方案与昨天一样好?你有哪些流程来应对系统故障?

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6530c1af134a1debb49ad3da469e34f7.png

运行正确维度的摘要表格


管理者路径 - 一套不同的技能

如何培养你的直接下属,帮助他们成长并实现职业目标。如何构建高绩效团队。沟通是这里的关键方面,无论是从公司到团队,还是从团队到公司。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/aa6200ab7c5c6278d7f49f89ac615afe.png

无论资历如何,核心管理能力

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/64d12eacd00aab598d773e246bb09b4b.png

经理维度的总结表格


总结——总结要点

我非常喜欢这个数据科学家能力框架的原因是:

  1. 我们已经实现了我们的目标:“没有资历级别的重叠”。我认为对于每个核心能力,每个级别期望的内容都很清楚。假设一旦你掌握了某个级别的技能,你将它们带到下一个级别。这就是为什么我们要求你展示额外的责任。

  2. 我们已经实现了我们的目标:“不要为每个能力列出所有可能落入的复选框列表”。在整个框架中,没有提到工具或专业。我不在乎你使用 Databricks 或 AWS 进行 MLOps,这些工具将由公司定义。我不是时间序列的专家,但你可能是。如果你没有构建 10 个深度学习模型,但如果它们没有增加价值,那就没关系。

  3. 记住 6 项能力(加上管理路径)很容易。我认为对于团队成员来说,轻松指出他们将被评估的核心能力是很重要的。不是具体的细节,而是主题。无意识地,这有助于界定任何类型的工作。例如,在站立会议或规划会议中,我倾向于问很多关于“我们是否在构建正确的东西?”或“我们是否正确运行它?”的问题。

  4. 但它也有足够的细节,足以成为个人的透明指南。提供长长的例子列表的想法是为了确保角色之间几乎没有混淆。

  5. 灵活性。真的,表格中展示的级别可能更代表技术世界,但这些维度的变体也可以用来定义数据科学咨询公司的能力框架。

致谢

  • [1] 365 Data Science,文章:2021 年谁是数据科学家?——对 1,001 位数据科学家的研究

  • [2] Monzo 工程能力框架

  • [3] Monzo 博客 讨论他们的能力框架

  • [4] Intercom 产品经理能力框架

进一步阅读

感谢阅读这篇文章!如果您对我的更多书面内容感兴趣,这里有一篇文章收集了我所有其他博客文章,按主题组织:数据科学团队和项目管理、数据故事讲述、营销与出价科学以及机器学习与建模。

所有我的文章都在一个地方

请保持关注!

如果您想在我发布新文章时收到通知,请随意在 Medium 上关注我或订阅我的 Substack 通讯。此外,我很乐意在领英上与您聊天!

获取我关于数据科学的最新文章通知

何塞的 Substack | 何塞·帕雷诺·加西亚 | Substack

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/29 16:52:17

Excalidraw常见问题汇总:官方FAQ精华整理

Excalidraw常见问题汇总:官方FAQ精华整理 在远程协作成为常态的今天,团队对可视化工具的需求早已超越“画个图”这么简单。我们需要的不仅是图形表达能力,更是一种能激发创意、促进沟通、支持实时共创的认知媒介。正是在这样的背景下&#x…

作者头像 李华
网站建设 2026/1/17 22:44:05

GoldenGate 19C的静默安装及打补丁

📢📢📢📣📣📣 作者:IT邦德 中国DBA联盟(ACDU)成员,15年DBA工作经验 Oracle、PostgreSQL ACE CSDN博客专家及B站知名UP主,全网粉丝15万 擅长主流Oracle、MySQL、PG、高斯及…

作者头像 李华
网站建设 2025/12/27 15:00:31

蓝凌EKP产品:一次 Hibernate 乐观锁 + 死锁的深度踩坑实录

—— clear() 一个集合,为什么引发 OptimisticLockException 和数据库死锁?这是一次看似“新增 / 查询”的普通业务操作,却最终演变成 Hibernate 乐观锁异常 MySQL 死锁 批量更新失败 的连环事故。一、问题现象线上频繁出现如下异常&#x…

作者头像 李华
网站建设 2026/1/22 15:21:39

Excalidraw热力图模拟:用户行为分布示意

Excalidraw热力图模拟:用户行为分布示意 在产品设计的日常讨论中,你是否曾遇到这样的场景?产品经理拿着一份PPT中的热力图说:“这个按钮点击率很低”,但团队成员却一脸困惑——因为那张图脱离了真实界面语境&#xff0…

作者头像 李华
网站建设 2026/1/15 2:22:05

Excalidraw文档编写规范:Markdown语法与示例

Excalidraw 与 Markdown 协同写作实践指南 在远程协作日益频繁的今天,技术团队对“高效沟通”和“知识沉淀”的需求达到了前所未有的高度。我们常常遇到这样的场景:一个复杂系统的设计思路,在会议中讲得头头是道,但会后整理文档时…

作者头像 李华