news 2026/4/16 1:13:19

如何使你的数据科学/机器学习工程师工作流程更有效

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何使你的数据科学/机器学习工程师工作流程更有效

原文:towardsdatascience.com/how-to-make-your-data-science-ml-engineer-workflow-more-effective-4f857c36bbc1

任何从事编程工作的人都需要一个有效的流程。许多任务都很耗时,你希望尽可能多地自动化以减少手动工作。在这篇文章中,我讨论了我最近如何作为一个数据科学家更新我的工作流程,从使用 Jupyter 笔记本转向使用 VS Code 交互式窗口。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3d3af8e48c80d9b57c3b44f0844b688c.png

本文讨论了如何使用 VS Code 交互式窗口来优化你的数据科学/机器学习工程工作流程。图片由 ChatGPT 提供

为了展示新的工作流程,我将使用一些简单的代码来突出如何使用新的工作流程更快地工作。然而,你应该注意,我认为新工作流程的好处随着项目的复杂度增加而增加。当项目变得更大时,Jupyter 笔记本的问题就会增多,更难对你的数据进行概述。因此,我认为我在本文中展示的工作流程的好处将随着实际项目而增加。我将在整篇文章中使用图片和视频来直观地展示如何使用 VS Code 交互式窗口。我写这篇文章的灵感来自 Dave Ebbelaar 的这个 YouTube 视频(https://www.youtube.com/watch?v=qFvInA7DKuE&t=395s),关于他如何停止使用 Jupyter Notebook。

目录

· 动机 · 使用 VS Code 交互式窗口 ∘ 设置 ∘ 好处 · 结论

动机

我写这篇文章的动机是,作为一个数据科学家,我一直在寻找改进我工作方式的方法。我认为在我的工作中,保持对最新趋势的了解至关重要,无论是跟上最新的机器学习模型,使用新的 IDE 如 Cursor,还是通过使用交互式窗口来改进我的工作流程。因此,在这篇文章中,我分享了我在数据科学相关项目中最近的工作流程变化,从在 Jupyter 笔记本中工作到使用 VS Code 中的交互式窗口。改变工作流程后,我在编写代码和实验方面变得显著更有效率,这对于你想要在数据科学项目中取得成功至关重要。

使用 VS Code 交互式窗口

设置

要开始使用 VS Code 中的交互式窗口,你必须在设置中激活它。打开 VS Code 的设置,搜索 Jupyter 交互式窗口,并启用表示“按 shift+enter 时,发送所选代码”的复选框。下面是一个设置图片的示例:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/950016c6becd04dad6caede266d25ab4.png

在 VS Code 中激活交互式窗口设置的图片。图片由作者提供。

现在,你已经准备好使用交互式窗口了。打开一个 Python 文件,标记你想要运行的代码,然后按住 shift 键并按下 enter 键。只有标记区域内的代码会被运行,并且变量会被存储。这允许你直接从 Python 文件中工作,同时获得使用 Jupyter Notebooks 的大部分好处。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5b834cb2011850016a7092f5c6d938e6.png

此图片展示了我标记了左侧所有代码并按下 shift enter 后的 VS Code 视图。这打开了右侧的交互式窗口,运行了你所选的所有代码(你只看到第一行,但你也可以扩展该行,如图片下方所示。图片由作者提供。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/61e37828ddf1c1147f63ecf2f75e9113.png

展示如何扩展运行单元格以增强清晰度的图片。图片由作者提供。

现在,变量ab已经被定义,例如,为了理解加法函数的工作原理,我可以通过按行标记第 5 行,按下 shift enter,然后只标记单词 result 来打印出结果值。请注意,在这个例子中,函数非常容易理解,但随着你处理更复杂的编程,这会非常有用,便于轻松理解和调试函数。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8cd45c315ec5354884c0b383151444e5.png

运行第 5 行,定义变量 result 后,标记变量 result,并运行它以查看变量的值。图片由作者提供。

你可以在这里使用的另一个有用功能是打开终端窗口(在 Windows 上使用 ctrl+j,在 Mac 上使用 cmd+j)。然后,你可以选择 Jupyter 标签来查看所有变量的值。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/39a07d08bd778b80a33a36e9329a3b52.png

在底部打开 Jupyter 终端后的我的 VS Code 视图,以查看所有变量的值。这有助于快速检查所有变量的值,便于轻松调试和理解代码。图片由作者提供。

您可以观看以下我解释的视频:

cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.loom.com%2Fembed%2F1e5ec8dec00e40be9ccc6f4e130cf810&display_name=Loom&url=https%3A%2F%2Fwww.loom.com%2Fshare%2F1e5ec8dec00e40be9ccc6f4e130cf810%3Fsid%3Dace6f471-ca4a-42f7-8555-a05537cfb18a&image=https%3A%2F%2Fcdn.loom.com%2Fsessions%2Fthumbnails%2F1e5ec8dec00e40be9ccc6f4e130cf810-d3135cc5319d4086.gif&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=loom

优点

使用交互式窗口有许多好处。以下列出了主要优点:

  • 更快。我认为使用交互式窗口比使用 Jupyter 笔记本工作更快。你不需要创建单元格;你可以简单地标记代码并运行它。例如,要打印变量,你只需要选择变量并按 shift enter 键,而不是创建一个新的单元格,编写变量名,然后运行单元格。

  • 更干净的代码。我认为在 .py 文件中编写代码通常迫使你编写更干净的代码,例如,通过尽可能多地使函数模块化。Py 文件通常也比 Jupyter 笔记本更容易阅读。

  • 生产就绪。在 Py 文件中编写代码意味着你的代码已经准备好推送到生产环境,这样可以节省更多时间。

结论

在这篇文章中,我讨论了您如何使用 VS Code 交互式窗口来提高作为数据科学家或机器学习工程师的工作流程效率。我发现从 Jupyter 笔记本切换到交互式窗口后,生产力显著提升,因此我认为这绝对是一个值得尝试的改变。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 15:06:22

2025最新!自考党必看!9个AI论文软件测评与推荐

2025最新!自考党必看!9个AI论文软件测评与推荐 2025年自考论文写作工具测评:为何需要一份权威榜单? 随着人工智能技术的不断进步,AI论文辅助工具在学术写作中的应用越来越广泛。对于自考学生而言,如何高效完…

作者头像 李华
网站建设 2026/4/14 20:44:42

光泰照明×中扬立库:多库协同智能立库,引领照明行业物流升级

作为照明行业的领军企业,光泰照明深耕HID氙气灯、LED灯等精密产品领域三十载,业务版图覆盖机车、舞台、航空等多场景照明需求。随着全球智能制造浪潮推进与“双碳”目标落地,企业产能持续扩张,传统平库模式暴露出的配料延迟、空间…

作者头像 李华
网站建设 2026/4/15 21:17:06

Java计算机毕设之基于springboot的拍卖网站的设计与实现拍品展示、竞价交互、交割管理(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/15 21:17:08

【计算机毕业设计案例】基于springboot的茶食酒馆网站在线预订 + 菜品展示 + 会员管理(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/15 21:17:11

慢SQL分析与优化实战

慢SQL分析与优化实战一、发现问题:如何发现慢查询?慢查询的发现通常依赖于监控体系,不同规模团队分工不同:团队角色主要发现途径工具示例运维 / DBA主导监控。负责数据库整体健康度,通过监控平台主动发现、统计并告警慢…

作者头像 李华
网站建设 2026/4/15 21:17:12

计算机Java毕设实战-基于springboot的见山茶食酒馆网站菜品 / 茶酒品类管理茶食酒馆 “休闲社交 + 精致消费” 的场景需求【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华