原文:
towardsdatascience.com/mastering-the-versatility-and-depth-of-pythons-rich-plot-collection-with-code-b136b584d143
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/d875a04c79acb9c1c9b6165b86601654.png
由作者在 DALL-E 创建的图像
"让数据集改变你的思维方式。" – 汉斯·罗斯林
每个数据科学家都知道图表对于他们的数据故事至关重要。Python 开发者有幸使用一种提供丰富绘图集合的语言。本文将通过讨论涉及较少人知的可视化,如桑基图、脊线图、内嵌图、蜘蛛图和词云图的用例来展示这种丰富性。我们还将讨论更熟悉的图形表示方法,如散点图和条形图。大多数图表将利用Matplotlib、Seaborn 和 PlotlyPython 库。
我们将使用形状、大小、颜色、方向、面积大小和标记符号面积等属性来创建十个不同用例的图表。在每个用例中,我们的目标是创建有效、高效且美观的视觉呈现。让我们在图表的上下文中描述我们所说的这些词:(a)有效:所有需要传达的信息都包含在图表中;(b)高效:图表中不包含冗余数据;©美观:图表以清晰、视觉上吸引人的方式呈现数据。本文中的所有图表都是二维的,因为在效率和效果方面,二维图表比三维图表更清晰、更容易理解,而且二维图表更容易描绘距离。每个用例的代码也将被展示,并且将讨论代码和图表中的重点。
用例 1.描述大学间学生交流流的桑基图。
这些图表非常有用,可以展示资源如何流动。下面的代码展示了我们用例的实现。字符‘A’代表第一所大学,字符‘B’代表第二所。数字 3、4、5 代表不同的部门,即 {统计学、数学、物理学} 分别。图表在第 25 行创建,其中‘node’和‘link’是字典。‘node’使用一个包含唯一‘Depts’的‘label’对象,而‘link’使用两个列表,包含‘发送’部门的索引和‘接受’部门的索引。