news 2026/6/9 14:57:04

【Python新手村】集合(Set):一个强迫症晚期的“去重大师”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Python新手村】集合(Set):一个强迫症晚期的“去重大师”

Python 集合(Set):一个强迫症晚期的“去重大师”

哈喽,各位 Python 探险家!

前面我们认识了列表(什么都装的收纳箱)和元组(上了锁的保险箱)。 今天,我们要介绍一位性格非常古怪的朋友——集合 (Set)

如果说列表是排得整整齐齐的队伍,那集合就是一个大麻袋。 往里一倒,顺序全乱,而且它有个严重的“洁癖”:绝对容不下重复的东西!

如果你给他一堆“张三、李四、张三”,他会冷酷地把第二个张三踢出去,只留下一个。 这就是集合,一个莫得感情的去重机器

1. 它是何方神圣?(创建集合)

集合和字典(Dictionary)长得很像,都戴着花括号{}。但字典是“键值对”,集合只有“值”。

# 创建一个集合 # Python: "我不喜欢重复,也不喜欢排队" my_set = {1, 2, 3, 3, 3, 4} print(my_set) # 输出: {1, 2, 3, 4} 看到没?多余的 3 全没了!

新手必踩的大坑:空集合陷阱

如果你想创建一个空集合,你可能会下意识地写:

empty_thing = {} # 错!大错特错! print(type(empty_thing)) # 输出: <class 'dict'> 居然是个字典?

为什么?因为 Python 的字典出道比集合早,{}这个符号早就被字典占用了。正确写法:必须使用set()工厂函数。

real_empty_set = set() # 这才是正宗的空集合

2. 它的脾气:无序且任性

在列表里,你可以说“我要第 0 个元素”。 在集合里?没门!

s = {"香蕉", "苹果", "西瓜"} # print(s[0]) # 报错: TypeError: 'set' object is not subscriptable

翻译成人话:集合里的东西是无序的,就像麻袋里的土豆,谁在前谁在后全看天意(其实是看哈希值,后面细说)。既然没有顺序,自然就没有索引。

3. 核心绝技:一键去重

这是集合在面试和实战中出现率 99% 的场景。 比如你有一个列表,里面有很多重复的用户 ID,你想去重,怎么办?

普通青年:写个 for 循环,一个个判断...(太累了)Python 青年:

id_list = [101, 102, 101, 103, 102] # 一行代码搞定去重:列表 -> 集合 -> 列表 unique_ids = list(set(id_list)) print(unique_ids) # [101, 102, 103]

简单、粗暴、有效。

4. 隐藏技能:数学课代表 (集合运算)

还记得小学数学学的交集、并集、差集吗?(如果不记得了,请假装记得)。 Python 的集合天生就是做这个的,语法简洁到让你想哭。

假设你有两波朋友:

  • A波朋友喜欢吃火锅:hotpot_lovers = {"张三", "李四", "王五"}

  • B波朋友喜欢吃烧烤:bbq_lovers = {"李四", "赵六", "钱七"}

场景 1:既吃火锅又吃烧烤的(交集 &)也就是找共同好友。

# 这里的 & 就像两只手握在一起 print(hotpot_lovers & bbq_lovers) # 输出: {'李四'}

场景 2:吃火锅或者吃烧烤的(并集 |)大家聚在一起开大趴体。

# 这里的 | 就像一根棍子把两边连起来 print(hotpot_lovers | bbq_lovers) # 输出: {'张三', '王五', '李四', '赵六', '钱七'} (自动去重了李四)

场景 3:只吃火锅不吃烧烤的(差集 -)要把那些“叛徒”剔除出去。

# 就像数学减法一样自然 print(hotpot_lovers - bbq_lovers) # 输出: {'张三', '王五'} (李四因为吃烧烤被踢除了)

5. 增删改:小心翼翼的操作

  • 加人add()

  • 踢人remove()vsdiscard()

这里有个很有意思的区别:

s = {1, 2, 3} s.remove(4) # 报错!KeyError。remove 脾气暴躁,删不到就炸毛。 s.discard(4) # 没事。discard 很佛系,有就删,没有就算了。

建议:除非你明确知道元素一定存在,否则用discard()更安全,不容易让程序崩掉。

6. 个人理解:为啥集合查东西特别快?

这是进阶干货! 你可能会问:“既然列表能存东西,集合也能存,除了去重,集合还有啥用?”

答案是:速度。

想象一下你去图书馆找书:

  • 列表(List):就像把书乱堆在地上。你要找一本书,得从头一本本翻,运气不好要翻到最后。(时间复杂度 O(n))

  • 集合(Set):就像有索引系统的书架。每本书都有固定的位置(通过哈希算法计算)。你要找一本书,算一下它的哈希值,直接走到那个位置。有就是有,没有就是没有,不用翻别人。(时间复杂度 O(1))

所以,如果你需要频繁判断if x in data,请务必把data转成集合!速度提升不是一点半点。

总结

Python 的集合 (Set) 是一个特立独行的家伙:

  • 样子是花括号{},但空集合要用set()

  • 性格是容不下重复(去重神器)。

  • 特长是数学运算(交、并、差)。

  • 本质是哈希表(查找速度极快)。

下次遇到“去重”或者“找共同好友”的需求,别犹豫,召唤集合吧!

觉得这篇有意思?点个赞是对“强迫症”作者最好的治愈!(。♥‿♥。)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 2:18:01

自动驾驶如何遵守交通规则?揭秘AI驾驶员的伦理与算法博弈

第一章&#xff1a;自动驾驶 Agent 的交通规则在自动驾驶系统中&#xff0c;Agent 必须严格遵守交通规则以确保行驶安全与合规。这些规则不仅包括通用的道路标志识别和信号灯响应&#xff0c;还涵盖动态环境中的行为决策逻辑。感知与决策协同机制 自动驾驶 Agent 依赖多传感器融…

作者头像 李华
网站建设 2026/6/8 10:14:43

RNOpenHarmony:本地化MQTT同行通信(系列二)-架构与消息流

延续系列一&#xff0c;这篇我们深入聊聊架构设计、主题命名、QoS 选择、会话管理这些“硬核”内容。还是用“客户端 SDK / 服务端 SDK”作为代称&#xff0c;避免暴露真实项目名称。 说实话&#xff0c;架构设计这块&#xff0c;我一开始也是“摸着石头过河”。主题怎么命名&a…

作者头像 李华
网站建设 2026/6/6 22:25:47

系统思考与科学决策

在老板电器供应链团队完成了《系统思考与科学决策》的训练。 很多管理者都有同一种感受&#xff1a;每天都在救火&#xff0c;而且越救&#xff0c;火好像越多。 系统思考不是教大家慢下来&#xff0c;而是帮助我们看清&#xff1a;哪些火是外部的&#xff0c;哪些火&#xff0…

作者头像 李华
网站建设 2026/6/6 22:31:17

探秘C#多态:函数重载与符号重载

第十四次一&#xff0c;多态之函数重载1&#xff0c;多态 : 同一个方法&#xff0c;不同形态体现2&#xff0c;多态分为 &#xff1a; 静态多态和动态多态3&#xff0c;静态多态&#xff1a; 函数重载和符号重载4&#xff0c;动态多态&#xff1a; 抽象和虚方法5&#xff0c;函…

作者头像 李华
网站建设 2026/6/8 17:52:29

为什么顶尖机构都在用气象 Agent?揭秘其预测精度领先行业30%的秘密

第一章&#xff1a;气象 Agent 的预测精度气象 Agent 作为智能环境感知系统的重要组成部分&#xff0c;其预测精度直接决定了后续决策的可靠性。高精度的气象预测不仅依赖于高质量的历史数据&#xff0c;还需要先进的算法模型与实时反馈机制协同工作。影响预测精度的关键因素 数…

作者头像 李华
网站建设 2026/6/7 2:42:50

进程间通信IPC机制全解析

IPC进程间通信概述进程空间独立&#xff0c;但实际应用中存在数据共享或交互需求&#xff0c;因此需要IPC机制。IPC方式多样&#xff0c;根据场景选择合适方法。IPC种类古老通信方式无名管道&#xff08;匿名管道&#xff09;仅限有亲缘关系的进程通信&#xff08;如父子进程&a…

作者头像 李华