Python3 集合（Set）详解：从入门到精通

发布时间：2026/5/22 9:08:42

引言在Python3中集合Set是一种强大且常用的内置数据结构。它专为处理唯一且无序的元素集合而设计在数据去重、成员关系测试以及数学集合运算等方面表现卓越。本文将基于官方文档及社区最佳实践并结合您提供的搜索结果对Python3集合进行全方位、深层次的解析。无论您是初学者还是希望巩固知识的中级开发者都能从中受益。第一章集合是什么—— 核心概念与特性1.1 什么是集合集合Set是Python中一种可变、无序、不重复的数据结构。可以将其理解为数学上“集合”概念的编程实现。它的基本作用就是存储一组独一无二的对象。1.2 集合的三大核心特性理解集合的关键在于掌握其区别于列表、元组和字典的三大特性唯一性Uniqueness这是集合最显著的特征。集合中的每个元素都是独一无二的绝不会包含重复元素。这是set()函数常被用于列表去重的原因。如果尝试向集合中添加一个已经存在的元素操作会被忽略集合本身不会有任何变化。这一特性使得集合成为处理“无重复”数据场景的理想选择例如统计网站独立访客UV、管理唯一ID列表等。无序性Unordered集合中的元素没有固定的顺序。这意味着你不能通过索引index或切片slice来访问集合中的特定元素。每次遍历集合时元素的输出顺序可能与上次不同。这是集合与列表、元组最直观的区别之一。这种设计是为了优化元素的查找、添加和删除的哈希性能。可变性Mutability集合本身是可变的这意味着你可以在创建后添加或删除元素。这一特性使其区别于不可变的元组Tuple。然而需要特别注意一点集合中存储的元素本身必须是不可变的可哈希的。这意味着像整数、浮点数、字符串、元组等不可变类型可以作为集合的元素而列表、字典或其他集合本身则不能作为集合的元素。1.3 集合的额外重要特性可迭代性集合是一个可迭代对象可以使用for循环遍历其中的每一个元素。支持数学集合运算Python的集合提供了完善的数学集合运算支持如并集union、交集intersection、差集difference和对称差集symmetric difference。高效的成员测试得益于其底层的哈希表实现检查一个元素是否属于某个集合使用in或not in运算符的时间复杂度是平均O(1)远快于列表的O(n)。这对于大数据量的存在性检查非常有利。第二章如何创建集合—— 多种创建方式详解Python提供了灵活的方式来创建集合。2.1 使用set()函数set()是Python的内置函数用于创建一个新的集合。它可以接收零个或一个参数。创建一个空集合empty_set set() print(empty_set) # 输出: set() print(type(empty_set)) # 输出: class set重要请注意使用空的花括号{}不能创建空集合它会创建空字典。从可迭代对象创建set()函数可以接收任何可迭代对象Iterable作为参数会自动从该对象中提取所有唯一的元素忽略重复项。# 从列表创建 my_list [1, 2, 3, 2, 4, 1, 5] unique_set set(my_list) print(unique_set) # 输出: {1, 2, 3, 4, 5} (注意顺序可能与原始列表不同)[1](ref) # 从字符串创建 (字符串也是可迭代的) my_string hello string_set set(my_string) print(string_set) # 输出: {o, e, h, l} (字符顺序不定且重复的l被去除了)[2](ref) # 从元组创建 my_tuple (1, 2, 3, 3, 4) tuple_set set(my_tuple) print(tuple_set) # 输出: {1, 2, 3, 4}[2](ref) # 从字典的键创建 my_dict {a: 1, b: 2, c: 3} key_set set(my_dict) # 等同于 set(my_dict.keys()) print(key_set) # 输出: {a, c, b}[3](ref) # 从字典的值创建 (值可能重复会被去重) value_set set(my_dict.values()) print(value_set) # 输出: {1, 2, 3}[2](ref) # 从另一个集合创建 (创建副本) set1 {1, 2, 3} set2 set(set1) print(set2) # 输出: {1, 2, 3}[3](ref)2.2 使用花括号{}直接创建你可以用花括号将元素直接括起来并用逗号分隔从而创建一个集合。但空花括号{}不行# 创建非空集合 fruits {apple, banana, orange} print(fruits) # 输出: {apple, orange, banana} (顺序不定) print(type(fruits)) # 输出: class set2.3 使用集合推导式Set Comprehension集合推导式是Python提供的一种优雅、简洁的创建集合的方式语法与列表推导式类似但使用花括号包裹。基本语法{expression for item in iterable if condition}# 获取0-9中所有偶数的平方并放入集合 even_squares {x**2 for x in range(10) if x % 2 0} print(even_squares) # 输出: {0, 4, 16, 36, 64} (顺序不定)[2](ref) # 从一个列表中提取所有长度大于3的单词的唯一首字母大写形式 words [apple, banana, cat, dog, elephant, bird] result {word.capitalize() for word in words if len(word) 3} print(result) # 输出可能: {Apple, Banana, Bird, Elephant}第三章集合的元素操作 —— 添加与删除集合是可变的因此我们可以对其中的元素进行动态修改。3.1 添加元素add(element)向集合中添加单个元素。如果元素已存在则不进行任何操作。colors {red, green} colors.add(blue) print(colors) # 输出: {red, green, blue} colors.add(red) # red已存在添加无效 print(colors) # 输出: {red, green, blue}update(*others)向集合中添加多个元素。others可以是列表、元组、另一个集合或任何可迭代对象。可以一次传入多个参数。numbers {1, 2, 3} numbers.update([4, 5]) print(numbers) # 输出: {1, 2, 3, 4, 5} numbers.update({6, 7}, (8, 9)) print(numbers) # 输出: {1, 2, 3, 4, 5, 6, 7, 8, 9}3.2 删除元素remove(element)从集合中移除指定的元素。如果元素不存在会引发 KeyError 异常。fruits {apple, banana, orange} fruits.remove(banana) print(fruits) # 输出: {apple, orange} # fruits.remove(grape) # 错误grape不存在会抛出 KeyErrordiscard(element)从集合中移除指定的元素。与remove()不同如果元素不存在它不会引发任何异常。这使得discard()在不确定元素是否存在时更为安全。fruits {apple, banana, orange} fruits.discard(grape) # grape不存在程序安静地继续不会报错 print(fruits) # 输出: {apple, banana, orange} fruits.discard(apple) print(fruits) # 输出: {banana, orange}pop()从集合中随机移除并返回一个元素。由于集合是无序的你无法预测哪个元素会被移除。如果集合为空会引发 KeyError 异常。letters {a, b, c, d} removed letters.pop() print(f被移除的元素: {removed}) print(f剩余的集合: {letters}) # 输出示例: # 被移除的元素: c # 剩余的集合: {b, a, d}clear()移除集合中的所有元素使其变为空集合。data {1, 2, 3} data.clear() print(data) # 输出: set()第四章集合的运算与关系判断 —— 数学的力量集合的真正强大之处在于其支持完整的数学集合运算。这些操作可以高效地处理多个集合之间的关系。4.1 基本集合运算运算名称运算符方法描述示例 (set1 {1,2,3},set2 {3,4,5})并集 (Union)union()返回包含两个或多个集合中所有唯一元素的新集合。交集 (Intersection)intersection()返回包含两个或多个集合中所有公共元素的新集合。set1 set2或set1.intersection(set2)-{3}差集 (Difference)-difference()返回一个包含set1中有但set2中没有的元素的新集合。顺序重要set1 - set2或set1.difference(set2)-{1, 2}对称差集 (Symmetric Difference)^symmetric_difference()返回包含仅在其中一个集合中出现而不在两个集合中都出现的元素的新集合。set1 ^ set2或set1.symmetric_difference(set2)-{1, 2, 4, 5}示例代码set1 {1, 2, 3, 4} set2 {3, 4, 5, 6} # 并集 print(set1 | set2) # {1, 2, 3, 4, 5, 6} # 交集 print(set1 set2) # {3, 4} # 差集 (set1 有 set2 无) print(set1 - set2) # {1, 2} # 对称差集 print(set1 ^ set2) # {1, 2, 5, 6}4.2 集合关系判断除了运算Python还提供了判断集合之间关系的方法。issubset(other)或判断当前集合是否是另一个集合的子集。如果set1的所有元素都在set2中则返回True。issuperset(other)或判断当前集合是否是另一个集合的超集父集。如果set2的所有元素都在set1中则返回True。isdisjoint(other)判断两个集合是否不相交没有共同元素。如果没有则返回True。严格子集/超集使用和运算符判断严格子集和严格超集即A B且A ! B。示例代码A {1, 2, 3} B {1, 2, 3, 4, 5} C {3, 4, 5, 6} print(A.issubset(B)) # True, A 是 B 的子集 print(A B) # True, 同样功能 print(B.issuperset(A)) # True, B 是 A 的超集 print(B A) # True print(A.isdisjoint(C)) # False, 它们有共同元素 {3} print(A B) # True, A 是 B 的严格子集第五章集合的遍历与其它方法5.1 遍历集合由于集合是无序的唯一的遍历方式就是使用for循环。my_set {apple, banana, cherry} for item in my_set: print(item) # 输出顺序不固定例如: # cherry # banana # apple5.2 集合的其它内置方法除了add、remove等集合还有一些其他有用的方法copy()返回一个集合的浅拷贝。len(s)返回集合中元素的数量。s {1, 2, 3} print(len(s)) # 输出: 3x in s/x not in s检查元素x是否是集合s的成员/非成员。这是集合最常用的操作之一效率极高。fruits {apple, banana} print(apple in fruits) # True print(grape not in fruits) # True第六章frozenset—— 不可变的集合Python还提供了frozenset冻结集合。frozenset是集合的不可变版本。一旦创建你就不能添加或删除其中的元素。创建frozenset([iterable])特性具备集合的所有核心特性唯一、无序、支持集合运算。因为它是不可变的可哈希的所以它可以作为字典的键或者作为另一个集合的元素。应用场景当你需要一个不会改变的、静态的集合时。当你需要将一组唯一的值作为字典的键时。当你需要创建一个包含集合的集合时例如set_of_frozensets {frozenset([1](ref)[2](ref), frozenset([3](ref)}。# 创建 frozenset fs frozenset([1, 2, 2, 3, 4]) print(fs) # frozenset({1, 2, 3, 4}) # frozenset 可以作为字典的键 d {fs: 这是一个冻结集合} print(d) # {frozenset({1, 2, 3, 4}): 这是一个冻结集合} # 尝试修改会报错 # fs.add(5) # AttributeError: frozenset object has no attribute add第七章集合的高级应用与实践7.1 数据去重这是集合最经典的应用。当我们需要从一个包含重复数据的列表、元组等序列中提取唯一的元素时可以先将该序列转换为集合再根据需要转换回列表# 去除列表中的重复项并保持大致的原始顺序 (Python 3.7 中字典有序) original_list [5, 2, 3, 1, 2, 5, 4, 3, 1] unique_ordered list(dict.fromkeys(original_list)) # 方法1: 利用字典保持顺序 unique_simple list(set(original_list)) # 方法2: 简单去重但会丢失顺序 print(unique_ordered) # [5, 2, 3, 1, 4] print(unique_simple) # [1, 2, 3, 4, 5] (顺序可能不同)7.2 高效的成员测试在需要频繁检查某个元素是否存在于一个大型数据集中时务必使用集合而不是列表。import time # 创建一个包含大量元素的列表和集合 data_list list(range(100000)) data_set set(data_list) # 测试一个元素是否存在于列表中的时间 start time.time() print(99999 in data_list) # True end time.time() print(f列表查找耗时: {end - start:.6f} 秒) # 测试同一个元素是否存在于集合中的时间 start time.time() print(99999 in data_set) # True end time.time() print(f集合查找耗时: {end - start:.6f} 秒) # 输出结果会显示集合的查找速度远快于列表。7.3 集合运算在数据分析中的应用共同好友分析user1_friends {Alice, Bob, Charlie}user2_friends {Bob, David, Eve}可以使用user1_friends user2_friends快速找出共同好友。权限管理admin_permissions {read, write, delete}user_permissions {read}可以使用admin_permissions - user_permissions找出用户缺失的权限。文本分析比较两篇文章中使用的独特单词。words_article1和words_article2两个集合使用对称差集^找出两篇文章中独特的词汇。7.4 在算法竞赛与LeetCode中的应用集合常用于解决涉及去重、存在性、唯一性的问题。检测重复元素遍历列表检查当前元素是否已存在于一个seen集合中。数组中缺失的数字利用集合和数学公式求解。找到两个数组的交集/并集/差集直接使用集合的内置运算代码简洁高效。第八章性能与注意事项8.1 性能优势操作平均时间复杂度说明x in sO(1)哈希表实现几乎恒定时间。s.add(x)O(1)同样基于哈希。s.remove(x)/s.discard(x)O(1)哈希查找后删除。s1s2 (并集)O(len(s1) len(s2))s1 s2(交集)O(min(len(s1), len(s2)))遍历较小的集合。8.2 关键注意事项哈希性集合的元素必须是可哈希的不可变类型。如果你需要存储可变对象如列表可以考虑将其转换为元组后再放入集合。错误使用不要用集合来保存有序的数据序列也不要依赖集合元素的特定顺序。内存占用集合为了支持快速查找底层使用了哈希表其内存占用通常比保存相同数量元素的列表要大。在内存极度受限且不需要快速查找的场景下应考虑其他数据结构。更新与运算的原地版本union(),intersection()等方法会返回新的集合。而update(),intersection_update(),difference_update(),symmetric_difference_update()等方法会就地修改原有的集合不返回新对象因此更节省内存。s1 {1, 2, 3} s2 {3, 4} s1.intersection_update(s2) # s1 直接被修改为 {3} print(s1) # {3}总结Python的集合Set是一个功能强大且性能卓越的数据结构其核心价值在于去重快速、便捷地处理唯一值问题。高速成员测试是检查元素是否存在的首选数据结构。数学集合运算为复杂的数据关系分析提供了简洁、高效的解决方案。结合其不可变版本frozenset集合在许多应用场景中——从日常的数据清洗到高级的算法设计——都扮演着不可或缺的角色。掌握集合的用法是成为一名高效Python开发者的重要一步。

如何快速安装BetterNCM：终极网易云音乐插件管理指南

如何快速安装BetterNCM：终极网易云音乐插件管理指南【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 你是否厌倦了网易云音乐PC版单调的功能？是否曾经因为复杂的…

2026/5/22 9:07:22 阅读更多

BarrageGrab：零依赖微服务架构的跨平台直播弹幕一体化采集系统

BarrageGrab：零依赖微服务架构的跨平台直播弹幕一体化采集系统【免费下载链接】BarrageGrab 抖音快手bilibili直播弹幕wss直连，非系统代理方式，无需多开浏览器窗口项目地址: https://gitcode.com/gh_mirrors/ba/BarrageGrab 在直播电…

2026/5/22 9:06:15 阅读更多

G-Helper：轻量级开源硬件控制工具的深度技术解析

G-Helper：轻量级开源硬件控制工具的深度技术解析【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertb…

2026/5/22 9:06:15 阅读更多

H5P交互式视频制作终极指南：快速创建引人入胜的互动学习内容

H5P交互式视频制作终极指南：快速创建引人入胜的互动学习内容【免费下载链接】h5p-interactive-video 项目地址: https://gitcode.com/gh_mirrors/h5/h5p-interactive-video 在数字化教育时代，如何让视频内容更具互动性和教育价值？H5…

2026/5/22 23:50:48 阅读更多

如何通过A Tour of Go快速掌握Go语言编程：终极学习指南

如何通过A Tour of Go快速掌握Go语言编程：终极学习指南【免费下载链接】tour [mirror] A Tour of Go 项目地址: https://gitcode.com/gh_mirrors/to/tour A Tour of Go是Go语言官方推出的交互式学习平台，专为编程新手和希望快速入门Go语言的开发…

2026/5/22 23:49:47 阅读更多

Realtek RTL8125 2.5GbE网卡驱动终极实战指南：从基础安装到性能调优

Realtek RTL8125 2.5GbE网卡驱动终极实战指南：从基础安装到性能调优【免费下载链接】realtek-r8125-dkms A DKMS package for easy use of Realtek r8125 driver, which supports 2.5 GbE. 项目地址: https://gitcode.com/gh_mirrors/re/realtek-r8125-dkms …

2026/5/22 23:49:47 阅读更多

如何在Windows系统上快速制作OpenCore引导盘：完整教程

如何在Windows系统上快速制作OpenCore引导盘：完整教程【免费下载链接】OpenCore-Install-Guide Repo for the OpenCore Install Guide 项目地址: https://gitcode.com/gh_mirrors/op/OpenCore-Install-Guide 想要在Windows电脑上安装macOS吗？别担…

2026/5/22 23:49:47 阅读更多

软考系统架构设计师系列知识点之杂项集萃（155）

接前一篇文章：软考系统架构设计师系列知识点之杂项集萃（154）第293题给定关系R(A1, A2, A3, A4, A5)上的函数依赖集F={A1->A2A5, A2->A3A4, A3->A2}，R的候选关键字（）。函数依赖（）∈F+。第1空 A. A1 B. A1A2 C. A1A3 D. A1A2A3 正确答案：A。第2空…

2026/5/22 23:49:07 阅读更多

Rafel-Rat服务器部署指南：搭建安全控制面板的最佳实践

Rafel-Rat服务器部署指南：搭建安全控制面板的最佳实践【免费下载链接】Rafel-Rat -------> RAFEL<------ Android Rat Written in Java With WebPanel For Controlling Victims...Hack Android Devices 项目地址: https://gitcode.com/gh_mirrors/ra/Rafel…

2026/5/22 23:48:26 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/22 17:05:13 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/22 16:54:23 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/22 14:41:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/22 11:03:47 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/22 3:58:33 阅读更多

相关文章

如何快速安装BetterNCM：终极网易云音乐插件管理指南

BarrageGrab：零依赖微服务架构的跨平台直播弹幕一体化采集系统

G-Helper：轻量级开源硬件控制工具的深度技术解析

H5P交互式视频制作终极指南：快速创建引人入胜的互动学习内容

如何通过A Tour of Go快速掌握Go语言编程：终极学习指南

Realtek RTL8125 2.5GbE网卡驱动终极实战指南：从基础安装到性能调优

如何在Windows系统上快速制作OpenCore引导盘：完整教程

软考 系统架构设计师系列知识点之杂项集萃（155）

Rafel-Rat服务器部署指南：搭建安全控制面板的最佳实践

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

11. 架构：前端工程化与状态管理实战

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

软考系统架构设计师系列知识点之杂项集萃（155）

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)