数据类型详解-集合

确定的一组无序的数据的组合

  • 确定的? 当前集合中元素的值不能重复
  • 由多个数据组合的复合型数据(容器类型数据)
  • 集合中的数据没有顺序
  • 功能:成员检测、从序列中去除重复项以及数学中的集合类计算,例如交集、并集、差集与对称差集等等。

集合的定义

  • 可以直接使用 {} 来定义集合
  • 可以使用set()进行集合的定义和转换
  • 使用集合推导式完成集合的定义

注意:集合中的元素不能重复,集合中存放的数据:Number,Strings,Tuple,冰冻集合

集合的基本操作和常规函数

  1. # 定义集合
  2. vars = {123,'abc',False,'love',True,(1,2,3),0,3.1415,'123'}
  3. # 1。无序。
  4. # 2。布尔类型 True 表示为 1,False 表示为 0,布尔和数字只存在一个
  5. # 3。元素的值不能重复
  6. # {0, 'abc', 'love', True, 3.1415, (1, 2, 3), 123}
  7. # 检测集合中的值
  8. res = '123' in vars
  9. res = '123' not in vars
  10. # 获取集合中元素的个数 len()
  11. # res = len(vars)
  12. # 集合的遍历
  13. # for i in vars:
  14. # print(i,type(i))
  15. # 向集合中追加元素 add()
  16. res = vars.add('def')
  17. # 删除集合中的元素 随机删除一个元素并返回 abc False True 3.1415
  18. # r1 = vars.pop()
  19. # 指定删除集合中的元素 remove() 返回None,不存在则报错
  20. # res = vars.remove('aaa')
  21. # discard 指定删除集合中的元素,不存在也不会报错
  22. # res = vars.discard('aaa')
  23. # clear() 清空集合
  24. # res = vars.clear()
  25. # update(others) 更新集合,添加来自 others 中的所有元素。
  26. res = vars.update({1,2,3,4,5})
  27. # 当前集合中的浅拷贝并不存在 深拷贝的问题
  28. res = vars.copy()
  29. '''
  30. 当前集合中的浅拷贝并不存在 深拷贝的问题
  31. 因为集合中的元素都是不可变,包括元组和冰冻集合
  32. 不存在拷贝后,对集合中不可变的二级容器进行操作的问题
  33. '''

冰冻集合(了解)

定义冰冻集合,只能使用 frozenset() 函数进行冰冻集合的定义

  • 冰冻集合一旦定义不能修改
  • 冰冻集合只能做集合相关的运算:求交集,差集,。。。
  • frozenset() 本身就是一个强制转换类的函数,可以把其它任何容器类型的数据转为冰冻集合
  1. # 定义
  2. vars = frozenset({'love',666,'a',1,'b',2,'521'})
  3. # vars = frozenset([1,2,3])
  4. # 遍历
  5. # for i in vars:
  6. # print(i)
  7. # 冰冻集合的推导式
  8. res = frozenset({i<<1 for i in range(6)})
  9. # 冰冻集合可以和普通集合一样,进行集合的运算 交集。。。
  10. # copy()
  11. res = res.copy()
  12. # print(res)

集合的推导式

  1. # 集合推导式
  2. varset = {1,2,3,4}
  3. # (1) 普通推导式
  4. newset = {i<<1 for i in varset }
  5. # (2) 带有条件表达式的推导式
  6. newset = {i<<1 for i in varset if i%2==0}
  7. # (3) 多循环的集合推导式
  8. vars1 = {1,2,3}
  9. vars2 = {4,5,6}
  10. # newset = set()
  11. # for i in vars1:
  12. # for j in vars2:
  13. # print(i,j)
  14. # newset.add(i+j)
  15. # print(newset)
  16. newset = {i+j for i in vars1 for j in vars2}
  17. # print(newset)
  18. # (4) 带条件表达式的多循环的集合推导式
  19. newset = {i+j for i in vars1 for j in vars2 if i%2==0 and j%2==0}
  20. print(newset)

集合的运算

集合的主要运算

  • 交集 & set.intersection() set.intersection_update()
  • 并集 | union() update()
  • 差集 - difference(),difference_update()
  • 对称差集 ^ symmetric_difference() symmetric_difference_update()
  1. vars1 = {'郭富城','刘德华','张学友','黎明','都敏俊',1}
  2. vars2 = {'尼古拉斯赵四','刘能','小沈阳','宋小宝','都敏俊',1}
  3. # & 求两个集合相交的部分
  4. res = vars1 & vars2
  5. # | 求两个集合的并集,就是把集合中所有元素全部集中起来,(去除重复)
  6. res = vars1 | vars2
  7. # - 差集运算
  8. res = vars1 - vars2 # vars1有,而,vars2 没有的
  9. res = vars2 - vars1 # vars2有,而,vars1 没有的
  10. # ^ 对称差集
  11. res = vars1 ^ vars2
  12. # 交集运算函数 intersection intersection_update
  13. # set.intersection() # 返回交集的结果 新的集合
  14. # res = vars1.intersection(vars2)
  15. # set.intersection_update() # 没有返回值
  16. # 计算两个集合的相交部分,把计算结果重新赋值给第一个集合
  17. # res = vars1.intersection_update(vars2)
  18. # 并集运算函数 | union() update()
  19. # res = vars1.union(vars2) # 返回并集结果,新的集合
  20. # 求并集运算,并且把结果赋值给第一个集合
  21. # res = vars1.update(vars2) # 没有返回值
  22. # print(vars1)
  23. # 差集运算 函数 difference(),difference_update()
  24. # res = vars1.difference(vars2) # 返回差集结果 新的集合
  25. # 把差集的结果,重新赋值给第一个集合
  26. # res = vars1.difference_update(vars2) # 没有返回值
  27. # 求对称差集
  28. # res = vars1.symmetric_difference(vars2) # 返回对称差集的结果 新的集合
  29. # 把对称差集的运算结果,重新赋值给第一个集合
  30. res = vars1.symmetric_difference_update(vars2)# 没有返回值

集合检测

  • issuperset() 检测是否为超集
  • issubset() 检测是否为子集
  • isdisjoint() 检测是否不相交
  1. # 检测 超集 子集
  2. vars1 = {1,2,3,4,5,6,7,8,9}
  3. vars2 = {1,2,3}
  4. # issuperset() 检测是否为超集
  5. res = vars1.issuperset(vars2) # True vars1是vars2的超集
  6. res = vars2.issuperset(vars1) # False
  7. # issubset() 检测是否为子集
  8. res = vars1.issubset(vars2) # False
  9. res = vars2.issubset(vars1) # True vars2是vars1的子集
  10. # 检测两个集合是否相交
  11. vars1 = {1,2,3}
  12. vars2 = {5,6,3}
  13. # isdisjoint 检测是否不相交, 不相交返回True,相交则返回False
  14. res = vars1.isdisjoint(vars2)
  15. print(res)