第三讲:基础数据类型与运算符

一、基础数据类型

1. 概念与分类

在Python这门语言中,数据类型分为两种: 内置和自定义

  • 内置数据类型包括数字、字符串、布尔、列表、元组、字典、Bytes、集合以及一些不常用数据类型
  • 自定义数据类型,一般以类的形式,根据需要与内置数据类型组合成为独特的数据类型

点击查看【undefined】

数据类型是Python语言非常重要的部分,尤其是不同数据类型所支持的原生操作,更是重中之重,需要熟练的背在脑海里。很多时候,写大型项目时,不需要你多复杂的技巧,只需要用这些数据操作方法就可以。

  • 原因一,更好的分配管理内存,节省不必要的占用。如果没有数据类型的区别,那么所有的对象都必须按体积最大的对象所必须大小的房子分配空间,也就是内存空间,这样的浪费太严重了。有了数据类型,计算机就可以根据类型预定义的空间需求分配大小,合理开支。内存节省精简了,还能提高读取速度和运行效率。
  • 原因二,方便统一管理,提供同样的API。这样,我们可以为同一数据类型,提供同样的操作,限制违规操作,也易于查找错误,定位问题。
  • 原因三,区分数据类型,更贴切人类对自然事物的分类管理习惯。我们人类对事物都进行了各种分类,植物是植物、动物是动物,书是书,笔是笔。分类了之后,我们很自然的知道书可以读,笔可以写。数据类型也一样,让我们对抽象的数据有了可分辨的行为和自然的记忆。

2. 数值类型

数值类型是不可变类型**。**所谓的不可变类型,指的是类型值一旦不同,那么它就是一个全新的对象。
数字1和2分别代表两个不同的对象,对变量重新赋值一个数字类型,会新建一个数字对象。

  1. >>> a = 1
  2. >>> print(id(a))
  3. 1602842080
  4. >>> a = 2
  5. >>> print(id(b))
  6. Traceback (most recent call last):
  7. File "<pyshell#3>", line 1, in <module>
  8. print(id(b))
  9. NameError: name 'b' is not defined
  10. >>> print(id(a))
  11. 1602842112
  12. >>> b=2
  13. >>> print(id(b))
  14. 1602842112
  15. >>>

还是要强调一下Python的变量和数据类型的关系:
变量只是对某个对象的引用或者说代号、名字、调用等等,变量本身没有数据类型概念 。只有1,[1,2],”hello”这一类对象才具有数据类型的概念。

Python支持三种不同的数字类型:整数、浮点数和复数。

  • 整数
  • 整数通常被称为整型,数值为正或者负,不带小数点。Python 3的整型可以当做Long类型使用(Python 3 没有Python 2的Long类型)

    • 表示数字的时候,通常使用十进制(decimal 英[ˈdesɪml]美[ˈdesɪml])来表示,有时我们还会用八进制(octonary 英 [‘ɒktə(ʊ)n(ə)rɪ]美 [‘ɑktə,nɛri] )或十六进制(hexadecimal 英 [ˌheksəˈdesɪml]美 [ˌheksəˈdesɪml])来表示:
    • 十六进制用0x前缀和0-9,a-f表示,例如:0xff00
    • 八进制用0o前缀和0-7表示,例如0o45
      1. >>> hex(11) # 十进制转十六进制
      2. '0xb'
      3. >>> oct(11) # 十进制转八进制
      4. '0o13'
      5. >>> bin(11) # 十进制转二进制
      6. '0b1011'
  • 整数内存:Python的整数长度为32位,并且通常是连续分配内存空间的。

    1. >>> id(-2)
    2. 1509059968
    3. >>> id(-1)
    4. 1509060000
    5. >>> id(-1)-id(-2)
    6. 32
  • 小整数对象池

Python初始化的时候会自动建立一个小整数对象池,方便我们调用,避免后期重复生成!这是一个包含262个指向整数对象的指针数组,范围是-5到256。也就是说比如整数10,即使我们在程序里没有创建它,其实在Python后台已经悄悄为我们创建了。
为什么要这样呢?我们都知道,在程序运行时,包括Python后台自己的运行环境中,会频繁使用这一范围内的整数,如果每需要一个,你就创建一个,那么无疑会增加很多开销。创建一个一直存在,永不销毁,随用随拿的小整数对象池,无疑是个比较实惠的做法。

  1. >>> id(-6)
  2. 48311280
  3. >>> id(-5)
  4. 1602841888
  5. >>> id(255)
  6. 1602850208
  • 整数缓冲区

除了小整数对象池,Python还有整数缓冲区的概念,也就是刚被删除的整数,不会被真正立刻删除回收,而是在后台缓冲一段时间,等待下一次的可能调用。

  1. a = 100000
  2. print(id(a))
  3. del a
  4. b = 100000
  5. print(id(b))
  6. 3028842491600
  7. 3028842491600

上面,我给变量a赋值了整数100000,看了一下它的内存地址。然后我把a删了,又创建个新变量b,依然赋值为100000,再次看下b的内存地址,和以前a存在的是一样的。
注意:在交互环境当中演示不出来效果。该效果在pycharm当中实现;并且注意不是小整数对象池当中的值。

  • 浮点数

(floating 英[ˈfləʊtɪŋ] 美[ˈfloʊtɪŋ])
浮点数也就是小数,如1.23,3.14,-9.01,等等。但是对于很大或很小的浮点数,一般用科学计数法表示,把10用e替代,1.23x10^9就是1.23e9,或者12.3e8,0.000012可以写成1.2e-5,等等

  • 复数

(complex 英[ˈkɒmpleks] 美[kəmˈpleks , ˈkɑːmpleks])

  • 复数由实数部分和虚数部分构成,可以用a + bj,或者complex(a,b)表示,复数的实部a和虚部b都是浮点。
    1. >>> a = 1
    2. >>> b = 2
    3. >>> complex(a,b) # a为实数部分,b为虚数部分
    4. (1+2j)

拓展:数学计算

更多的科学计算需要导入math这个库,它包含了绝大多数我们可能需要的科学计算函数,如下表

常用python内置函数

  1. ceil(x) 返回数字的上入整数,如math.ceil(4.1) 返回 5
  2. exp(x) 返回ex次幂(ex),如math.exp(1) 返回2.718281828459045
  3. fabs(x) 返回数字的绝对值,如math.fabs(-10) 返回10.0
  4. floor(x) 返回数字的下舍整数,如math.floor(4.9)返回 4
  5. log(x) math.log(math.e)返回1.0,math.log(100,10)返回2.0
  6. log10(x) 返回以10为基数的x的对数,如math.log10(100)返回 2.0
  7. modf(x) 返回x的整数部分与小数部分,两部分的数值符号与x相同,整数部分以浮点型表示。
  8. pow(x, y) x**y 运算后的值。
  9. sqrt(x) 返回数字x的平方根
  10. acos(x) 返回x的反余弦弧度值。
  11. asin(x) 返回x的反正弦弧度值。
  12. atan(x) 返回x的反正切弧度值。
  13. atan2(y, x) 返回给定的 X Y 坐标值的反正切值。
  14. cos(x) 返回x的弧度的余弦值。
  15. hypot(x, y) 返回欧几里德范数 sqrt(xx + yy)
  16. sin(x) 返回的x弧度的正弦值。
  17. tan(x) 返回x弧度的正切值。
  18. degrees(x) 将弧度转换为角度,如degrees(math.pi/2) 返回90.0
  19. radians(x) 将角度转换为弧度
  1. max(x1, x2,...) 返回给定参数的最大值,参数可以为序列。
  2. min(x1, x2,...) 返回给定参数的最小值,参数可以为序列。
  3. abs(x) 返回数字的绝对值,如abs(-10) 返回 10
  4. round(x [,n]) 返回浮点数x的四舍五入值,如给出n值,则代表舍入到小数点后的位数。

3. 布尔类型

(booleans 英[ˈbuːliənz] 美[ˈbuːliənz])

  1. 简介

对与错(0和1)、正与反,都是传统意义上的布尔类型。在Python语言中,布尔类型只有两个值,True与False(首字母要大写)。布尔值通常用来判断条件是否成立。 例如:

  1. import random
  2. a = int(input('请输入测试数据'))
  3. b = random.randint(0,1000)
  4. if a > b:
  5. print(f"a = {a} b = {b} \n a是一个大于3的数字")
  6. else:
  7. print(f"a = {a} b = {b} \n a不是一个大于3的数字")

拓展:random()函数

  1. import random
  2. print( random.randint(1,10) ) # 产生 1 到 10 的一个整数型随机数
  3. print( random.random() ) # 产生 0 到 1 之间的随机浮点数
  4. print( random.uniform(1.1,5.4) ) # 产生 1.1 到 5.4 之间的随机浮点数,区间可以不是整数
  5. print( random.choice('tomorrow') ) # 从序列中随机选取一个元素
  6. print( random.randrange(1,100,2) ) # 生成从1到100的间隔为2的随机整数
  7. a=[1,3,5,6,7] # 将序列a中的元素顺序打乱
  8. random.shuffle(a)
  9. print(a)
  10. import string
  11. # 随机整数:
  12. print random.randint(1,50)
  13. # 随机选取0到100间的偶数:
  14. print random.randrange(0, 101, 2)
  15. # 随机浮点数:
  16. print random.random()
  17. print random.uniform(1, 10)
  18. # 随机字符:
  19. print random.choice('abcdefghijklmnopqrstuvwxyz!@#$%^&*()')
  20. # 多个字符中生成指定数量的随机字符:
  21. print random.sample('zyxwvutsrqponmlkjihgfedcba',5)
  22. # 从a-zA-Z0-9生成指定数量的随机字符:
  23. ran_str = ''.join(random.sample(string.ascii_letters + string.digits, 8))
  24. print ran_str
  25. # 多个字符中选取指定数量的字符组成新字符串:
  26. print ''.join(random.sample(['z','y','x','w','v','u','t','s','r','q','p','o','n','m','l',
  27. 'k','j','i','h','g','f','e','d','c','b','a'], 5))
  28. # 随机选取字符串:
  29. print random.choice(['剪刀', '石头', '布'])
  30. # 打乱排序
  31. items = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0]
  32. print random.shuffle(items)
  1. bool()使用:Python内置的bool()函数可以用来测试一个表达式的布尔值结果。0、0.0、-0.0、空字符串、空列表、空元组、空字典,这些都被判定为False;而-1、”False”被判断为True。

    1. >>> bool(1)
    2. True
    3. >>> bool(0)
    4. False
    5. >>> bool([])
    6. False
    7. >>> bool(())
    8. False
    9. >>> bool({})
    10. False
    11. >>> bool(-1)
    12. True
    13. >>> bool('')
    14. False
    15. >>> bool("False")
    16. True
    17. >>> bool("True")
    18. True
    19. >>> bool(0.0)
    20. False
    21. >>> bool(1.0)
    22. True
    23. >>> bool(-0.0)
    24. False
  2. 布尔类型运算:

    • and运算是与运算,只有所有都为True,and运算的结果才是True

      1. >>> True and True
      2. True
      3. >>> True and False
      4. False
      5. >>> False and False
      6. False
      7. >>> 5 > 3 and 3 > 1
      8. True
    • or运算是或运算,只要其中有一个为True,or运算结果就是True

      1. >>> True or True
      2. True
      3. >>> True or False
      4. True
      5. >>> False or False
      6. False
      7. >>> 5 > 3 or 1 > 3
      8. True
    • not运算是非运算,它是单目运算符,把True变成False,False变成True

      1. >>> not True
      2. False
      3. >>> not False
      4. True
      5. >>> not 1 > 2
      6. True
    • 在做四则运算的时候,把True看做1,False看做0

      1. >>> True > False
      2. True
      3. >>> True < False
      4. False
      5. >>> True >=False
      6. True
      7. >>> True -1
      8. 0
      9. >>> True + 1
      10. 2
      11. >>> True *3
      12. 3
      13. >>> False -1
      14. -1
  3. 空值

空值不是布尔类型,严格的来说放在这里是不合适的,只不过和布尔关系比较紧密。空值是Python里一个特殊值,用None表示(首字母大写)。None不能理解为0,因为0是整数类型。None不是布尔类型,而是NoneType。

4. 字符串类型

(string 英[strɪŋ] 美[strɪŋ])

  • 字符串的表示形式

abc可能是个变量,但是"abc"肯定是个字符串了。这里强调一下在编程语言中,所有的符号都是英文状态下的
在Python中单引号和双引号的作用完全相同。在其他语言中,单双引号还是有一定区别的。

  • 原生字符串:** 通过在字符串前加r或R**,如 r”this is test \n”,表示这个字符串里的斜杠不需要转义,等同于自身
  1. 字符串创建

字符串是Python中最常用的数据类型之一,使用单引号或双引号来创建字符串,使用三引号创建多行字符串。

  1. s1 = "hello world"
  2. print(s1)
  3. s2 = 'hello nature'
  4. print(s2)
  5. s3 = '''hello city'''
  6. print(s3)
  1. 存储方式

字符串是不可变的序列数据类型,不能直接修改字符串本身,和数字类型一样!

  1. >>> s2 = "hello world"
  2. >>> s2[4] = 'l' #给字符串'hello world'中的第五个字母进行重新赋值,会出现错误提示
  3. Traceback (most recent call last):
  4. File "<stdin>", line 1, in <module>
  5. TypeError: 'str' object does not support item assignment

对于数值类型而言,一个字节最大可存储的值是256,所以num就存储在一个字节当中。但是,字符串因本身是序列数据结构,所以num1为”200”的存储模式为”2””0””0”分别在存储在3个字节当中。如下

  1. >>> num = 200
  2. >>> num1 = '200'
  3. >>> len(num)
  4. Traceback (most recent call last):
  5. File "<pyshell#5>", line 1, in <module>
  6. len(num)
  7. TypeError: object of type 'int' has no len()
  8. >>> len(num1)
  9. 3
  10. >>> id(num)
  11. 1602848448
  12. >>> id(num1)
  13. 49075008
  14. >>>

**

  1. 字符串下标

由于字符串是序列数据结构,所以当我们要从”hello world”当中取出某一个字母就索引(默认从0开始)来取。

  1. >>> s1 = "hello world"
  2. >>> s1[1]
  3. 'e'
  4. >>> s1[10]
  5. 'd'
  6. >>> s1[-1]
  7. 'd'
  8. >>> s1[11]
  9. Traceback (most recent call last):
  10. File "<stdin>", line 1, in <module>
  11. IndexError: string index out of range

**

  1. 字符串切片

在dos命令行中,输入help(slice),查看切片说明文档。
切片参数:

  • start起始位置,默认索引从0开始
  • stop结束位置,默认最后一个元素
  • step步长,默认为1
  • 切片区间为左闭右开形式 ```python

    help(slice) Help on class slice in module builtins:

class slice(object) | slice(stop) | slice(start, stop[, step]) | | Create a slice object. This is used for extended slicing (e.g. a[0:10:2]).

  1. **
  2. <a name="NTFwS"></a>
  3. #### 练习
  4. > - [x] test = "hello world",如何取出world值?
  5. ```python
  6. test = 'hello world'
  7. print(test[-5::1]) #从倒数第五位开始取值,取到最后一位,步长为1
  8. print(test[::-1]) #倒叙输出字符串
  9. pring(test[::2]) #从第一个字母开始,按步长为2切片取值

**

  1. 字符串组成方式
  • +号直接拼接

    1. >>> print('1' + '2')
    2. 12
  • %s %d %f

    1. >>> name = 'wei'
    2. >>> age = 18
    3. >>> print('姓名为:%s 年龄为:%d'%(name,age))
    4. 姓名为:wei 年龄为:18
  • str.format()

    1. >>> name = 'wei'
    2. >>> age = 18
    3. >>> print('姓名为:{} 年龄为:{}'.format(name,age))
    4. 姓名为:wei 年龄为:18
    5. >>> print('姓名为:{1} 年龄为:{0}'.format(age,name))
    6. 姓名为:wei 年龄为:18
  • f’’

    1. >>> name = 'wei'
    2. >>> age = 18
    3. >>> print(f'姓名为:{name} 年龄为:{age}')
    4. 姓名为:wei 年龄为:18

    **

  1. 其它常见操作
  • S.find(sub) —> 返回该元素最小的索引

    1. >>> test = 'hello python'
    2. >>> test.find('e')
    3. 1
    4. >>> test.find('l') # 当元素有多个时,返回最小索引
    5. 2
    6. >>> test.find('a') # 找不到则为-1
    7. -1
  • S.index(sub) —> 返回该元素最小的索引

实际上,该方法与s.find()实现的功能一样,唯一不同的就是当元素不存在时,s.index()方法会报错。这在需要以报错终止程序的测试中就可以用到了。

  • S.replace(old, new[, count]) —> 替换

    1. >>> test = 'hello python'
    2. >>> test.replace('h','H')
    3. 'Hello pytHon'
    4. >>> test
    5. 'hello python'
    6. >>> test.replace('h','H',1)
    7. 'Hello python'
  • S.split(sep=None) —> 以sep来分割字符串,并返回列表。sep默认为None,分割默认为空格

    1. >>> test = 'hello python'
    2. >>> test.split(' ')
    3. ['hello', 'python']
  • S.startswith(prefix[, start[, end]]) —> 判断字符串是否以前缀开始,返回为bool值

  • S.endswith(suffix[, start[, end]]) —> 判断字符串是否以尾缀结束,返回为bool值
  • S.lower() —> 将字符串全部转为小写
  • S.upper() —> 将字符串全部转为大写
  • S.strip([chars]) —> 默认去掉字符串左右的空格
  • S.isalpha() —> 判断字符串是否全为字母,返回的是bool值
  • S.isdigit() —> 判断字符串是否全为数字,返回的是bool值
  • S.isalnum() —> 判断字符串是否全为数字或者字母,不存在特殊字符,返回的是bool值
  • S.join(iterable) —> 将序列中的元素以指定的字符连接生成一个新的字符串
    1. >>> li = ["hello","wrld"]
    2. >>> test = '-'.join(li)
    3. >>> print(test)
    4. hello-wrld

5. 列表类型

(list 英[lɪst] 美[lɪst])

  1. 列表简介
  • 列表是Python中最基本也是最常用的数据结构之一。列表中的每个元素都被分配一个数字作为索引,用来表示该元素在列表内所排在的位置。第一个元素的索引是0,第二个索引是1,依此类推。
  • Python的列表是一个有序可重复的元素集合,可变的序列数据类型,可嵌套、迭代、修改、分片、追加、删除,成员判断。
  • 从数据结构角度看,Python的列表是一个可变长度的顺序存储结构,每一个位置存放的都是对象的指针。

例:对于列表 alist = [1, “a”, [11,22], {“k1”:”v1”}],其在内存内的存储方式是这样的:
第三讲:基础数据类型与运算符 - 图1
做简单的列表元素存储方式代码测试:

  1. >>> a = 'a'
  2. >>> b = 'b'
  3. >>> c = 'c'
  4. >>> li = ['a','b','c']
  5. >>> id(a)
  6. 34467432
  7. >>> id(li[0])
  8. 34467432
  9. >>> id(b)
  10. 34465752
  11. >>> id(li[1])
  12. 34465752
  13. >>> id(c)
  14. 30388440
  15. >>> id(li[2])
  16. 30388440
  1. 列表创建方式

创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可

  1. >>> li = [] # 定义一个空的列表 注意 命名不能是list
  2. >>> li
  3. []
  4. >>> li1 = [1,'wei',0.99] # 任何数据类型都可存储
  5. >>> li1
  6. [1, 'wei', 0.99]
  7. >>> li2 = list()
  8. >>> li2
  9. []
  10. >>> li3 = list('hello') # list(iterable)
  11. >>> li3
  12. ['h', 'e', 'l', 'l', 'o']
  1. 列表元素访问

列表从0开始为它的每一个元素顺序创建下标索引,直到总长度减一 。要访问它的某个元素,以方括号加下标值的方式即可。注意要确保索引不越界,一旦访问索引超过范围,会抛出异常。所以,一定要记得最后一个元素的索引是len(list)-1。

  1. >>> lis = ["a", "b", "c"]
  2. >>> lis[0]
  3. 'a'
  4. >>> lis[1]
  5. 'b'
  6. >>> lis[2]
  7. 'c'
  8. >>> lis[3]
  9. Traceback (most recent call last):
  10. File "<pyshell#7>", line 1, in <module>
  11. lis[3]
  12. IndexError: list index out of range
  1. 列表元素值修改 ```python

    li1 = [1,2,3] li1[1] 2

li1[1] = 5 li1 [1, 5, 3]

li1[1:] = [6,7] li1 [1, 6, 7] ```

  1. 列表元素删除

使用del语句或者remove()、pop()方法删除指定的元素。

  1. >>> li = ['a','b','c']
  2. >>> del li[0]
  3. >>> li
  4. ['b', 'c']
  5. >>> li = ['a','b','c']
  6. >>> li.remove('a')
  7. >>> li
  8. ['b', 'c']
  9. >>> li = ['a','b','c']
  10. >>> li.pop()
  11. 'c'
  12. >>> li
  13. ['a', 'b']
  14. >>> li = ['a','b','c']
  15. >>> li_1 = li.pop(1)
  16. >>> li_1
  17. 'b'
  18. >>> li_1 = li.pop(0)
  19. >>> li_1
  20. 'a'
  21. >>> li
  22. ['c']
  1. 列表其它特定规则 ```python

    语句 结果 描述

    [1, 2, 3] + [4, 5, 6] # [1, 2, 3, 4, 5, 6] 组合两个列表 li1 = [1, 2, 3] li2 = [4, 5, 6] print(li1.add(li2)) # 底层调用了add方法,但是不会改变li1内值 [1, 2, 3, 4, 5, 6]

[‘Hi!’] * 4 # [‘Hi!’, ‘Hi!’, ‘Hi!’, ‘Hi!’] 列表的乘法

print(li1.mul(3)) [1, 2, 3, 1, 2, 3, 1, 2, 3]

li1 [1, 2, 3]

3 in li1 #判断元素是否存在于列表中 True

print(li1.contains(1)) #判断li1中有没有1这个元素 True

  1. 7. **列表的常用函数**
  2. ```python
  3. # 函数 作用
  4. >>> li1 = [1, 2, 3]
  5. >>> len(li1) # 返回列表元素个数,也就是获取列表长度 l1.__len__()
  6. 3
  7. >>> max(li1) # 返回列表元素最大值 max(l1) max(1,2,3,4)
  8. 3
  9. >>> min(li1) # 返回列表元素最小值
  10. 1
  11. >>> list('hello') # 将序列转换为列表
  12. ['h', 'e', 'l', 'l', 'o']
  13. >>> s = list((1, "a", "b", 2))
  14. >>> s
  15. [1, 'a', 'b', 2]
  16. >>> max(s) # 不能混合不同类型进行最大最小求值
  17. Traceback (most recent call last):
  18. File "<pyshell#20>", line 1, in <module>
  19. max(s)
  20. TypeError: '>' not supported between instances of 'str' and 'int'
  1. 列表排序与反转,会直接改变列表内值

    1. >>> li = [1,2,3,4,5,2,1,3,1]
    2. >>> li.reverse() # 将列表反转 修改本身 *IN PLACE*
    3. >>> li
    4. [1, 3, 1, 2, 5, 4, 3, 2, 1]
    5. >>> li.sort() # 排序,默认升序 L.sort(key=None, reverse=False)
    6. >>> li
    7. [1, 1, 1, 2, 2, 3, 3, 4, 5]
    8. >>> li.sort(reverse=True) # reverse=True 降序
    9. >>> li
    10. [5, 4, 3, 3, 2, 2, 1, 1, 1]
  2. 切片取值

  • 切片指的是对序列进行截取,选取序列中的某一段。语法是: list[start:end:step]

以冒号分割索引,start代表起点索引,end代表结束点索引,step为步长默认为1。省略start表示以0开始,省略end表示到列表的结尾。注意,区间是左闭右开的!

  • 如果是负整数下标,则从列表的最后开始往头部查找。例如-1表示最后一个元素,-3表示倒数第三个元素。

切片过程中还可以设置步长,以第二个冒号分割,例如list[3:9:2],表示每隔多少距离取一个元素。

  1. >>> li = ['a','b','c','d','e','f']
  2. >>> li[1] # 取'b' 注意:index默认从0开始
  3. 'b'
  4. >>> li[2] # 取'c'
  5. 'c'
  6. >>> li[1:3] # 取['b', 'c'] 注意:左闭右开
  7. ['b', 'c']
  8. >>> li[:3] # 取['a', 'b', 'c'] 注意:start不写默认从头开始
  9. ['a', 'b', 'c']
  10. >>> li[2:] # 取['c', 'd', 'e', 'f'] 注意:end不写默认到最后
  11. ['c', 'd', 'e', 'f']
  12. >>> li[:] # 取全部
  13. ['a', 'b', 'c', 'd', 'e', 'f']
  14. >>> li[::2] # 取['a', 'c', 'e'] 注意:步长为2
  15. ['a', 'c', 'e']
  16. >>> li[::-1] # 逆序
  17. ['f', 'e', 'd', 'c', 'b', 'a']

**

  1. 多维列表(嵌套列表)

    1. >>> a = [[1,2,3],[4,5,6],[7,8,9]]
    2. >>> a[0][1]
    3. 2

    **

  2. 遍历列表元素 ```python a = [1,2,3,4,5,6] for i in a: # 遍历每一个元素本身 print(i)

    out

    1 2 3 4 5 6

for i in range(len(a)): # 遍历列表的下标,通过下标取值 print(i, a[i])

out

0 1 1 2 2 3 3 4 4 5 5 6

x = 9 if x in a: # 进行是否属于列表成员的判断。该运算速度非常快。 print(“True”) else: print(“False”)

out

False

  1. 12. **列表的内置方法**
  2. - append(obj) 在列表末尾添加新的对象
  3. - count(obj) 统计某个元素在列表中出现的次数
  4. - extend(seq) 在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)
  5. - index(obj) 从列表中找出某个值第一个匹配项的索引位置
  6. - insert(index, obj) 将对象插入列表
  7. - pop(obj=list[-1]) 移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
  8. - remove(obj) 移除列表中某个值的第一个匹配项
  9. - reverse() 反向列表中元素
  10. - sort([func]) 对原列表进行排序
  11. - copy() 复制列表
  12. - clear() 清空列表,等于del lis[:]
  13. 注意:其中的类似 appendinsert, remove 等方法会修改列表本身,并且返回值为None
  14. ```python
  15. >>> li = [1,2,3]
  16. >>> li.append([3,3])
  17. >>> li
  18. [1, 2, 3, [3, 3]]
  19. >>> li = [1,2,3,[3,3]]
  20. >>> li.count(3)
  21. 1
  22. >>> li = [1,2,3]
  23. >>> li.extend([4,5])
  24. >>> li
  25. [1, 2, 3, 4, 5]
  26. >>> li = [1,2,3,2,3]
  27. >>> li.index(3)
  28. 2
  29. >>> li = ['happy','year']
  30. >>> li.insert(1,'new')
  31. >>> li
  32. ['happy', 'new', 'year']
  33. >>> li = [1,2,3]
  34. >>> li.clear()
  35. >>> li
  36. []

拓展:sort()的用法

  • 官方定义是

def sort(self, key=None, reverse=False): # real signature unknown; restored from doc “”” L.sort(key=None, reverse=False) -> None — stable sort IN PLACE “”” key用于指定一个函数,即key=函数,即为排序提供一种方法;reverse意为翻转的意思,可以呈现为降序排序等。

  • 例如 li = [‘p’,’py’,’pyt’,’pyth’,’pytho’,’python’] ,将列表按照字符长度进行降序排列
  • 参数key与lambda匿名函数结合使用,例如 a = [(‘AZ’,’abc’,154),(‘BZ’,’aac’,144), (‘AB’,’abd’,253)]
  1. li = ['p','py','pyt','pyth','pytho','python']
  2. li.sort(key=len,reverse=True)
  3. print(li)
  4. #out
  5. ['python', 'pytho', 'pyth', 'pyt', 'py', 'p']
  1. a = [('AZ','abc',154),('BZ','aac',144), ('AB','abd',253)]
  2. #按照第一个元素进行降序排列
  3. print(id(a))
  4. a.sort(reverse=True)
  5. print(a)
  6. print(id(a))
  7. #out
  8. 32161992
  9. [('BZ', 'aac', 144), ('AZ', 'abc', 154), ('AB', 'abd', 253)]
  10. 32161992
  11. a = [('AZ','abc',154),('BZ','aac',144), ('AB','abd',253)]
  12. #按照第二个元素进行降序排序
  13. print(id(a))
  14. a.sort(key=lambda i:i[1] ,reverse=True)
  15. print(a)
  16. print(id(a))
  17. #out
  18. 31965384
  19. [('AB', 'abd', 253), ('AZ', 'abc', 154), ('BZ', 'aac', 144)]
  20. 31965384

拓展:列表的存储模式与访问效率

内存是数据真正存放的地方,是一个存储单元,基本存储单位是字节(bit),一个字节是8位。以32位电脑举例
一个int类型占4个字节,1个字节是8位,存储int(1)就会按照如下进行存储:
点击查看【processon】
那么当我们列表中的元素为不同类型数据结构时,会怎么样呢?
点击查看【processon】
存储的地址会占用4个字节,顺序表的存储结构如下:
点击查看【processon】
这就是列表内存地址不变的原因,是因为列表存储采用的类型为分离式的元素外置存储结构
再探讨一下在列表中添加元素的操作,其时间复杂度的区别:
点击查看【processon】
我们不妨对列表中的几种添加元素的运行效率进行测试,代码如下:

  1. from timeit import Timer
  2. def t1():
  3. l=[]
  4. for i in range(1000):
  5. li=l+[i]
  6. def t2():
  7. l=[]
  8. for i in range(1000):
  9. li=l.append(i)
  10. def t3():
  11. li= [i for i in range(1000)]
  12. def t4():
  13. li=list(range(1000))
  14. def t5():
  15. l=[]
  16. for i in range(1000):
  17. l.insert(0,i)
  18. ts1=Timer('t1()','from __main__ import t1')
  19. print('add:',ts1.timeit(number=10000))
  20. ts2=Timer('t2()','from __main__ import t2')
  21. print('append:',ts2.timeit(number=10000))
  22. ts3=Timer('t3()','from __main__ import t3')
  23. print('list derivation:',ts3.timeit(number=10000))
  24. ts4=Timer('t4()','from __main__ import t4')
  25. print('list range:',ts4.timeit(number=10000))
  26. ts5=Timer('t5()','from __main__ import t5')
  27. print('insert:',ts5.timeit(number=10000))
  28. #out
  29. add 1.623764426183277
  30. append 1.3833754859298975 #append的方法耗时1.38秒
  31. list derivation 0.5864754420221825
  32. list range 0.2555692296159324
  33. insert 8.339897477269725 #insert的方法耗时8.34秒

同理去测试pop、remove这两种方法的运行效率

  1. from timeit import Timer
  2. def t1():
  3. l=[1,2,34,5]
  4. l.pop()
  5. def t2():
  6. l=[1,2,34,5]
  7. l.remove(5)
  8. def t3():
  9. l=[1,2,34,5]
  10. del l
  11. ts1=Timer('t1()','from __main__ import t1')
  12. print('pop:',ts1.timeit(number=1000000))
  13. ts2=Timer('t2()','from __main__ import t2')
  14. print('remove:',ts2.timeit(number=1000000))
  15. ts3=Timer('t3()','from __main__ import t3')
  16. print('del:',ts3.timeit(number=1000000))
  17. #out
  18. pop 0.4461612876740691 #pop方法耗时0.38秒
  19. remove 0.4898481257117155 #remove方法耗时0.47秒
  20. del 0.2638907233349873 #del方法耗时0.26秒

在Python中,列表采用的存储策略是:

  1. 建立空表或者8元素以内的列表时,系统分配一块能容纳8元素的存储区;
  2. 在执行列表元素新增操作时,如元素存储区满了,就换4倍存储区;
  3. 如果表元素>>50000,则改变策略采用指数加一倍的方式扩容存储区;
  4. 这样的存储策略的目的是避免出现多空闲的存储位置。

拓展:如何实现LRU的缓存淘汰算法呢?

缓存是高速读取数据的技术,在例如CPU缓存、数据库缓存、浏览器缓存等存在非常广泛应用。
当缓存将满时,需要清理出去次要数据时,就需要相应的策略来完成,常见的有:

  • FIFO先进先出策略(First In First Out)
  • LFU最少使用策略(Least Frequently Used)
  • LRU最近最少使用策略(Least Recently Used)

好比我们整理内务时,先是把很早以前的现在用不上的清除出去,然后到基本上用不上的清除掉,最后把最近比较少用的考虑清除出去。

  1. 元组类型
    (tuple 英 [tʌpl] 美 [tʌpl])

  2. 元组基本属性

用圆括号括起来的是元组。元组也是序列结构,但是是一种不可变的序列数据类型,你可以简单的理解为内容不可变的列表。除了在内部元素不可修改的区别外,元组和列表的用法差不多。如len()/max()/min()/tuple()等
元组和列表都采用了顺序表的实现技术。不同之处在于:

  • 列表为可变线性表,可增删元素,并且保序,可下标访问与更新,内存地址保持不变,采用分离式的动态存储顺序表技术来实现;时间复杂度为O(1);

  • [x] 列表中还有list.reverse()与list.sort() 但是元组没有。元组要实现反转与排序使用reversed(),sorted()

reversed()内置函数返回的是一个内存地址,要使用tuple()函数将其调用出来成为元组呈现。

  1. >>> tu1 = (1,2,3,4,5,5,5,6)
  2. >>> reversed(tu1)
  3. <reversed object at 0x0000000002E36C88>
  4. >>> tuple(reversed(tu1))
  5. (6, 5, 5, 5, 4, 3, 2, 1)
  6. >>> tu = (1,-1,2,3,5,2,0)
  7. >>> sorted(tu)
  8. [-1, 0, 1, 2, 2, 3, 5]
  1. 元组操作注意事项
  • 元组不允许增删元素。若想改变该元组,就只能重新开辟一块内存,创建新的元组
  • 元组只保证它的一级子元素不可变,但是对于嵌套的元素内部,不保证不可变 ```python

    tu_test = (1,2,[‘WEI’,3,0]) tu_test[2][0] = ‘wei’ tu_test (1, 2, [‘wei’, 3, 0])

tu_test = (1,2,(‘wei’,3,0)) tu_test[2][0] = ‘WEI’ Traceback (most recent call last): File ““, line 1, in tu_test[2][0] = ‘WEI’ TypeError: ‘tuple’ object does not support item assignment ```

  • 不允许删除某个元素(但可以删除整个元组)
  • 所有会对元组内部元素发生修改的方法都不能使用。例如,元组没有remove,append,pop等方法

7. 字典类型

(dictionary 英 [ˈdɪkʃənri] 美 [ˈdɪkʃəneri] )

  1. 功能简介

字典可精确描述为不定长、可变、无序、散列的集合类型,可变的序列数据类型

  • Python的字典数据类型是基于hash散列算法实现的,采用键值对(key:value)的形式,根据key的值计算value的地址,查取与插入速度快。
  • 它是无序的,包含的元素个数不限,值的类型也可以是其它任何数据类型!
  • 字典的key必须是不可变的对象,例如整数、字符串、bytes和元组,但使用最多的还是字符串。 列表、字典、集合等就不可以作为key。同时,同一个字典内的key必须是唯一的,但值则不必。
  • 字典的每个键值对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中。
    1. d = {key1 : value1, key2 : value2 }
  1. 字典创建方式 ```python

    dic = {} dic {} type(dic)

dict() {}

dic1 = {‘name’:’amy’,’age’:’18’} type(dic1)

dic2 = dict(name=”amy”,age=’18’) type(dic2)

dic3 = dict([(‘name’,’amy’),(‘age’,’18’)]) type(dic3)

dic1 == dic2 == dic3 # ==比较数值 True ``` **

  1. 字典访问

字典是集合类型,不是序列类型,因此没有索引下标的概念,更没有切片的说法。但是与list类似,字典采用把相应的键放入方括号内获取对应值的方式取值。可以通过dic.keys()以及dic.values()访问键值与key值。

  1. >>> dic_1 = {'name':'wei','age':18}
  2. >>> dic_1['age']
  3. 18
  4. >>> type(dic_1['age'])
  5. <class 'int'>
  6. >>> dic_1['gender']
  7. Traceback (most recent call last):
  8. File "<pyshell#73>", line 1, in <module>
  9. dic_1['gender']
  10. KeyError: 'gender'
  1. 字典元素增改

增加就是往字典插入新的键值对,修改就是给原有的键赋予新的值。由于一个key只能对应一个值,所以,多次对一个key赋值,后面的值会把前面的值冲掉。

  1. >>> dic_1 = {'name':'wei','age':18}
  2. >>> dic_1['gender'] = "male" # 增加key值为"gender",value值为"female"的元素
  3. >>> dic_1
  4. {'name': 'wei', 'age': 18, 'gender': 'male'}
  5. >>> dic_1['gender'] = 'male' # 当有该key:value值时,取出来重新赋值则进行了修改
  6. >>> dic_1
  7. {'name': 'wei', 'age': 18, 'gender': 'male'}

**

  1. 删除字典元素、清空字典和删除字典

使用del关键字删除字典元素或者字典本身,使用字典的clear()方法清空字典。注意参数为key,不能是value值。

  1. >>> dic_1 = {'name': 'wei', 'age': 18, 'gender': 'male'}
  2. >>> del dic_1['wei']
  3. Traceback (most recent call last):
  4. File "<pyshell#78>", line 1, in <module>
  5. del dic_1['wei']
  6. KeyError: 'wei'
  7. >>> del dic_1['name']
  8. >>> dic_1
  9. {'age': 18, 'gender': 'male'}
  10. >>> dic_1.clear()
  11. >>> dic_1
  12. {}
  13. >>> del dic_1
  14. >>> dic_1
  15. Traceback (most recent call last):
  16. File "<pyshell#84>", line 1, in <module>
  17. dic_1
  18. NameError: name 'dic_1' is not defined

**

  1. 字典的方法
  • get(key) 返回指定键的值,如果值不在字典中,则返回default值
  • items() 以列表返回可遍历的(键, 值) 元组对
  • keys() 以列表返回字典所有的键
  • values() 以列表返回字典所有的值 ```python

    dic_1 = {‘name’: ‘wei’, ‘age’: 18, ‘gender’: ‘male’} dic_1.get(‘age’) 18 dic_1.get(‘school’)

    dic_1.items() dict_items([(‘name’, ‘wei’), (‘age’, 18), (‘gender’, ‘male’)])

for i,j in dic_1.items(): print(i,j)

name wei age 18 gender male

dic_1.keys() dict_keys([‘name’, ‘age’, ‘gender’]) dic_1.values() dict_values([‘wei’, 18, ‘male’]) ``` **

拓展:map()函数

  1. 功能:根据提供的函数对指定序列做映射

**

  1. 通过map函数,将指定序列中的元素进行一一映射,从而可以生成新的字典
  1. >>> a = list('1234')
  2. >>> type(a)
  3. <class 'list'>
  4. >>> print(map(int,a))
  5. <map object at 0x0000000002E24FD0>
  6. >>> print(list(map(int,a)))
  7. [1, 2, 3, 4]
  8. >>> a
  9. ['1', '2', '3', '4']
  1. >>> li1 = ["name","age","gender"]
  2. >>> li2 = ["wei",18,'male']
  3. >>> def get(i,j):
  4. return (i,j)
  5. >>> print(dict(list(map(get,li1,li2))))
  6. {'name': 'wei', 'age': 18, 'gender': 'male'}

**

拓展:zip()函数

  1. 功能:zip()函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表对象
  2. 例如通过zip()函数实现上一题目中的一一映射并输出为字典
  1. >>> li1 = ["name","age","gender"]
  2. >>> li2 = ["wei",18,'male']
  3. >>> print(dict(zip(li1,li2)))
  4. {'name': 'wei', 'age': 18, 'gender': 'male'}

**

拓展:filter()函数

filter函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。filter(function or None, iterable) —> filter object

  • function为自定义函数
  • iterable为可迭代的对象
  • 返回值为filter对象

练习

  • 返回1-10的奇数列表。
  1. def t(n):
  2. return n % 2 == 1
  3. li = list(filter(t,range(1,10)))
  4. print(li)
  5. #out
  6. [1, 3, 5, 7, 9]
  1. li = []
  2. for i in range(1,11,2): # for i in range(1,11)
  3. li.append(i) # if i%2== 1:
  4. print(li) # li.append(i)
  5. #out # print(li)
  6. [1, 3, 5, 7, 9]

**

8. bytes类型

  1. 基本介绍

在Python3以后,字符串和bytes类型彻底分开了。字符串是以字符为单位进行处理的,bytes类型是以字节为单位处理的。bytes数据类型在所有的操作和使用甚至内置方法上和字符串数据类型基本一样,也是不可变的序列对象。Python3中,bytes通常用于网络数据传输、二进制图片和文件的保存等等。

  1. bytes创建

可以通过调用bytes()生成bytes实例,其值形式为 b’xxxxx’,对于同一个字符串如果采用不同的编码方式生成bytes对象,就会形成不同的值。

  1. >>> a = b'hello'
  2. >>> type(a)
  3. <class 'bytes'>
  4. >>> b = bytes('hello',encoding='utf8')
  5. >>> type(b)
  6. <class 'bytes'>
  1. bytes类型常用转换

那在实际应用中,我们通常会将bytes类型与str类型做转换。

  1. >>> d = b'world'
  2. >>> d.decode() #字节转换为字符串
  3. 'world'
  4. >>> type(d)
  5. <class 'bytes'>
  6. >>> e = 'world'
  7. >>> e.encode() #字符串转换为字节
  8. b'world'
  9. >>> type(e)
  10. <class 'str'>

9. 集合(set)

  1. 基本属性

set集合是一个无序不重复元素的集,可变的序列数据类型,基本功能包括关系测试和消除重复元素。集合数据类型的核心在于自动去重。

  1. 创建集合

集合使用大括号({})框定元素,并以逗号进行分隔。但是注意:如果要创建一个空集合,必须用 set() 而不是 {} ,因为后者创建的是一个空字典。

  1. >>> s = {1,2,3}
  2. >>> s
  3. {1, 2, 3}
  4. >>> type(s)
  5. <class 'set'>
  6. >>> s = {} # 注意,空的{}会默认为字典
  7. >>> type(s)
  8. <class 'dict'>

集合还可以使用set()函数来创建。使用方法如下:

  • set() -> new empty set object(创建空集合)
  • set(iterable) -> new set object(创建集合),传入的值必须是可迭代对象 ```python

    s = set() # 创建空集合 s set() type(s)

s = set([1,2,3,1,2,3,4]) # 创建集合,去重 s {1, 2, 3, 4} s1 = set(“hello world”) # 创建集合,去重 s1 {‘h’, ‘d’, ‘o’, ‘ ‘, ‘e’, ‘l’, ‘r’, ‘w’} s2 = set(123) # 注意,需要传入可迭代的对象,而int类型的123并不是,所以报错 Traceback (most recent call last): File ““, line 1, in TypeError: ‘int’ object is not iterable ```

  1. 添加集合元素

通过add(key)方法可以添加元素到set中,可以重复添加,但依然遵循去重的原则,添加元素需要为不可变对象

  1. >>> s = {1,2,3,4,5,6}
  2. >>> s.add({1,2})
  3. Traceback (most recent call last):
  4. File "<pyshell#2>", line 1, in <module>
  5. s.add({1,2})
  6. TypeError: unhashable type: 'set'
  7. >>> s.add('1')
  8. >>> s
  9. {1, 2, 3, 4, 5, 6, '1'}
  10. >>> s.add(1)
  11. >>> s
  12. {1, 2, 3, 4, 5, 6, '1'}
  13. >>> s.add((1,2,3,4,7,9,10))
  14. >>> s
  15. {1, 2, 3, 4, 5, 6, (1, 2, 3, 4, 7, 9, 10), '1'}
  1. 更新集合元素

可以通过update()方法,将另一个对象更新到已有的集合中,这一过程同样会进行去重。添加元素需要为不可变对象

  1. >>> s = set([1,2,3,4,5])
  2. >>> s.update("hello") # 将hello拆开放入集合
  3. >>> s
  4. {1, 2, 3, 4, 5, 'h', 'o', 'e', 'l'}
  5. >>> s.update("hello") # 仍然去重
  6. >>> s
  7. {1, 2, 3, 4, 5, 'h', 'o', 'e', 'l'}
  1. 删除与访问集合元素
  • 通过remove(key)方法删除指定元素,或者使用pop()方法。注意,集合的pop方法不能通过索引删除元素。
  • 集合不能取出某个元素,因为集合既不支持下标索引也不支持字典那样的通过键值对获取。 ```python

    s = {1, 2, 3, 4, 5, ‘h’, ‘o’, ‘e’, ‘l’} s.remove(1) # 删除该元素 s {2, 3, 4, 5, ‘h’, ‘o’, ‘e’, ‘l’} s.remove(‘h’) # 删除该元素 s {2, 3, 4, 5, ‘o’, ‘e’, ‘l’} s.remove(‘www’) # 删除不存在的元素则报错 Traceback (most recent call last): File ““, line 1, in KeyError: ‘www’

s1 = set(“hello world”) s1.pop() ‘h’ s1.pop() ‘d’ s1.pop() # 注意是随机删除 ‘o’ s1.pop(1) # 不能通过索引删除,因为本身无序 Traceback (most recent call last): File ““, line 1, in TypeError: pop() takes no arguments (1 given)

s1 {‘ ‘, ‘e’, ‘l’, ‘r’, ‘w’} s1[1] Traceback (most recent call last): File ““, line 1, in TypeError: ‘set’ object does not support indexing ```

集合数据类型属于Python内置的数据类型,在很多书籍中甚至都看不到一点介绍。其实,集合是一种非常有用的数据结构,它的去重和集合运算是其它内置类型都不具备的,在很多场合有着非常重要的作用,比如网络爬虫。

拓展:集合方法

  • 交集:s1 = {‘yellow’, ‘red’, ‘blue’, ‘green’, ‘black’} s2 = {‘red’, ‘brown’} ,求两个集合的交集
  1. s1 = {'yellow', 'red', 'blue', 'green', 'black'}
  2. s2 = {'red', 'brown'}
  3. print(f'{s1},数据类型为{type(s1)}')
  4. print(f'{s2},数据类型为{type(s2)}')
  5. print(f'两个集合的交集为{s1.intersection(s2)},数据类型为{type(s1.intersection(s2))}')
  6. #out
  7. {'green', 'red', 'blue', 'yellow', 'black'},数据类型为<class 'set'>
  8. {'brown', 'red'},数据类型为<class 'set'>
  9. 两个集合的交集为{'red'},数据类型为<class 'set'>
  • [x] 差集:s1 = {‘yellow’, ‘red’, ‘blue’, ‘green’, ‘black’} s2 = {‘red’, ‘brown’} ,求两个集合的差集

  • [ ]

  1. s1 = {'yellow', 'red', 'blue', 'green', 'black'}
  2. s2 = {'red', 'brown'}
  3. print(f'{s1},数据类型为{type(s1)}')
  4. print(f'{s2},数据类型为{type(s2)}')
  5. print(f'两个集合的差集为{s1.difference(s2)},数据类型为{type(s1.difference(s2))}')
  6. #out
  7. {'red', 'black', 'green', 'blue', 'yellow'},数据类型为<class 'set'>
  8. {'red', 'brown'},数据类型为<class 'set'>
  9. 两个集合的差集为{'green', 'black', 'blue', 'yellow'},数据类型为<class 'set'>

10. 类型转换函数

int(x [,base ]) 将x转换为一个整数
long(x [,base ]) 将x转换为一个长整数
float(x ) 将x转换到一个浮点数
complex(real [,imag ]) 创建一个复数
str(x ) 将对象 x 转换为字符串
repr(x ) 将对象 x 转换为表达式字符串
eval(str ) 用来计算在字符串中的有效Python表达式,并返回一个对象
tuple(s ) 将序列 s 转换为一个元组
list(s ) 将序列 s 转换为一个列表
chr(x ) 将一个整数转换为一个字符
unichr(x ) 将一个整数转换为Unicode字符
ord(x ) 将一个字符转换为它的整数值
hex(x ) 将一个整数转换为一个十六进制字符串
oct(x ) 将一个整数转换为一个八进制字符串

练习

  • lis1 =[‘name’,’author’,’introduce’] lis2 =[‘NORWEGIAN WOOD’,‘Haruki Murakami’,‘balalalalal…’],将 lis1 与 lis2 以键值对的形式呈现
  1. lis1 =['name','author','introduce']
  2. lis2 =['NORWEGIAN WOOD','Haruki Murakami','balalalalal...']
  3. def get(i,j):
  4. return(i,j)
  5. print(dict(list(map(get,lis1,lis2)))) #1使用map函数进行转换
  6. print(dict(zip(lis1,lis2))) #2使用zip函数更直观简洁
  • wei_inf = {‘name’:’wei’,‘addr’:’anhui’,‘weight’:65} 获取 amy_info 的 key,value值
  1. >>> wei_inf = {'name':'wei','addr':'anhui','weight':65}
  2. >>> print(wei_inf.values())
  3. dict_values(['wei', 'anhui', 65])
  4. >>> print(wei_inf.keys())
  5. dict_keys(['name', 'addr', 'weight'])
  • 生成了 N 个 1~1000 之间的随机整数(N<=1000),N 是用户输入的, 对于其中重复的数字,只保留一个,把其余相同的数字去掉,然后再把这些数从小到大排序。(注意:此处需要使用随机整数。可了解 random 模块具体方法、for 循环、range()函数等结合使用,作为预习)
  1. import random
  2. n = int(input('请输入测试数据: '))
  3. test_1 = set()
  4. for i in range(n):
  5. test_1.add(random.randint(1,1000))
  6. print(sorted(test_1))
  7. #out
  8. 请输入测试数据: 5
  9. [356, 449, 775, 804, 961]
  • 字节如何转字符串,字符串如何转字节
  1. >>> d = b'world'
  2. >>> d.decode() #字节转换为字符串
  3. 'world'
  4. >>> type(d)
  5. <class 'bytes'>
  6. >>> e = 'world'
  7. >>> e.encode() #字符串转换为字节
  8. b'world'
  9. >>> type(e)
  10. <class 'str'>
  • 用代码结合文字表达可变与不可变数据类型差别
  1. #数值、字符串、元组、字节都是不可变数据类型,改变它的元素值,其本质是改变了数据内存id
  2. #列表list[]、集合set{}、字典dic{,}是可变数据类型,改变了它的元素值,而不会改变数据内存id
  3. >>> a = 'hellow'
  4. >>> id(a)
  5. 48923792 #内存地址A
  6. >>> id('hellow')
  7. 48923792 #内存地址A
  8. >>> a = 'type'
  9. >>> id(a)
  10. 1370184 #内存地址B
  11. >>> id('type')
  12. 1370184 #内存地址B
  13. >>> li = [1,2,3,4,5]
  14. >>> id(li) #内存地址A
  15. 49089736
  16. >>> li.append(3)
  17. >>> li
  18. [1, 2, 3, 4, 5, 3]
  19. >>> id(li)
  20. 49089736 #内存地址A
  21. >>> tu = (1,2,3,4,5)
  22. >>> type(tu)
  23. <class 'tuple'>
  24. >>> id(tu)
  25. 48511640 #内存地址A
  26. >>> sorted(tu)
  27. [1, 2, 3, 4, 5]
  28. >>> tu
  29. (1, 2, 3, 4, 5)
  30. >>> tuple(reversed(tu))
  31. (5, 4, 3, 2, 1)
  32. >>> tu
  33. (1, 2, 3, 4, 5)
  34. >>> id(tuple(reversed(tu)))
  35. 48511552 #内存地址B

二、运算符

1. 概念与类型

以1 + 2为例,1和2被称为操作数,”+” 称为运算符。Python语言支持以下类型的运算符:

  • 算术元运算符
  • 比较(关系)运算符
  • 赋值运算符
  • 逻辑运算符
  • 位运算符
  • 成员运算符
  • 身份运算符
  • 三目运算符

2. 算数元运算符

第三讲:基础数据类型与运算符 - 图2

  • / 计算结果是浮点数,即使两个数都是整数,结果也是浮点数 ```python

    9/3
    3.0

10/3 3.3333333333333335 ```

10/3不应该是3.3333333333333333333333无限循环吗?那实际上是因为计算机内存与cpu的有穷性导致结果为3.3333333333333335。

  • // 只取整数部分,余数被抛弃,向下取整 ```python

    10//3
    3

-10//3 -4 # 向下取整 ```

  • % 余数运算,可以得到两个整数相除的余数 ```python

    10%3
    1

-10%3 2 # 向下取整 ```

如果想同时得到商和余数,可以用divmod()这个方法,该方法的返回值是tuple (x//y, x%y)

  1. >>> divmod(10,3)
  2. (3,1)
  3. >>> divmod(-10,3)
  4. (-4, 2)
  • 因为浮点数精度的问题,Python计算中会出现与常规认知上面的偏差,这个时候需要导入decimal模块 ```python

    0.1+0.1+0.1-0.3 5.551115123125783e-17

from decimal import Decimal Decimal(‘0.1’)+Decimal(‘0.1’)+Decimal(‘0.1’)-Decimal(‘0.3’) Decimal(‘0.0’) ```

pow函数:里面可以有两个或三个参数,它们的意义是完全不同的。

  1. >>> pow(2,3)
  2. 8
  3. >>> pow(2,3,4)
  4. 0
  5. >>>

**

3. 比较运算符

第三讲:基础数据类型与运算符 - 图3

  • 比较运算符返回值为bool值
  • ==比较数值(int类型与str类型不能直接比较)
  • != 与 <> 均为不等于,python3中(python3中<>已弃用)
  • 字符串与字符串之间是比较ASCII值

4. 赋值运算符

第三讲:基础数据类型与运算符 - 图4

  • Python不支持a++语法
  • 注意 += 不能拆开写 + =

5. 位运算符

第三讲:基础数据类型与运算符 - 图5

位运算符是把数字看作二进制来进行计算的。Python中的位运算法则如下:

  1. a = 0011 1100
  2. b = 0000 1101
  3. -----------------
  4. a&b = 0000 1100
  5. a|b = 0011 1101
  6. a^b = 0011 0001
  7. ~a = 1100 0011

6. 逻辑运算符

Python语言支持逻辑运算符,但是没有其它语言中的&&和||语法,取而代之的是更加人性化的英文单词and or not(全部都是小写字母)。
第三讲:基础数据类型与运算符 - 图6

7. 成员运算符

in 与 not in是Python独有的运算符(全部都是小写字母),用于判断对象是否某个集合的元素之一,非常好用,并且运行速度很快。返回的结果是布尔值类型的True或者False。
第三讲:基础数据类型与运算符 - 图7

练习

  • 判断随机数据a是否在随机列表list1中
  1. import random
  2. list1 = [i for i in range(0,100) if i < random.randint(0,100)]
  3. a = random.randint(0,100)
  4. if a in list1:
  5. print(f'随机数据{a}在列表中\n',list1)
  6. else:
  7. print(f'随机数据{a}不在列表中\n',list1)

8. 身份运算符

这也是Python的特色语法(全部都是小写字母)。
第三讲:基础数据类型与运算符 - 图8

注意is与比较运算符==的区别,两者有根本上的区别,切记不可混用:
is用于判断两个变量的引用是否为同一个对象(可使用id()查看),而==用于判断变量引用的对象的值是否相等!

  1. >>> a = [1,2,3]
  2. >>> b = [1,2,3]
  3. >>> a is b
  4. False
  5. >>> a == b
  6. True
  7. >>> id(a) # 可通过id()查看内存地址
  8. 48825800
  9. >>> id(b)
  10. 48825992

9. 三目运算符

python中的三目运算符表示方法:True_statements if expression else False_statements

  1. import random
  2. list1 = [i for i in range(0,100) if i < random.randint(0,100)]
  3. a = random.randint(0,100)
  4. print(f'随机数据{a}在列表{list1}中\n') if a in list1 else print(f'随机数据{a}不在列表
  5. {list1}中\n')

10. 运算符优先级

下表列出了从最高到最低优先级的所有运算符。优先级高的运算符优先计算或处理,同级别的按从左往右的顺序计算(赋值运算符除外,它是按从右往左的顺序)
第三讲:基础数据类型与运算符 - 图9

其它常用的部分函数: abs(number) 返回数字的绝对值 cmath.sqrt(number) 返回平方根,也可以应用于负数 float(object) 把字符串和数字转换为浮点数 help() 提供交互式帮助 input(prompt) 获取用户输入 int(object) 把字符串和数字转换为整数 math.ceil(number) 返回数的上入整数,返回值的类型为浮点数 math.floor(number) 返回数的下舍整数,返回值的类型为浮点数 math.sqrt(number) 返回平方根不适用于负数 pow(x,y[.z]) 返回X的y次幂(有z则对z取模) repr(object) 返回值的字符串标示形式 round(number[.ndigits]) 根据给定的精度对数字进行四舍五入 str(object) 把值转换为字符串

练习

  • 如何判断”bob”是否在[“bob”,”tony”,”Lisa”,”Steven”]里面? 如果在则输出’bob 在逻辑大家庭’ 否则输出’bob 不在…好难过’
  1. print(f'bob 在逻辑大家庭' if 'bob' in ["bob","tony","Lisa","Steven"] else 'bob 不在...
  2. 好难过')
  • ‘ax’<’xa’ 为 True 还是 False?
  1. >>> 'ax' < 'xa'
  2. True #字符串比较的是ASCII码值
  • 以下程序如果输入 666 执行那个语句?为什么?
  1. >>> temp = input('请输入:')
  2. 请输入:666
  3. >>> if temp == 'Yes' or 'yes': # == 比较运算符高于 or逻辑运算符
  4. print('if执行了') #比较运算符的返回值是bool值, '666' == 'Yes' 返回值为False
  5. else: # or逻辑运算符,False or 'yes' 的逻辑运算返回的是非0值'yes'
  6. print('else执行了') #最终的判断执行了if语句,所以会有最终的输出结果产生
  7. if执行了
  • is 与==的区别是什么?

is用于判断两个变量的引用是否为同一个对象(可使用id()查看),而==用于判断变量引用的对象的值是否相等!

  • 用户输入 a,b。当 a 与 b 都不为 0 时,则输出 a 与 b 做商;否则输出 a 与 b 的乘积。使用三目运算符输出 a,b 较大的数
  1. from decimal import Decimal
  2. a = float(input('请输入a值: '))
  3. b = float(input('请输入b值: '))
  4. print(f'返回值为:{round(Decimal(a/b),2)}' if a != 0 and b != 0 else f'返回值为:{
  5. round(Decimal(a)*Decimal(b),2)}')
  6. print(f'输入的值中,较大值为:a= {a}' if a > b else f'输入的值中,较大值为:b= {b}')
  • ’1’+’2’的结果是多少?
  1. >>> '1'+'2' #字符串的 + 运算是拼接
  2. '12'
  • 当输入 y 或 Y 提示进入卸载,当输入 n 或 N 提示退出程序,输入其它 则提示输入不在选项范围之内(应用到 str.upper()或 str.lower())
  1. test = input('是否需要卸载:(Y/N) ')
  2. if test.upper() == 'Y':
  3. print(f'进入卸载')
  4. elif test.upper() == 'N':
  5. print(f'退出程序')
  6. else:
  7. print('输入不在选项范围内')