• 注意列表切片是左闭右开(取左不取右),容易导致边界问题。同样,range(n,0,-1)也是取不到0的。
  • 进制转换

十进制转二进制bin(100) “0b1100100”
二进制转十进制int('0b1100100',2) 100
字符串转数字 int(s)
字符串转为n进制的数字 int(s, n),比如 n=2。

python入门

变量与运算符

类型转换

  • int():将一个数值或字符串转换成整数,可以指定进制。
  • float():将一个字符串转换成浮点数。
  • str():将指定的对象转换成字符串形式,可以指定编码。
  • chr():将整数转换成该编码对应的字符串(一个字符)。
  • ord():将字符串(一个字符)转换成对应的编码(整数)。

在使用print函数输出时,也可以对字符串内容进行格式化处理:

  1. f = float(input('请输入华氏温度: '))
  2. c = (f - 32) / 1.8
  3. print('%.1f华氏度 = %.1f摄氏度' % (f, c))

上面print函数中的字符串%.1f是一个占位符,稍后会由一个float类型的变量值替换掉它。同理,如果字符串中有%d,后面可以用一个int类型的变量值替换掉它,而%s会被字符串的值替换掉。

除了这种格式化字符串的方式外,还可以用下面的方式来格式化字符串:

  1. print(f'{f:.1f}华氏度 = {c:.1f}摄氏度')

其中{f:.1f}{c:.1f}可以先看成是{f}{c},表示输出时会用变量f和变量c的值替换掉这两个占位符,后面的:.1f表示这是一个浮点数,小数点后保留1位有效数字。

运算符 描述
[]``[:] 下标,切片
** 指数
~``+``- 按位取反, 正负号
*``/``%``// 乘,除,模,整除
+``- 加,减
>>``<< 右移,左移
& 按位与
^``\\&#124; 按位异或,按位或
<=``<``>``>= 小于等于,小于,大于,大于等于
==``!= 等于,不等于
is``is not 身份运算符
in``not in 成员运算符
not``or``and 逻辑运算符
=``+=``-=``*=``/=``%=``//=``**=``&=``&#124;=``^=``>>=``<<= (复合)赋值运算符

说明: 上面这个表格实际上是按照运算符的优先级从上到下列出了各种运算符。在实际开发中,如果搞不清楚运算符的优先级,可以使用圆括号来确保运算的执行顺序。

转义字符 描述
\(在行尾时) 续行符
\\ 反斜杠符号
\’ 单引号
\” 双引号
\a 响铃
\b 退格(Backspace)
\e 转义
\000
\n 换行
\v 纵向制表符
\t 横向制表符
\r 回车
\f 换页
\oyy 八进制数yy代表的字符,例如:\o12代表换行
\xyy 十进制数yy代表的字符,例如:\x0a代表换行
\other 其它的字符以普通格式输出

分支与循环

if: elif: else

  1. x = float(input('x = '))
  2. if x > 1:
  3. y = 3 * x - 5
  4. elif x >= -1:
  5. y = x + 2
  6. else:
  7. y = 5 * x + 3
  8. print(f'f({x}) = {y}')

for-in: 循环

  1. total = 0
  2. for x in range(1, 101):
  3. total += x
  4. print(total)
  • range(101):0到100。
  • range(1, 101) 左闭右开,也就是取值从1到100,取不到101。
  • range(1, 101, 2):产生1到100的奇数,其中2是步长,即每次递增的值。
  • range(100, 0, -2):产生100到1的偶数,其中-2是步长,即每次递减的值。

while 循环

正整数反转:

  1. num = int(input('num = '))
  2. reversed_num = 0
  3. while num > 0:
  4. reversed_num = reversed_num * 10 + num % 10
  5. num //= 10
  6. print(reversed_num)

python数据结构

列表 list

列表 list.png

创建列表

列表是由一系元素按特定顺序构成的数据序列,这样就意味着定义一个列表类型的变量,可以保存多个数据,而且允许有重复的数据。跟上一课我们讲到的字符串类型一样,列表也是一种结构化的、非标量类型,操作一个列表类型的变量,除了可以使用运算符还可以使用它的方法。

  • 在Python中,可以使用[]字面量语法来定义列表,列表中的多个元素用逗号进行分隔,代码如下所示。
  1. items1 = [35, 12, 99, 68, 55, 87]
  2. items2 = ['Python', 'Java', 'Go', 'Kotlin']
  • 除此以外,还可以通过Python内置的list函数将其他序列变成列表。准确的说,list并不是一个普通的函数,它是创建列表对象的构造器(后面会讲到对象和构造器这两个概念)。
  1. items1 = list(range(1, 10))
  2. print(items1) # [1, 2, 3, 4, 5, 6, 7, 8, 9]
  3. items2 = list('hello')
  4. print(items2) # ['h', 'e', 'l', 'l', 'o']

需要说明的是,列表是一种可变数据类型,也就是说列表可以添加元素、删除元素、更新元素,这一点跟我们上一课讲到的字符串有着鲜明的差别。字符串是一种不可变数据类型,也就是说对字符串做拼接、重复、转换大小写、修剪空格等操作的时候会产生新的字符串,原来的字符串并没有发生任何改变。

运算

  1. items1 = [35, 12, 99, 68, 55, 87]
  2. items2 = [45, 8, 29]
  3. # 列表的拼接
  4. items3 = items1 + items2 # [35, 12, 99, 68, 55, 87, 45, 8, 29]
  5. # 列表的重复
  6. items4 = ['hello'] * 3 # ['hello', 'hello', 'hello']
  7. # 列表的成员运算
  8. print(100 in items3) # False
  9. print('hello' in items4) # True
  10. # 获取列表的长度(元素个数)
  11. size = len(items3) # 9
  12. # 列表的索引
  13. print(items3[0], items3[-size]) # 35 35
  14. items3[-1] = 100
  15. print(items3[size - 1], items3[-1]) # 100 100
  16. # 列表的切片
  17. print(items3[:5]) # [35, 12, 99, 68, 55]
  18. print(items3[4:]) # [55, 87, 45, 8, 100]
  19. print(items3[-5:-7:-1]) # [55, 68]
  20. print(items3[::-2]) # [100, 45, 55, 99, 35]
  21. # 列表的比较运算
  22. items5 = [1, 2, 3, 4]
  23. items6 = list(range(1, 5))
  24. # 两个列表比较相等性比的是对应索引位置上的元素是否相等
  25. print(items5 == items6) # True
  26. items7 = [3, 2, 1]
  27. # 两个列表比较大小比的是对应索引位置上的元素的大小
  28. print(items5 <= items7) # True

由于列表是可变类型,所以通过索引操作既可以获取列表中的元素,也可以更新列表中的元素。对列表做索引操作一样要注意索引越界的问题,对于有N个元素的列表,正向索引的范围是0N-1,负向索引的范围是-1-N,如果超出这个范围,将引发IndexError异常,错误信息为:list index out of range

增删改查

  1. items = ['Python', 'Java', 'Go', 'Kotlin']
  2. # 列表元素的遍历-方法一
  3. for index in range(len(items)):
  4. print(items[index])
  5. # 列表元素的遍历-方法二
  6. for item in items:
  7. print(item)
  8. # 使用append方法在列表尾部添加元素
  9. items.append('Swift') # ['Python', 'Java', 'Go', 'Kotlin', 'Swift']
  10. # 使用insert方法在列表指定索引位置插入元素
  11. items.insert(2, 'SQL') # ['Python', 'Java', 'SQL', 'Go', 'Kotlin', 'Swift']
  12. # 删除指定的元素
  13. items.remove('Java') # ['Python', 'SQL', 'Go', 'Kotlin', 'Swift']
  14. # 删除指定索引位置的元素
  15. items.pop(0)
  16. items.pop(len(items) - 1) # ['SQL', 'Go', 'Kotlin']
  17. # 清空列表中的元素
  18. items.clear() # []
  • 在使用remove方法删除元素时,如果要删除的元素并不在列表中,会引发ValueError异常,错误消息是:list.remove(x): x not in list
  • 在使用pop方法删除元素时,如果索引的值超出了范围,会引发IndexError异常,错误消息是:pop index out of range
  • 从列表中删除元素其实还有一种方式,就是使用Python中的del关键字后面跟要删除的元素,这种做法跟使用pop方法指定索引删除元素没有实质性的区别,但后者会返回删除的元素,前者在性能上略优(del对应字节码指令是DELETE_SUBSCR,而pop对应的字节码指令是CALL_METHODPOP_TOP)。
  1. items = ['Python', 'Java', 'Go', 'Kotlin']
  2. del items[1]
  3. print(items) # ['Python', 'Go', 'Kotlin']
  • 列表类型的index方法可以查找某个元素在列表中的索引位置;
  • 因为列表中允许有重复的元素,所以列表类型提供了count方法来统计一个元素在列表中出现的次数。
  • 列表的sort操作可以实现列表元素的排序,而reverse操作可以实现元素的反转
  1. items = ['Python', 'Java', 'Java', 'Go', 'Kotlin', 'Python']
  2. # 查找元素的索引位置
  3. print(items.index('Python')) # 0
  4. print(items.index('Python', 2)) # 5
  5. # 注意:虽然列表中有'Java',但是从索引为3这个位置开始后面是没有'Java'的
  6. print(items.index('Java', 3)) # ValueError: 'Java' is not in list
  7. # 查找元素出现的次数
  8. print(items.count('Python')) # 2
  9. print(items.count('Go')) # 1
  10. print(items.count('Swfit')) # 0
  11. # 排序
  12. items.sort() # ['Go', 'Java', 'Kotlin', 'Python', 'Python']
  13. # 反转
  14. items.reverse() # ['Python', 'Python', 'Kotlin', 'Java', 'Go']

列表生成式

  1. # 创建一个由1到9的数字构成的列表
  2. items1 = [x for x in range(1, 10)]
  3. print(items1) # [1, 2, 3, 4, 5, 6, 7, 8, 9]
  4. # 创建一个由'hello world'中除空格和元音字母外的字符构成的列表
  5. items2 = [x for x in 'hello world' if x not in ' aeiou']
  6. print(items2) # ['h', 'l', 'l', 'w', 'r', 'l', 'd']
  7. # 创建一个由个两个字符串中字符的笛卡尔积构成的列表
  8. items3 = [x + y for x in 'ABC' for y in '12']
  9. print(items3) # ['A1', 'A2', 'B1', 'B2', 'C1', 'C2']
  10. # 如果用for循环创建列表:
  11. items4 = []
  12. for x in 'ABC':
  13. for y in '12':
  14. items4.append(x + y)
  15. print(items4) # ['A1', 'A2', 'B1', 'B2', 'C1', 'C2']
  • 列表生成式拥有更好的性能,因为Python解释器的字节码指令中有专门针对生成式的指令(LIST_APPEND指令);而for循环是通过方法调用(LOAD_METHODCALL_METHOD指令)的方式为列表添加元素,方法调用本身就是一个相对耗时的操作。对这一点不理解也没有关系,记住“强烈建议用生成式语法来创建列表”这个结论就可以了。

嵌套的列表

如果用下面的方式来生成二维数组,是有问题的。

  1. scores = [[0] * 3] * 5 # [[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]
  2. scores[0][0] = 95
  3. print(scores) # [[95, 0, 0], [95, 0, 0], [95, 0, 0], [95, 0, 0], [95, 0, 0]]

Python Tutor网站的可视化代码执行功能里我们可以看到上述代码的结构是
python 基础 - 图2

正确的创建嵌套列表的方法是

  1. scores = [[0] * 3 for _ in range(5)]
  2. scores[0][0] = 95
  3. print(scores) # [[95, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]

元组 tuple

元组 tuple.png

  • 元组和列表的不同之处在于,元组是不可变类型,这就意味着元组类型的变量一旦定义,其中的元素不能再添加或删除,而且元素的值也不能进行修改。
  • 定义元组通常使用()字面量语法,也建议大家使用这种方式来创建元组。
  • 元组类型支持的运算符跟列表一样。
  • 一个元组中如果有两个元素,我们就称之为二元组;一个元组中如果五个元素,我们就称之为五元组。需要提醒大家注意的是,()表示空元组,但是如果元组中只有一个元素,需要加上一个逗号,否则**()**就不是代表元组的字面量语法,而是改变运算优先级的圆括号,所以**('hello', )****(100, )**才是一元组,而**('hello')****(100)**只是字符串和整数。我们可以通过type()来查看元素类型。

打包和解包

  • 当我们把多个用逗号分隔的值赋给一个变量时,多个值会打包成一个元组类型;
  • 当我们把一个元组赋值给多个变量时,元组会解包成多个值然后分别赋给对应的变量。
  1. # 打包
  2. a = 1, 10, 100
  3. print(type(a), a) # <class 'tuple'> (1, 10, 100)
  4. # 解包
  5. i, j, k = a
  6. print(i, j, k) # 1 10 100
  • 在解包时,如果解包出来的元素个数和变量个数不对应,会引发ValueError异常,错误信息为:too many values to unpack(解包的值太多)或not enough values to unpack(解包的值不足)。
  • 有一种解决变量个数少于元素的个数方法,就是使用星号表达式,我们之前讲函数的可变参数时使用过星号表达式。有了星号表达式,我们就可以让一个变量接收多个值,代码如下所示。需要注意的是,用星号表达式修饰的变量会变成一个列表,列表中有0个或多个元素。还有在解包语法中,星号表达式只能出现一次。
  1. a = 1, 10, 100, 1000
  2. i, j, *k = a
  3. print(i, j, k) # 1 10 [100, 1000]
  4. i, *j, k = a
  5. print(i, j, k) # 1 [10, 100] 1000
  6. *i, j, k = a
  7. print(i, j, k) # [1, 10] 100 1000
  8. *i, j = a
  9. print(i, j) # [1, 10, 100] 1000
  10. i, *j = a
  11. print(i, j) # 1 [10, 100, 1000]
  12. i, j, k, *l = a
  13. print(i, j, k, l) # 1 10 100 [1000]
  14. i, j, k, l, *m = a
  15. print(i, j, k, l, m) # 1 10 100 1000 []

需要说明一点,解包语法对所有的序列都成立,这就意味着对列表以及我们之前讲到的range函数返回的范围序列都可以使用解包语法。大家可以尝试运行下面的代码,看看会出现怎样的结果。

  1. a, b, *c = range(1, 10)
  2. print(a, b, c)
  3. a, b, c = [1, 10, 100]
  4. print(a, b, c)
  5. a, *b, c = 'hello'
  6. print(a, b, c) #h ['e', 'l', 'l'] o

交换两个变量的值

在Python中,交换两个变量ab的值不需要借助中间变量,可以使用如下所示的代码。

  1. a, b = b, a
  2. a, b, c = b, c, a

需要说明的是,上面并没有用到打包和解包语法,Python的字节码指令中有ROT_TWOROT_THREE这样的指令可以实现这个操作,效率是非常高的。但是如果有多于三个变量的值要依次互换,这个时候没有直接可用的字节码指令,执行的原理就是我们上面讲解的打包和解包操作。

元组和列表的比较

  1. 元组是不可变类型,不可变类型更适合多线程环境,因为它降低了并发访问变量的同步化开销。关于这一点,我们会在后面讲解多线程的时候为大家详细论述。
  2. 元组是不可变类型,通常不可变类型在创建时间和占用空间上面都优于对应的可变类型。我们可以使用sys模块的getsizeof函数来检查保存相同元素的元组和列表各自占用了多少内存空间。我们也可以使用timeit模块的timeit函数来看看创建保存相同元素的元组和列表各自花费的时间,代码如下所示。
    ```python import sys import timeit

a = list(range(100000)) b = tuple(range(100000)) print(sys.getsizeof(a), sys.getsizeof(b)) # 900120 800056

print(timeit.timeit(‘[1, 2, 3, 4, 5, 6, 7, 8, 9]’)) # 0.05915190000000001 print(timeit.timeit(‘(1, 2, 3, 4, 5, 6, 7, 8, 9)’)) # 0.006949700000000003

  1. 3. Python中的元组和列表是可以相互转换的,我们可以通过下面的代码来做到。
  2. ```python
  3. # 将元组转换成列表
  4. info = ('骆昊', 175, True, '四川成都')
  5. print(list(info)) # ['骆昊', 175, True, '四川成都']
  6. # 将列表转换成元组
  7. fruits = ['apple', 'banana', 'orange']
  8. print(tuple(fruits)) # ('apple', 'banana', 'orange')

总结:列表和元组都是容器型的数据类型,即一个变量可以保存多个数据。列表是可变数据类型元组是不可变数据类型,所以列表添加元素、删除元素、清空、排序等方法对于元组来说是不成立的。但是列表和元组都可以进行拼接、成员运算、索引和切片这些操作,后面我们要讲到的字符串类型也是这样,因为字符串就是字符按一定顺序构成的序列,在这一点上三者并没有什么区别。我们推荐大家使用列表的生成式语法来创建列表,它很好用,也是Python中非常有特色的语法。

字符串 str

  • 在Python程序中,如果我们把单/多个字符用单/双引号包围起来,就表示它是一个字符串。不论是单个字符还是多个字符,用单引号或者双引号都可以。
  • 字符串中的字符可以是特殊符号、英文字母、中文字符、日文的平假名或片假名、希腊字母、Emoji字符等。
  1. s1 = 'hello, world!'
  2. s2 = "你好,世界!"
  3. # 以三个双/单引号开头的字符串可以折行
  4. s3 = '''
  5. hello,
  6. world!
  7. '''
  8. print(s3, end='')
  9. # 输出带有单引号或反斜杠的字符串
  10. s1 = '\'hello, world!\'' # 'hello, world!'
  11. s2 = '\\hello, world!\\' # \hello, world!\
  12. s1 = '\141\142\143\x61\x62\x63' # abcabc
  • print函数中的end=''表示输出后不换行,即将默认的结束符\n(换行符)更换为''(空字符)。
  • \(反斜杠)来表示转义,例如 \n表示换行;\t表示制表符。所以如果字符串本身又包含了'"\这些特殊的字符,必须要通过\进行转义处理。
  • \ 后面还可以跟一个八进制或者十六进制数来表示字符,例如\141\x61都代表小写字母a,前者是八进制的表示法,后者是十六进制的表示法。另外一种表示字符的方式是在\u后面跟Unicode字符编码。

运算

  • 与列表相似,我们可以使用+运算符来实现字符串的拼接,可以使用*运算符来重复一个字符串的内容,可以使用innot in(成员运算)来判断一个字符串是否包含另外一个字符串,用len(s)获取字符串长度。
  • 比较运算符,用来比较相等性== != 或大小> <,比较的是每个字符对应的编码的大小。例如A的编码是65, 而a的编码是97,所以'A' < 'a'。如果不清楚两个字符对应的编码到底是多少,可以使用ord函数来获得。
  • 身份运算符is,比较两个变量对应的字符串对象的内存地址,简单的说就是两个变量是否对应内存中的同一个字符串。

    1. s1 = 'hello world'
    2. s2 = 'hello world'
    3. s3 = s2
    4. # 比较字符串的内容
    5. print(s1 == s2, s2 == s3) # True True
    6. # 比较字符串的内存地址
    7. print(s1 is s2, s2 is s3) # False True
  • 索引和切片,我们可以用[][:]运算符从字符串取出某个字符或某些字符,使用[i:j:k]k是步长。

  • 大小写转换,s1.capitalize()使字符串首字母大写,s1.title()使字符串中每个单词的首字母大写,s1.upper()使字符串每个字母全部大写,s1.lower()使字符串每个字母全部小写。

增删改查

  • 字符串是不可变类型,所以不能通过索引运算修改字符串中的字符
  • 如果想在一个字符串中从前向后查找有没有另外一个字符串,可以使用字符串的findindex方法,作用都是返回所查找字符串的首字符的索引。找不到时,find返回-1index引发异常ValueError: substring not found。注:列表只有index方法,没有find
  • 在使用findindex方法时还可以通过方法的参数来指定查找的起始位置。也有逆向查找(从后向前查找)的版本,分别是rfindrindex
  1. s = 'hello, world!'
  2. # 循环遍历每个字符有2种方法
  3. for index in range(len(s)):
  4. print(s[index])
  5. for ch in s:
  6. print(ch)
  7. # 查找
  8. print(s.find('or')) # 8
  9. print(s.index('o')) # 4
  10. print(s.find('o', 5)) # 8,指定查找的起始位置
  11. print(s.rfind('o')) # 8
  • startswithendswith来判断字符串是否以某个字符串开头和结尾。is开头的方法判断字符串的特征,这些方法都返回布尔值。
  • 字符串类型可以通过centerljustrjust方法做居中、左对齐和右对齐的处理。如果要在字符串的左侧补零,也可以使用zfill方法。
  1. s1 = 'hello, world!'
  2. # startwith方法检查字符串是否以指定的字符串开头
  3. print(s1.startswith('He')) # False
  4. print(s1.startswith('hel')) # True
  5. # endswith方法检查字符串是否以指定的字符串结尾
  6. print(s1.endswith('!')) # True
  7. s2 = 'abc123456'
  8. # isdigit,检查字符串是否由数字构成
  9. print(s2.isdigit()) # False
  10. # isalpha,检查字符串是否以字母构成
  11. print(s2.isalpha()) # False
  12. # isalnum,检查字符串是否以数字和字母构成
  13. print(s2.isalnum()) # True

格式化字符串

  • 字符串类型可以通过centerljustrjust方法做居中、左对齐和右对齐的处理。如果要在字符串的左侧补零,也可以使用zfill方法。
  1. s = 'hello, world'
  2. # center方法以宽度20将字符串居中并在两侧填充*
  3. print(s.center(20, '*')) # ****hello, world****
  4. # rjust方法以宽度20将字符串右对齐并在左侧填充空格
  5. print(s.rjust(20)) # hello, world
  6. # ljust方法以宽度20将字符串左对齐并在右侧填充~
  7. print(s.ljust(20, '~')) # hello, world~~~~~~~~
  8. # 在字符串的左侧补零
  9. print('33'.zfill(5)) # 00033
  10. print('-33'.zfill(5)) # -0033
  • print()输出时字符串时,有3种方法格式化字符串:%d / %f{}.format()f'{}'
  1. a = 321
  2. b = 123
  3. print('%d * %d = %f' % (a, b, a * b)) # %f 默认输出6位小数
  4. print('{0} * {1} = {2}'.format(a, b, a * b))
  5. print(f'{a} * {b} = {a * b}')

如果需要进一步控制格式化语法中变量值的形式,可以参照下面的表格来进行字符串格式化操作。

变量值 占位符 格式化结果 说明
3.1415926 {:.2f} '3.14' 保留小数点后两位
3.1415926 {:+.2f} '+3.14' 带符号保留小数点后两位
-1 {:+.2f} '-1.00' 带符号保留小数点后两位
3.1415926 {:.0f} '3' 不带小数
123 {:0>10d} '0000000123' 左边补0
,补够10位
123 {:x<10d} '123xxxxxxx' 右边补x
,补够10位
123 {:>10d} ' 123' 左边补空格,补够10位
123 {:<10d} '123 ' 右边补空格,补够10位
123456789 {:,} '123,456,789' 逗号分隔格式
0.123 {:.2%} '12.30%' 百分比格式
123456789 {:.2e} '1.23e+08' 科学计数法格式
  • 修剪,字符串的strip方法可以修剪掉原字符串左右两端的空格,通常用来将用户输入中因为不小心键入的头尾空格去掉。strip方法还有lstriprstrip两个版本,剪左或者剪右。
  • 替换,replace方法的第一个参数是被替换的内容,第二个参数是替换后的内容,还可以通过第三个参数指定替换的次数。
  • 拆分,split方法将一个字符串拆分为多个字符串并放在一个列表中。默认使用空格进行拆分,也可以指定其他的字符来拆分字符串,而且还可以指定最大拆分次数来控制拆分的效果。
  • 合并,join方法将列表中的多个字符串连接成一个字符串。
  1. # 修剪
  2. s = ' jackfrued@126.com \t\r\n'
  3. print(s.strip()) # jackfrued@126.com
  4. # 替换
  5. s = 'hello, world'
  6. print(s.replace('o', '@')) # hell@, w@rld
  7. print(s.replace('o', '@', 1)) # hell@, world
  8. # 拆分
  9. s = 'I love you'
  10. words = s.split() # ['I', 'love', 'you']
  11. s = 'I#love#you#so#much'
  12. words = s.split('#') # ['I', 'love', 'you', 'so', 'much']
  13. words = s.split('#', 3) # ['I', 'love', 'you', 'so#much']
  14. # 合并
  15. print('-'.join(words)) # I-love-you-so#much
  • 编码和解码,Python中除了字符串str类型外,还有一种表示二进制数据的字节串类型(bytes)。所谓字节串,就是由零个或多个字节组成的有限序列。通过字符串的encode方法,我们可以按照某种编码方式将字符串编码为字节串,我们也可以使用字节串的decode方法,将字节串解码为字符串。
  1. a = '你好'
  2. b = a.encode('utf-8')
  3. c = a.encode('gbk')
  4. print(b, c) # b'\xe4\xbd\xa0\xe5\xa5\xbd' b'\xc4\xe3\xba\xc3'
  5. print(b.decode('utf-8')) # 要用和编码相同的方法解码,否则结果与输入不同。
  6. print(c.decode('gbk'))

字典 dict

字典  dict .png
字典以键值对(键和值的组合)的方式把数据组织到一起,我们可以通过键找到与之对应的值并进行操作。就像《新华字典》中,每个字(键)都有与它对应的解释(值)一样。
键必须是不可变类型,例如整数(int)、浮点数(float)、字符串(str)、元组(tuple)等类型的值;显然,列表(list)和集合(set)不能作为字典中的键。

创建字典:一个条目以{}表示,冒号分隔键和值。

  1. person = {
  2. 'name': '王大锤', 'age': 55, 'weight': 60, 'office': '科华北路62号',
  3. 'home': '中同仁路8号', 'tel': '13122334455', 'econtact': '13800998877'
  4. }

也使用内置函数dict或字典的生成式语法来创建字典:

  1. # dict函数(构造器)中的每一组参数就是字典中的一组键值对
  2. person = dict(name='王大锤', age=55, weight=60, home='中同仁路8号')
  3. print(person) # {'name': '王大锤', 'age': 55, 'weight': 60, 'home': '中同仁路8号'}
  4. # 可以通过Python内置函数zip压缩两个序列并创建字典
  5. items1 = dict(zip('ABCDE', '12345'))
  6. print(items1) # {'A': '1', 'B': '2', 'C': '3', 'D': '4', 'E': '5'}
  7. items2 = dict(zip('ABCDE', range(1, 10)))
  8. print(items2) # {'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5}
  9. # 用字典生成式语法创建字典
  10. items3 = {x: x ** 3 for x in range(1, 6)}
  11. print(items3) # {1: 1, 2: 8, 3: 27, 4: 64, 5: 125}
  • len()获取字典中有多少组键值对。
  • for 循环只遍历键,通过键可以获取该键对应的值。

字典的运算

  1. person = {'name': '王大锤', 'age': 55, 'weight': 60, 'office': '科华北路62号'}
  2. # 检查name和tel两个键在不在person字典中
  3. print('name' in person, 'tel' in person) # True False
  4. # 修改值
  5. if 'age' in person:
  6. person['age'] = 25
  7. # 存入新的键值对
  8. person['tel'] = '13122334455'
  9. # 检查person字典中键值对的数量
  10. print(len(person)) # 5
  11. # 对字典的键进行循环并通索引运算获取键对应的值
  12. for key in person:
  13. print(f'{key}: {person[key]}')

字典的方法

  • 字典的索引是键值对中的键,如指定的键没有在字典中,将会引发KeyError异常。
  • 使用 get 方法通过键获取对应的值,如果取不到不会引发 KeyError异常而是返回None或设定的默认值。
  • 字典的键只能是不可变类型,但值可以是任意类型,因此可以做到嵌套字典。
  • 跟列表一样,从字典中删除元素也可以使用del关键字,在删除元素的时候如果指定的键索引不到对应的值,一样会引发KeyError异常。
  1. # 字典中的值又是一个字典(嵌套的字典)
  2. students = {
  3. 1001: {'name': '狄仁杰', 'sex': True, 'age': 22, 'place': '山西大同'},
  4. 1002: {'name': '白元芳', 'sex': True, 'age': 23, 'place': '河北保定'},
  5. 1003: {'name': '武则天', 'sex': False, 'age': 20, 'place': '四川广元'}
  6. }
  7. # 使用get方法通过键获取对应的值,如果取不到不会引发KeyError异常而是返回None或设定的默认值
  8. print(students.get(1002)) # {'name': '白元芳', 'sex': True, 'age': 23, 'place': '河北保定'}
  9. print(students.get(1005)) # None
  10. print(students.get(1005, {'name': '无名氏'})) # {'name': '无名氏'}
  11. # 获取字典中所有的键
  12. print(students.keys()) # dict_keys([1001, 1002, 1003])
  13. # 获取字典中所有的值
  14. print(students.values()) # dict_values([{...}, {...}, {...}])
  15. # 获取字典中所有的键值对
  16. print(students.items()) # dict_items([(1001, {...}), (1002, {....}), (1003, {...})])
  17. # 对字典中所有的键值对进行循环遍历
  18. for key, value in students.items():
  19. print(key, '--->', value)
  20. # 使用pop方法通过键删除对应的键值对并返回该值
  21. stu1 = students.pop(1002)
  22. print(stu1) # {'name': '白元芳', 'sex': True, 'age': 23, 'place': '河北保定'}
  23. print(len(students)) # 2
  24. # stu2 = students.pop(1005) # KeyError: 1005
  25. stu2 = students.pop(1005, {})
  26. print(stu2) # {}
  27. # 使用popitem方法删除字典中最后一组键值对并返回对应的二元组
  28. # 如果字典中没有元素,调用该方法将引发KeyError异常
  29. key, value = students.popitem()
  30. print(key, value) # 1003 {'name': '武则天', 'sex': False, 'age': 20, 'place': '四川广元'}
  31. # setdefault可以向字典中存入新的键值对或返回指定的键对应的值
  32. result = students.setdefault(1005, {'name': '方启鹤', 'sex': True})
  33. print(result) # {'name': '方启鹤', 'sex': True}
  34. print(students) # {1001: {...}, 1005: {...}}
  35. # 使用update更新字典元素,相同的键会用新值覆盖掉旧值,不同的键会添加到字典中
  36. others = {
  37. 1005: {'name': '乔峰', 'sex': True, 'age': 32, 'place': '北京大兴'},
  38. 1010: {'name': '王语嫣', 'sex': False, 'age': 19},
  39. 1008: {'name': '钟灵', 'sex': False}
  40. }
  41. students.update(others) # {1001: {...}, 1005: {...}, 1010: {...}, 1008: {...}}
  42. # 使用del删除元素
  43. person = {'name': '王大锤', 'age': 25, 'sex': True}
  44. del person['age'] # {'name': '王大锤', 'sex': True}

字典的应用

我们通过几个简单的例子来讲解字典的应用。

例子1:输入一段话,统计每个英文字母出现的次数。

  1. sentence = input('请输入一段话: ')
  2. counter = {}
  3. for ch in sentence:
  4. if 'A' <= ch <= 'Z' or 'a' <= ch <= 'z':
  5. counter[ch] = counter.get(ch, 0) + 1
  6. for key, value in counter.items():
  7. print(f'字母{key}出现了{value}次.')

例子2:在一个字典中保存了股票的代码和价格,找出股价大于100元的股票并创建一个新的字典。

  1. stocks = {
  2. 'AAPL': 191.88,
  3. 'GOOG': 1186.96,
  4. 'IBM': 149.24,
  5. 'ORCL': 48.44,
  6. 'ACN': 166.89,
  7. 'FB': 208.09,
  8. 'SYMC': 21.29
  9. }
  10. stocks2 = {key: value for key, value in stocks.items() if value > 100}
  11. print(stocks2)

集合 set

集合的特性:无序性、互异性、确定性。
无序,所以集合不支持索引;互异,即集合里没有重复的元素。确定,是指一个元素是否属于一个集合是确定的。

集合的成员运算在性能上要优于列表的成员运算,这是集合的底层存储特性(哈希存储)决定的。

创建集合

  • 在Python中,创建集合可以使用{}字面量语法,{}中需要至少有一个元素,因为没有元素的{}并不是空集合而是一个空字典。
  • 也可以使用内置函数set来创建一个集合,准确的说set并不是一个函数,而是创建集合对象的构造器。创建空集合可以使用set()
  • 也可以将其他序列(str、list类型)转换成集合,例如:set('hello')会得到一个包含了4个字符的集合(重复的l会被去掉)。
  • 还可以使用生成式语法来创建集合,就像我们之前用生成式创建列表那样。
  1. # 创建集合的字面量语法(重复元素不会出现在集合中)
  2. set1 = {1, 2, 3, 3, 3, 2}
  3. print(set1) # {1, 2, 3}
  4. print(len(set1)) # 3
  5. # 创建集合的构造器语法(后面会讲到什么是构造器)
  6. set2 = set('hello') # {'h', 'l', 'o', 'e'}
  7. # 将列表转换成集合(可以去掉列表中的重复元素)
  8. set3 = set([1, 2, 3, 3, 2, 1])
  9. print(set3) # {1, 2, 3}
  10. # 创建集合的生成式语法(将列表生成式的[]换成{})
  11. set4 = {num for num in range(1, 20) if num % 3 == 0 or num % 5 == 0}
  12. print(set4) # {3, 5, 6, 9, 10, 12, 15, 18}
  • len()计算集合中元素的个数;for循环实现对集合元素的遍历。
  • 集合中的元素必须是hashable类型。
    • 所谓hashable类型指的是能够计算出哈希码的数据类型,大家可以暂时将哈希码理解为和变量对应的唯一的ID值。
    • 通常不可变类型都是hashable类型,如整数、浮点、字符串、元组等,而可变类型都不是hashable类型,因为可变类型无法确定唯一的ID值,所以也就不能放到集合中。
    • 集合本身是可变类型,所以集合不能够作为集合中的元素,这一点在使用集合的时候一定要注意。

集合的运算

Python为集合类型提供了非常丰富的运算符,主要包括:成员运算、交集运算、并集运算、差集运算、比较运算(相等性、子集、超集)等。

  • 成员运算:innot in,检查元素是否存在于集合中。
  • 交并差运算:运算符& | - ^,或者方法调用。
  1. # 成员运算
  2. set1 = {'Python', 'Java', 'Go', 'Swift'}
  3. print('Ruby' in set1) # False
  4. set1 = {1, 2, 3, 4, 5, 6, 7}
  5. set2 = {2, 4, 6, 8, 10}
  6. # 交集
  7. print(set1 & set2) # {2, 4, 6}
  8. print(set1.intersection(set2)) # {2, 4, 6}
  9. # 并集
  10. print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7, 8, 10}
  11. print(set1.union(set2)) # {1, 2, 3, 4, 5, 6, 7, 8, 10}
  12. # 差集
  13. print(set1 - set2) # {1, 3, 5, 7}
  14. print(set1.difference(set2)) # {1, 3, 5, 7}
  15. # 对称差
  16. print(set1 ^ set2) # {1, 3, 5, 7, 8, 10}
  17. print(set1.symmetric_difference(set2)) # {1, 3, 5, 7, 8, 10}
  18. # 方法三: 对称差相当于两个集合的并集减去交集
  19. print((set1 | set2) - (set1 & set2)) # {1, 3, 5, 7, 8, 10}

python 基础 - 图5

集合的交集、并集、差集运算还可以跟赋值运算一起构成复合赋值运算,如下所示。

  1. set1 = {1, 3, 5, 7}
  2. set2 = {2, 4, 6}
  3. # 将set1和set2求并集再赋值给set1
  4. # 也可以通过set1.update(set2)来实现
  5. set1 |= set2
  6. print(set1) # {1, 2, 3, 4, 5, 6, 7}
  7. set3 = {3, 6, 9}
  8. # 将set1和set3求交集再赋值给set1
  9. # 也可以通过set1.intersection_update(set3)来实现
  10. set1 &= set3
  11. print(set1) # {3, 6}
  • 比较运算:== !=,判断子集和超集(A是B的子集反过来称B是A的超集)用><。如果A是B的子集且A不等于B,那么A是B的真子集。
  1. set1 = {1, 3, 5}
  2. set2 = {1, 2, 3, 4, 5}
  3. set3 = set2
  4. # <运算符表示真子集,<=运算符表示子集
  5. print(set1 < set2, set1 <= set2) # True True
  6. print(set2 < set3, set2 <= set3) # False True
  7. # 通过issubset方法也能进行子集判断
  8. print(set1.issubset(set2)) # True
  9. # 反过来可以用issuperset或>运算符进行超集判断
  10. print(set2.issuperset(set1)) # True
  11. print(set2 > set1) # True

如果要判断两个集合有没有相同的元素可以使用isdisjoint方法,没有相同元素返回True,否则返回False,代码如下所示。

  1. set1 = {'Java', 'Python', 'Go', 'Kotlin'}
  2. set2 = {'Kotlin', 'Swift', 'Java', 'Objective-C', 'Dart'}
  3. set3 = {'HTML', 'CSS', 'JavaScript'}
  4. print(set1.isdisjoint(set2)) # False
  5. print(set1.isdisjoint(set3)) # True

集合的方法(增删)

  • add(x)、update({x1, x2 …}) 添加
  • discard(x) 删除,元素不存在不会报错
  • remove(x) 删除,元素不存在引发 keyError 异常
  • pop() 随机删除并返回该元素
  • clear() 全部删除
  1. # 创建一个空集合
  2. set1 = set()
  3. # 通过add方法添加元素
  4. set1.add(33)
  5. set1.add(55)
  6. set1.update({1, 10, 100, 1000})
  7. print(set1) # {33, 1, 100, 55, 1000, 10}
  8. # 通过discard方法删除指定元素
  9. set1.discard(100)
  10. set1.discard(99)
  11. print(set1) # {1, 10, 33, 55, 1000}
  12. # 通过remove方法删除指定元素,建议先做成员运算再删除
  13. # 否则元素如果不在集合中就会引发KeyError异常
  14. if 10 in set1:
  15. set1.remove(10)
  16. print(set1) # {33, 1, 55, 1000}
  17. # pop方法可以从集合中随机删除一个元素并返回该元素
  18. print(set1.pop())
  19. # clear方法可以清空整个集合
  20. set1.clear()
  21. print(set1) # set()

集合是可变类型,python中有一种不可变类型的集合frozensetsetfrozenset的区别就如同listtuple的区别,frozenset由于是不可变类型,能够计算出哈希码,因此它可以作为set中的元素。除了不能添加和删除元素,frozenset在其他方面跟set基本是一样的,下面的代码简单的展示了frozenset的用法。

  1. set1 = frozenset({1, 3, 5, 7})
  2. set2 = frozenset(range(1, 6))
  3. print(set1 & set2) # frozenset({1, 3, 5})
  4. print(set1 | set2) # frozenset({1, 2, 3, 4, 5, 7})
  5. print(set1 - set2) # frozenset({7})
  6. print(set1 < set2) # False

函数

解决代码重复问题,将需要重复的代码封装到一个代码块中,它称为函数。
重构,是在不影响代码执行结果的前提下对代码的结构进行调整。例如将某块代码封装起来。

变量

变量的引用

  1. 在定义变量的时候,Python解释器会在内存中开辟两块空间,变量和数据都有自己的空间。
  2. 简单理解,将数据保存到变量的内存中,本质是将数据的地址保存到变量对应的内存中。
  3. 变量中存储数据地址的行为就是引用(变量引用了数据的地址),存储的地址称为引用地址。
  4. 可以使用id()来获取变量中的引用地址(即数据的地址)。
  5. 只有赋值运算符=可以改变变量(等号左边数据)的引用。

局部变量
在函数内部定义的变量,称为是局部变量。特点:

  1. 局部变量只能在当前函数内部使用,不能在其他函数和函数外部使用。
  2. 在不同函数中,可以定义名字相同的局部变量,两者之间没有影响。
  3. 生存周期(生命周期,作用范围)—>在哪能用在函数被调用的时候,局部变量被创建,函数调用结束,局部变量的值被销毁(删除),不能使用。

所以函数中的局部变量的值,如果想要在函数外部使用,需要使用return关键字,将这个值进行返回。

全局变量
在函数外部定义的变量,称为是全局变量。特点:

  1. 可以在任何函数中读取(获取)全局变量的值。
  2. 如何在函数中存在和全局变量名字相同的局部变量,在函数中使用的是局部变量的值(就近)。
  3. 在函数内部想要修改全局变量的引用,需要在函数内添加global关键字,声明该变量是全局变量。
  4. 生命周期:代码执行的时候被创建,代码执行结束,被销毁(删除)。

函数传参

完整的参数顺序:

  1. def 函数名(普通函数, *args, 缺省参数, **kwargs):
  2. pass

函数传参的方式

  • 位置传参:在函数调用的时候,按照形参的顺序,将实参值传递给形参。
  • 关键字传参:在函数调用的时候,指定数据值给到那个形参。
  • 混合使用:关键字传参必须写在位置传参的后面,且不要给一个形参传递多个数据值。 ```python def func(a, b, c): print(f’a: {a}, b: {b}, c: {c}’)

func(1, 2, 3) # 位置传参 func(a=2, b=3, c=1) # 关键字传参 func(1, 3, c=5) # 混合使⽤

  1. **缺省参数/默认参数**<br />定义方式:在函数定义的时候,给形参一个默认的数据值,这个形参就变为缺省参数。<br />注意,缺省参数的书写要放在普通参数的后边。<br />特点(好处):缺省参数,在函数调用的时候,可以传递实参值,也可以不传递实参值。如果不传参,使用的就是默认值。
  2. <a name="Ff8xR"></a>
  3. #### 可变参数
  4. - 带默认值的参数必须放在不带默认值的参数之后,否则将产生`SyntaxError`错误,错误消息是:`non-default argument follows default argument`
  5. - 函数可以通过星号表达式语法来支持**可变参数**。所谓可变参数指的是在调用函数时,可以向函数传入`0`个或任意多个参数。
  6. **不定长位置参数(不定长元组参数)**
  7. - 书写,在普通参数的前边,加上一个*,这个参数就变为不定长位置参数。
  8. - 特点,这个形参可以接收任意多个位置传参的数据。
  9. - 数据类型,形参的类型是元组。
  10. - 注意,不定长位置参数要写在普通的参数的后面。
  11. - 一般写法,不定长位置参数的名字为args,即`*args` # arguments
  12. ```python
  13. # 用星号表达式来表示args可以接收0个或任意多个参数
  14. def add(*args):
  15. total = 0
  16. # 可变参数可以放在for循环中取出每个参数的值
  17. for val in args:
  18. if type(val) in (int, float):
  19. total += val
  20. return total
  • 如果我们从两个不同的模块中导入了同名的函数,后导入的函数会覆盖掉先前的导入。

不定长关键字参数(不定长字典参数)

  • 书写,在普通参数的前边,加上两个*,这个参数就变为不定长关键字参数。
  • 特点,这个形参可以接收任意多个关键字传参的数据。
  • 数据类型,形参的类型是字典。
  • 注意,不定长关键字参数,要写在所有参数的最后边。
  • 一般写法,不定长关键字参数的名字为kwargs,即**kwargs, keyword arguments。

关键字参数

  • 在调用函数传入参数时,我们可以指定参数名,也可以不指定参数名,不指定时传入的参数依次对号入座。
  • 如果希望调用函数时必须指定参数名,可以使用命名关键字参数(keyword-only argument),它是在函数的参数列表中写在*之后的参数,代码如下所示。
    ```python def is_triangle(*, a, b, c): print(f’a = {a}, b = {b}, c = {c}’) return a + b > c and b + c > a and a + c > b

传参时必须使用“参数名=参数值”的方式,位置不重要

print(is_triangle(a=3, b=4, c=5)) print(is_triangle(c=5, b=4, a=3))

  1. > **注意**:上面的`is_triangle`函数,参数列表中的`*`是一个分隔符,`*`前面的参数都是位置参数,而`*`后面的参数就是命名关键字参数。
  2. - 我们之前讲过在函数的参数列表中可以使用**可变参数**`*args`来接收任意数量的参数,但`*args`不能接收带参数名的参数。
  3. ```python
  4. def calc(*args):
  5. result = 0
  6. for arg in args:
  7. if type(arg) in (int, float):
  8. result += arg
  9. return result
  10. print(calc(a=1, b=2, c=3))
  11. # 引发`TypeError`错误,错误消息为`calc() got an unexpected keyword argument 'a'`
  • 我们在设计函数时,如果既不知道调用者会传入的参数个数,也不知道调用者会不会指定参数名,那么同时使用可变参数和关键字参数。关键字参数会将传入的带参数名的参数组装成一个字典,参数名就是字典中键值对的键,而参数值就是字典中键值对的值,代码如下所示。
  1. def calc(*args, **kwargs):
  2. result = -1
  3. for arg in args:
  4. if type(arg) in (int, float):
  5. result += arg
  6. for value in kwargs.values():
  7. if type(value) in (int, float):
  8. result *= value
  9. return result
  10. print(calc()) # -1
  11. print(calc(2, 3)) # 4
  12. print(calc(a=4, b=2, c=3)) # -24
  13. print(calc(2, c=3, d=4)) # 12

不带参数名的参数(位置参数)必须出现在带参数名的参数(关键字参数)之前,否则将会引发异常。例如,执行calc(1, 2, c=3, d=4, 5)将会引发SyntaxError错误,错误消息为positional argument follows keyword argument,翻译成中文意思是“位置参数出现在关键字参数之后”。

内置函数

Python标准库中还有一类函数是不需要import就能够直接使用的,我们将其称之为内置函数。下面的表格列出了一部分内置函数。

内置函数 说明
abs 返回一个数的绝对值,例如:abs(-1.3)返回1.3
bin 把一个整数转换成以'0b'开头的二进制字符串,例如:bin(123)返回'0b1111011'
chr 将Unicode编码转换成对应的字符,例如:chr(8364)返回'€'
hex 将一个整数转换成以'0x'开头的十六进制字符串,例如:hex(123)返回'0x7b'
input 从输入中读取一行,返回读到的字符串。
len 获取字符串、列表等的长度。
max 返回多个参数或一个可迭代对象中的最大值,例如:max(12, 95, 37)返回95
min 返回多个参数或一个可迭代对象中的最小值,例如:min(12, 95, 37)返回12
oct 把一个整数转换成以'0o'开头的八进制字符串,例如:oct(123)返回'0o173'
open 打开一个文件并返回文件对象。
ord 将字符转换成对应的Unicode编码,例如:ord('€')返回8364
pow 求幂运算,例如:pow(2, 3)会返回8pow(2, 0.5)会返回1.4142135623730951
print 打印输出。
range 构造一个范围序列,例如:range(100)会产生099的整数序列。
round 按照指定的精度对数值进行四舍五入,例如:round(1.23456, 4)会返回1.2346
sum 对一个序列中的项从左到右进行求和运算,例如:sum(range(1, 101))返回5050
type 返回对象的类型,例如:type(10)返回int;而type('hello')
返回str

print函数,默认end='\n',默认以在多个参数之间打印空格sep=' '
可以在print时修改结束符和间隔符。

  1. print(1,end=' ')
  2. print(1,2,3,4,5,6,sep='_')
  3. print(1, 2, 3, 4, 5, 6, sep='_*_')

高阶函数的用法

在面向对象的世界中,一切皆为对象,类和函数也是对象。函数的参数和返回值可以是任意类型的对象,这就意味着函数本身也可以作为函数的参数或返回值,这就是所谓的高阶函数

如果我们希望上面的calc函数不仅仅可以做多个参数求和,还可以做多个参数求乘积甚至更多的二元运算,我们就可以使用高阶函数的方式来改写上面的代码:

  1. def calc(*args, init_value, op, **kwargs):
  2. result = init_value
  3. for arg in args:
  4. if type(arg) in (int, float):
  5. result = op(result, arg)
  6. for value in kwargs.values():
  7. if type(value) in (int, float):
  8. result = op(result, value)
  9. return result

init_value代表运算的初始值,op代表二元运算函数。经过改造的calc函数不仅仅可以实现多个参数的累加求和,也可以实现多个参数的累乘运算,这是一种解耦合的编程技巧:

  1. def add(x, y):
  2. return x + y
  3. def mul(x, y):
  4. return x * y
  5. print(calc(1, 2, 3, init_value=0, op=add, x=4, y=5)) # 15
  6. print(calc(1, 2, x=3, y=4, z=5, init_value=1, op=mul)) # 120

将函数作为参数和调用函数是有显著的区别的,调用函数需要在函数名后面跟上圆括号,而把函数作为参数时只需要函数名即可。上面的代码也可以不用定义addmul函数,因为Python标准库中的operator模块提供了代表加法运算的add和代表乘法运算的mul函数,我们直接使用即可,代码如下所示。

  1. import operator
  2. print(calc(1, 2, 3, init_value=0, op=operator.add, x=4, y=5)) # 15
  3. print(calc(1, 2, x=3, y=4, z=5, init_value=1, op=operator.mul)) # 120

Python内置函数中有不少高阶函数,比如filtermap函数,前者实现对序列中元素的过滤,后者实现对序列中元素的映射。例如,去掉一个整数列表中的奇数,并对所有的偶数求平方得到一个新的列表:

  1. def is_even(num):
  2. return num % 2 == 0
  3. def square(num):
  4. return num ** 2
  5. numbers1 = [35, 12, 8, 99, 60, 52]
  6. numbers2 = list(map(square, filter(is_even, numbers1)))
  7. print(numbers2) # [144, 64, 3600, 2704]
  • filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。它接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判断,然后返回 True 或 False,最后将返回 True 的元素放到新列表中。
    • 注意: Python2.7 返回列表,Python3.x 返回迭代器对象。
    • python3 中 filter 类实现了 __iter____next__方法, 可以看成是一个迭代器, 有惰性运算的特性, 相对 python2 提升了性能, 可以节约内存。
  • map() 会根据提供的函数对指定序列做映射。第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表。

当然,要完成上面代码的功能,也可以使用列表生成式,列表生成式的做法更为简单优雅。

  1. numbers1 = [35, 12, 8, 99, 60, 52]
  2. numbers2 = [num ** 2 for num in numbers1 if num % 2 == 0]
  3. print(numbers2) # [144, 64, 3600, 2704]

Lambda函数

在使用高阶函数的时候,如果作为参数或者返回值的函数本身非常简单,一行代码就能够完成,那么我们可以使用Lambda函数来表示。Python中的Lambda函数是没有的名字函数,所以也称为匿名函数,匿名函数只能有一行代码,代码中的表达式产生的运算结果就是这个匿名函数的返回值。上面代码中的is_evensquare函数都只有一行代码,我们可以用Lambda函数来替换掉它们,代码如下所示。

  1. numbers1 = [35, 12, 8, 99, 60, 52]
  2. numbers2 = list(map(lambda x: x ** 2, filter(lambda x: x % 2 == 0, numbers1)))
  3. print(numbers2) # [144, 64, 3600, 2704]

通过上面的代码可以看出,定义Lambda函数的关键字是lambda,后面跟函数的参数,如果有多个参数用逗号进行分隔;冒号后面的部分就是函数的执行体,通常是一个表达式,表达式的运算结果就是Lambda函数的返回值,不需要写return 关键字。

如果需要使用加减乘除这种简单的二元函数,也可以用Lambda函数来书写,例如调用上面的calc函数时,可以通过传入Lambda函数来作为op参数的参数值。当然,op参数也可以有默认值,例如我们可以用一个代表加法运算的Lambda函数来作为op参数的默认值。

  1. def calc(*args, init_value=0, op=lambda x, y: x + y, **kwargs):
  2. result = init_value
  3. for arg in args:
  4. if type(arg) in (int, float):
  5. result = op(result, arg)
  6. for value in kwargs.values():
  7. if type(value) in (int, float):
  8. result = op(result, value)
  9. return result
  10. # 调用calc函数,使用init_value和op的默认值
  11. print(calc(1, 2, 3, x=4, y=5)) # 15
  12. # 调用calc函数,通过lambda函数给op参数赋值
  13. print(calc(1, 2, 3, x=4, y=5, init_value=1, op=lambda x, y: x * y)) # 120

注意上面的代码中的calc函数,它同时使用了可变参数、关键字参数、命名关键字参数,其中命名关键字参数要放在可变参数和关键字参数之间,传参时先传入可变参数,关键字参数和命名关键字参数的先后顺序并不重要。

有很多函数在Python中用一行代码就能实现,我们可以用Lambda函数来定义这些函数,调用Lambda函数就跟调用普通函数一样,代码如下所示。

  1. import operator, functools
  2. # 一行代码定义求阶乘的函数
  3. fac = lambda num: functools.reduce(operator.mul, range(1, num + 1), 1)
  4. # 一行代码定义判断素数的函数
  5. is_prime = lambda x: x > 1 and all(map(lambda f: x % f, range(2, int(x ** 0.5) + 1)))
  6. # 调用Lambda函数
  7. print(fac(10)) # 3628800
  8. print(is_prime(9)) # False
  • reduce(function, iterable[, initializer]) 函数会对参数序列中元素进行累积。它将一个数据集合(链表,元组等)中的所有数据进行下列操作:先对集合中的第 1、2 个元素进行 function(有两个参数)操作,得到的结果再与第三个数据用 function 函数运算…直到最后。
  • all( ) 函数用于判断给定的可迭代参数 iterable 中的所有元素是否都为 True,如果是返回 True,否则返回 False。元素除了是 0、空、None、False 外都算 True。

提示1:上面使用的reduce函数是Python标准库functools模块中的函数,它可以实现对数据的归约操作,通常情况下,过滤(filter)、映射(map)和归约(reduce)是处理数据中非常关键的三个步骤,而Python的标准库也提供了对这三个操作的支持。

装饰器 Decorators

装饰器是Python中用一个函数装饰另外一个函数或类并为其提供额外功能的语法现象。装饰器本身是一个函数,它的参数是被装饰的函数或类,它的返回值是一个带有装饰功能的函数。很显然,装饰器是一个高阶函数,它的参数和返回值都是函数。

下面我们先通过一个简单的例子来说明装饰器的写法和作用:

  1. import random
  2. import time
  3. def download(filename):
  4. print(f'开始下载{filename}.')
  5. time.sleep(random.randint(2, 6)) # 随机休眠几秒
  6. print(f'{filename}下载完成.')
  7. def upload(filename):
  8. print(f'开始上传{filename}.')
  9. time.sleep(random.randint(4, 8)) # 随机休眠几秒
  10. print(f'{filename}上传完成.')
  11. start = time.time()
  12. download('MySQL从删库到跑路.avi')
  13. end = time.time()
  14. print(f'花费时间: {end - start:.3f}秒')
  15. start = time.time()
  16. upload('Python从入门到住院.pdf')
  17. end = time.time()
  18. print(f'花费时间: {end - start:.3f}秒')

通过上面的代码,我们可以得到下载和上传花费的时间。需要注意到,上面记录时间、计算和显示执行时间的代码都是重复代码。有编程经验的人都知道,重复的代码是万恶之源,那么有没有办法在不写重复代码的前提下,用一种简单优雅的方式记录下函数的执行时间呢?在Python中,装饰器就是解决这类问题的最佳选择。

我们可以把记录函数执行时间的功能封装到一个装饰器中,在有需要的地方直接使用这个装饰器就可以了,代码如下所示。

  1. import time
  2. # 定义装饰器函数,它的参数是被装饰的函数或类
  3. def record_time(func):
  4. # 定义一个带装饰功能(记录被装饰函数的执行时间)的函数
  5. # 因为不知道被装饰的函数有怎样的参数所以使用*args和**kwargs接收所有参数
  6. # 在Python中函数可以嵌套的定义(函数中可以再定义函数)
  7. def wrapper(*args, **kwargs):
  8. start = time.time()
  9. result = func(*args, **kwargs)
  10. end = time.time()
  11. print(f'{func.__name__}执行时间: {end - start:.3f}秒')
  12. # 返回被装饰函数的返回值(装饰器通常不会改变被装饰函数的执行结果)
  13. return result
  14. # 返回带装饰功能的wrapper函数
  15. return wrapper
  16. download = record_time(download)
  17. upload = record_time(upload)
  18. download('MySQL从删库到跑路.avi')
  19. upload('Python从入门到住院.pdf')

使用上面的装饰器函数有两种方式,第一种方式就是直接调用装饰器函数,传入被装饰的函数并获得返回值,我们可以用这个返回值直接覆盖原来的函数,那么在调用时就已经获得了装饰器提供的额外的功能(记录执行时间)。wrapper()函数的参数定义是(*args, **kwargs),因此,wrapper()函数可以接受任意参数的调用。

在Python中,使用装饰器很有更为便捷的语法糖,可以用@装饰器函数将装饰器函数直接放在被装饰的函数上,效果跟上面的代码相同,这就是第二种方式。下面是完整的代码。

  1. import random
  2. import time
  3. def record_time(func):
  4. def wrapper(*args, **kwargs):
  5. start = time.time()
  6. result = func(*args, **kwargs)
  7. end = time.time()
  8. print(f'{func.__name__}执行时间: {end - start:.3f}秒')
  9. return result
  10. return wrapper
  11. @record_time
  12. def download(filename):
  13. print(f'开始下载{filename}.')
  14. time.sleep(random.randint(2, 6))
  15. print(f'{filename}下载完成.')
  16. @record_time
  17. def upload(filename):
  18. print(f'开始上传{filename}.')
  19. time.sleep(random.randint(4, 8))
  20. print(f'{filename}上传完成.')
  21. download('MySQL从删库到跑路.avi')
  22. upload('Python从入门到住院.pdf')

上面被装饰后的downloadupload函数是我们在装饰器record_time中返回的wrapper函数,调用它们其实就是在调用wrapper函数,所以拥有了记录函数执行时间的功能。相当于执行了语句 download = record_time(download)

如果希望取消装饰器的作用,那么在定义装饰器函数的时候,需要做一些额外的工作。Python标准库functools模块的wraps函数也是一个装饰器,我们将它放在wrapper函数上,这个装饰器可以帮我们保留被装饰之前的函数,这样在需要取消装饰器时,可以通过被装饰函数的__wrapped__属性获得被装饰之前的函数。

  1. import random
  2. import time
  3. from functools import wraps
  4. def record_time(func):
  5. @wraps(func)
  6. def wrapper(*args, **kwargs):
  7. start = time.time()
  8. result = func(*args, **kwargs)
  9. end = time.time()
  10. print(f'{func.__name__}执行时间: {end - start:.3f}秒')
  11. return result
  12. return wrapper
  13. @record_time
  14. def download(filename):
  15. print(f'开始下载{filename}.')
  16. time.sleep(random.randint(2, 6))
  17. print(f'{filename}下载完成.')
  18. @record_time
  19. def upload(filename):
  20. print(f'开始上传{filename}.')
  21. time.sleep(random.randint(4, 8))
  22. print(f'{filename}上传完成.')
  23. download('MySQL从删库到跑路.avi')
  24. upload('Python从入门到住院.pdf')
  25. # 取消装饰器
  26. download.__wrapped__('MySQL必知必会.pdf')
  27. upload = upload.__wrapped__
  28. upload('Python从新手到大师.pdf')

装饰器函数本身也可以参数化,简单的说就是通过我们的装饰器也是可以通过调用者传入的参数来定制的,这个知识点我们在后面用到它的时候再为大家讲解。

递归调用

函数自己调用自己称为递归调用。

求阶乘:

  1. def fac(num):
  2. if num in (0, 1):
  3. return 1
  4. return num * fac(num - 1)

上面的代码中,fac函数中又调用了fac函数,这就是所谓的递归调用。代码第2行的if条件叫做递归的收敛条件,简单的说就是什么时候要结束函数的递归调用,在计算阶乘时,如果计算到01的阶乘,就停止递归调用,直接返回1;代码第4行的num * fac(num - 1)递归公式,也就是阶乘的递归定义。下面,我们简单的分析下,如果用fac(5)计算5的阶乘,整个过程会是怎样的。

  1. # 递归调用函数入栈
  2. # 5 * fac(4)
  3. # 5 * (4 * fac(3))
  4. # 5 * (4 * (3 * fac(2)))
  5. # 5 * (4 * (3 * (2 * fac(1))))
  6. # 停止递归函数出栈
  7. # 5 * (4 * (3 * (2 * 1)))
  8. # 5 * (4 * (3 * 2))
  9. # 5 * (4 * 6)
  10. # 5 * 24
  11. # 120
  12. print(fac(5)) # 120

注意,函数调用会通过内存中称为“栈”(stack)的数据结构来保存当前代码的执行现场,函数调用结束后会通过这个栈结构恢复之前的执行现场。每进入一个函数调用,栈就会增加一层栈帧(stack frame),栈帧就是我们刚才提到的保存当前代码执行现场的结构;每当函数调用结束后,栈就会减少一层栈帧。

通常,内存中的栈空间很小,因此递归调用的次数如果太多,会导致栈溢出(stack overflow),所以递归调用一定要确保能够快速收敛。我们可以尝试执行fac(5000),看看是不是会提示RecursionError错误,错误消息为:maximum recursion depth exceeded in comparison(超出最大递归深度),其实就是发生了栈溢出。

我们使用的Python官方解释器,默认将函数调用的栈结构最大深度设置为1000层。如果超出这个深度,就会发生上面说的RecursionError。当然,我们可以使用sys模块的setrecursionlimit函数来改变递归调用的最大深度,例如:sys.setrecursionlimit(10000),这样就可以让上面的fac(5000)顺利执行出结果,但是我们不建议这样做,因为让递归快速收敛才是我们应该做的事情,否则就应该考虑使用循环递推而不是递归。

生成斐波那契数列:斐波那契数列前两个数都是1,从第3个数开始,每个数是前两个数相加的和,可以记为f(n) = f(n - 1) + f(n - 2)

  1. def fib(n):
  2. if n in (1, 2):
  3. return 1
  4. return fib(n - 1) + fib(n - 2)
  5. # 打印前20个斐波那契数
  6. for i in range(1, 21):
  7. print(fib(i))

需要提醒大家,上面计算斐波那契数的代码虽然看起来非常简单明了,但执行性能是比较糟糕的,原因大家可以自己思考一下,更好的做法还是之前讲过的使用循环递推的方式,代码如下所示。

  1. def fib(n):
  2. a, b = 0, 1
  3. for _ in range(n):
  4. a, b = b, a + b
  5. return a

面向对象

在面向对象编程的世界里,程序中的数据和操作数据的函数是一个逻辑上的整体,我们称之为对象对象可以接收消息,解决问题的方法就是创建对象并向对象发出各种各样的消息;通过消息传递,程序中的多个对象可以协同工作,这样就能构造出复杂的系统并解决现实中的问题。

面向对象编程:把一组数据和处理数据的方法组成对象,把行为相同的对象归纳为,通过封装隐藏对象的内部细节,通过继承实现类的特化和泛化,通过多态实现基于对象类型的动态分派。

几个关键词:对象(object)、(class)、封装(encapsulation)、继承(inheritance)、多态(polymorphism)。

类和对象

  • 类是一个抽象的概念,对象是一个具体的概念。
  • 我们把同一类对象的共同特征抽取出来就是一个类,比说人类是一个抽象概念,而每个人就是一个对象。
  • 简而言之,类是对象的蓝图和模板,对象是类的实例,是可以接受消息的实体。
  • 在面向对象编程的世界中,一切皆为对象对象都有属性和行为每个对象都是独一无二的,而且对象一定属于某个类
  • 对象的属性是对象的静态特征,对象的行为是对象的动态特征
  • 如果我们把拥有共同特征的对象的属性和行为都抽取出来,就可以定义出一个类。

定义类

  • 在类的代码块中,我们需要写一些函数,我们说过类是一个抽象概念,那么这些函数就是我们对一类对象共同的动态特征的提取。
  • 写在类里面的函数我们通常称之为方法,方法就是对象的行为,也就是对象可以接收的消息。
  • 方法的第一个参数通常都是self,它代表了接收这个消息的对象本身。
  1. class Student:
  2. def study(self, course_name):
  3. print(f'学生正在学习{course_name}.')
  4. def play(self):
  5. print(f'学生正在玩游戏.')

创建和使用对象

在我们定义好一个类之后,可以使用构造器语法来创建对象。在类的名字后跟上圆括号就是所谓的构造器语法,代码如下所示。

  1. stu1 = Student()
  2. stu2 = Student()
  3. print(stu1) # <__main__.Student object at 0x10ad5ac50>
  4. print(stu2) # <__main__.Student object at 0x10ad5acd0>
  5. print(hex(id(stu1)), hex(id(stu2))) # 0x10ad5ac50 0x10ad5acd0

上面的代码创建了两个学生对象,当我们用print函数打印stu1stu2两个变量时,我们会看到输出了对象在内存中的地址(十六进制形式),跟我们用id函数查看对象标识获得的值是相同的。

现在我们可以告诉大家,我们定义的变量其实保存的是一个对象在内存中的逻辑地址(位置),通过这个逻辑地址,我们就可以在内存中找到这个对象。所以stu3 = stu2这样的赋值语句并没有创建新的对象,只是用一个新的变量保存了已有对象的地址。

接下来,我们尝试给对象发消息。Python中,给对象发消息有两种方式,请看下面的代码。

  1. # 通过“类.方法”调用方法,第一个参数是接收消息的对象,第二个参数是学习的课程名称
  2. Student.study(stu1, 'Python程序设计') # 学生正在学习Python程序设计.
  3. # 通过“对象.方法”调用方法,点前面的对象就是接收消息的对象,只需要传入第二个参数
  4. stu1.study('Python程序设计') # 学生正在学习Python程序设计.
  5. Student.play(stu2) # 学生正在玩游戏.
  6. stu2.play() # 学生正在玩游戏.

初始化方法

刚才我们创建的学生对象只有行为没有属性,如果要给学生对象定义属性,可以添加一个名为__init__的方法。在我们调用Student类的构造器创建对象时,首先会在内存中获得保存学生对象所需的内存空间,然后通过自动执行__init__方法,完成对内存的初始化操作,也就是把数据放到内存空间中。

我们对上面的Student类稍作修改,给学生对象添加name(姓名)和age(年龄)两个属性。

  1. class Student:
  2. def __init__(self, name, age):、
  3. self.name = name
  4. self.age = age
  5. def study(self, course_name):
  6. print(f'{self.name}正在学习{course_name}.')
  7. def play(self):
  8. print(f'{self.name}正在玩游戏.')
  9. # 初始化方法除了self之外还有两个参数,所以调用Student类的构造器创建对象时要传入这两个参数
  10. stu1 = Student('骆昊', 40)
  11. stu2 = Student('王大锤', 15)
  12. stu1.study('Python程序设计') # 骆昊正在学习Python程序设计.
  13. stu2.play() # 王大锤正在玩游戏.

打印对象

在Python中,以两个下划线__(读作“dunder”)开头和结尾的方法通常都是有特殊用途和意义的方法,我们一般称之为魔术方法魔法方法。如果我们在打印对象的时候不希望看到对象的地址而是看到我们自定义的信息,可以通过在类中放置__repr__魔术方法来做到,该方法返回的字符串就是用print函数打印对象的时候会显示的内容,代码如下所示。

  1. class Student:
  2. def __init__(self, name, age):
  3. self.name = name
  4. self.age = age
  5. def study(self, course_name):
  6. print(f'{self.name}正在学习{course_name}.')
  7. def play(self):
  8. print(f'{self.name}正在玩游戏.')
  9. def __repr__(self):
  10. return f'{self.name}: {self.age}'
  11. stu1 = Student('骆昊', 40)
  12. print(stu1) # 骆昊: 40
  13. students = [stu1, Student('李元芳', 36), Student('王大锤', 25)]
  14. print(students) # [骆昊: 40, 李元芳: 36, 王大锤: 25]

封装

面向对象编程有三大支柱:封装继承多态。我们先说一下什么是封装。我自己对封装的理解是:隐藏一切可以隐藏的实现细节,只向外界暴露简单的调用接口。我们在类中定义的对象方法其实就是一种封装,这种封装可以让我们在创建对象之后,只需要给对象发送一个消息就可以执行方法中的代码,也就是说我们在只知道方法的名字和参数(方法的外部视图),不知道方法内部实现细节(方法的内部视图)的情况下就完成了对方法的使用。

举一个例子,假如要控制一个机器人帮我倒杯水,如果不使用面向对象编程,不做任何的封装,那么就需要向这个机器人发出一系列的指令,如站起来、向左转、向前走5步、拿起面前的水杯、向后转、向前走10步、弯腰、放下水杯、按下出水按钮、等待10秒、松开出水按钮、拿起水杯、向右转、向前走5步、放下水杯等,才能完成这个简单的操作,想想都觉得麻烦。按照面向对象编程的思想,我们可以将倒水的操作封装到机器人的一个方法中,当需要机器人帮我们倒水的时候,只需要向机器人对象发出倒水的消息就可以了,这样做不是更好吗?

在很多场景下,面向对象编程其实就是一个三步走的问题。第一步定义类,第二步创建对象,第三步给对象发消息。当然,有的时候我们是不需要第一步的,因为我们想用的类可能已经存在了。之前我们说过,Python内置的listsetdict其实都不是函数而是类,如果要创建列表、集合、字典对象,我们就不用自定义类了。在某些特殊的场景中,我们会用到名为“内置对象”的对象,所谓“内置对象”就是类已经存在而且对象已然创建过了,直接向对象发消息就可以了。

经典案例

案例1:定义一个类描述数字时钟。

  1. import time
  2. # 定义数字时钟类
  3. class Clock(object):
  4. def __init__(self, hour=0, minute=0, second=0):
  5. self.hour = hour
  6. self.min = minute
  7. self.sec = second
  8. def run(self):
  9. """走字"""
  10. self.sec += 1
  11. if self.sec == 60:
  12. self.sec = 0
  13. self.min += 1
  14. if self.min == 60:
  15. self.min = 0
  16. self.hour += 1
  17. if self.hour == 24:
  18. self.hour = 0
  19. def show(self):
  20. """显示时间"""
  21. return f'{self.hour:0>2d}:{self.min:0>2d}:{self.sec:0>2d}'
  22. # 创建时钟对象
  23. clock = Clock(23, 59, 58)
  24. while True:
  25. # 给时钟对象发消息读取时间
  26. print(clock.show())
  27. # 休眠1秒钟
  28. time.sleep(1)
  29. # 给时钟对象发消息使其走字
  30. clock.run()

案例2:定义一个类描述平面上的点,要求提供计算到另一个点距离的方法。

  1. class Point(object):
  2. def __init__(self, x=0, y=0):
  3. self.x, self.y = x, y
  4. def distance_to(self, other):
  5. dx = self.x - other.x
  6. dy = self.y - other.y
  7. return (dx * dx + dy * dy) ** 0.5
  8. def __str__(self):
  9. return f'({self.x}, {self.y})'
  10. p1 = Point(3, 5)
  11. p2 = Point(6, 9)
  12. print(p1, p2) # (3, 5) (6, 9)
  13. print(p1.distance_to(p2)) # 5.0

可见性和属性装饰器

  • 在很多面向对象编程语言中,对象的属性通常会被设置为私有(private)或受保护(protected)的成员,简单的说就是不允许直接访问这些属性;对象的方法通常都是公开的(public),因为公开的方法是对象能够接受的消息,也是对象暴露给外界的调用接口,这就是所谓的访问可见性
  • 在Python中,可以通过给对象属性名添加前缀下划线的方式来说明属性的访问可见性。例如,可以用__name表示一个私有属性,_name表示一个受保护属性,代码如下所示。
  1. class Student:
  2. def __init__(self, name, age):
  3. self.__name = name
  4. self.__age = age
  5. def study(self, course_name):
  6. print(f'{self.__name}正在学习{course_name}.')
  7. stu = Student('王大锤', 20)
  8. stu.study('Python程序设计')
  9. print(stu.__name) # AttributeError: 'Student' object has no attribute '__name'

__开头的属性__name是私有的,在类的外面无法直接访问。类里面的study方法中可以通过self.__name访问该属性。

需要提醒大家的是,Python并没有从语法上严格保证私有属性的私密性,它只是给私有的属性和方法换了一个名字来阻挠对它们的访问,事实上如果你知道更换名字的规则仍然可以访问到它们,我们可以对上面的代码稍作修改就可以访问到私有的属性。

  1. print(stu._Student__name, stu._Student__age) # 王大锤 20
  • Python中可以通过property装饰器为“私有”属性提供读取和修改的方法。之前我们提到过,装饰器通常会放在类、函数或方法的声明之前,通过一个@符号表示将装饰器应用于类、函数或方法。
  1. class Student:
  2. def __init__(self, name, age):
  3. self.__name = name
  4. self.__age = age
  5. # 属性访问器(getter方法) - 获取__name属性
  6. @property
  7. def name(self):
  8. return self.__name
  9. # 属性修改器(setter方法) - 修改__name属性
  10. @name.setter
  11. def name(self, name):
  12. # 如果name参数不为空就赋值给对象的__name属性
  13. # 否则将__name属性赋值为'无名氏',有两种写法
  14. # self.__name = name if name else '无名氏'
  15. self.__name = name or '无名氏'
  16. @property
  17. def age(self):
  18. return self.__age
  19. stu = Student('王大锤', 20)
  20. print(stu.name, stu.age) # 王大锤 20
  21. stu.name = ''
  22. print(stu.name) # 无名氏
  23. # stu.age = 30 # AttributeError: can't set attribute

在实际项目开发中,我们并不经常使用私有属性,属性装饰器的使用也比较少,所以上面的知识点大家简单了解一下就可以了。

动态属性

  • 在Python中,我们可以动态为对象添加属性,这是Python作为动态类型语言的一项特权,代码如下所示。
  • 需要提醒大家的是,对象的方法其实本质上也是对象的属性,如果给对象发送一个无法接收的消息,引发的异常仍然是AttributeError
  • 如果不希望在使用对象时动态的为对象添加属性,可以使用Python的__slots__魔法。对于Student类来说,可以在类中指定__slots__ = ('name', 'age'),这样Student类的对象只能有nameage属性,如果想动态添加其他属性将会引发异常,代码如下所示。
  1. class Student:
  2. __slots__ = ('name', 'age') # 加了这行就不能动态添加属性了
  3. def __init__(self, name, age):
  4. self.name = name
  5. self.age = age
  6. stu = Student('王大锤', 20)
  7. # AttributeError: 'Student' object has no attribute 'sex'
  8. stu.sex = '男'

静态方法和类方法

  • 之前我们在类中定义的方法都是对象方法,换句话说这些方法都是对象可以接收的消息。除了对象方法之外,类中还可以有静态方法和类方法,这两类方法是发给类的消息,二者并没有实质性的区别。
  • 在面向对象的世界中,一切皆为对象,我们定义的类也是对象,所以类也可以接收消息,对应的方法是类方法或静态方法。

那么,什么样的消息会直接发送给类呢?举一个例子,定义一个三角形类,通过传入三条边的长度来构造三角形,并提供计算周长和面积的方法。计算周长和面积肯定是三角形对象的方法,这一点毫无疑问。但是在创建三角形对象时,传入的三条边长未必能构造出三角形,为此我们可以先写一个方法来验证给定的三条边长是否可以构成三角形,这种方法很显然就不是对象方法,因为在调用这个方法时三角形对象还没有创建出来。我们可以把这类方法设计为静态方法或类方法,也就是说这类方法不是发送给三角形对象的消息,而是发送给三角形类的消息,代码如下所示。

  1. class Triangle(object):
  2. def __init__(self, a, b, c):
  3. self.a = a
  4. self.b = b
  5. self.c = c
  6. @staticmethod
  7. def is_valid(a, b, c):
  8. """判断三条边长能否构成三角形(静态方法)"""
  9. return a + b > c and b + c > a and a + c > b
  10. # @classmethod
  11. # def is_valid(cls, a, b, c):
  12. # """判断三条边长能否构成三角形(类方法)"""
  13. # return a + b > c and b + c > a and a + c > b
  14. def perimeter(self):
  15. """计算周长"""
  16. return self.a + self.b + self.c
  17. def area(self):
  18. """计算面积"""
  19. p = self.perimeter() / 2
  20. return (p * (p - self.a) * (p - self.b) * (p - self.c)) ** 0.5

上面的代码使用staticmethod装饰器声明了is_valid方法是Triangle类的静态方法,如果要声明类方法,可以使用classmethod装饰器。可以直接使用类名.方法名的方式来调用静态方法和类方法,二者的区别在于,类方法的第一个参数是类对象本身 cls,而静态方法则没有这个参数。

简单的总结一下,对象方法、类方法、静态方法都可以通过**类名.方法名**的方式来调用,区别在于方法的第一个参数到底是普通对象 self 还是类对象 cls,还是没有接受消息的对象

静态方法通常也可以直接写成一个独立的函数,因为它并没有跟特定的对象绑定。

继承和多态

  • 通过继承,我们可以从已有的类创建新类,实现对已有类代码的复用。
  • 提供继承信息的类叫做父类(超类、基类),得到继承信息的类叫做子类(派生类、衍生类)。
  • 例如,我们定义一个学生类和一个老师类,我们会发现他们有大量的重复代码,而这些重复代码都是老师和学生作为人的公共属性和行为,所以在这种情况下,我们应该先定义人类,再通过继承,从人类派生出老师类和学生类,代码如下所示。
  1. class Person:
  2. def __init__(self, name, age):
  3. self.name = name
  4. self.age = age
  5. def eat(self):
  6. print(f'{self.name}正在吃饭.')
  7. def sleep(self):
  8. print(f'{self.name}正在睡觉.')
  9. class Student(Person):
  10. def __init__(self, name, age):
  11. # super(Student, self).__init__(name, age)
  12. super().__init__(name, age)
  13. def study(self, course_name):
  14. print(f'{self.name}正在学习{course_name}.')
  15. class Teacher(Person):
  16. def __init__(self, name, age, title):
  17. # super(Teacher, self).__init__(name, age)
  18. super().__init__(name, age)
  19. self.title = title
  20. def teach(self, course_name):
  21. print(f'{self.name}{self.title}正在讲授{course_name}.')
  22. stu1 = Student('白元芳', 21)
  23. stu2 = Student('狄仁杰', 22)
  24. teacher = Teacher('武则天', 35, '副教授')
  25. stu1.eat()
  26. stu2.sleep()
  27. teacher.teach('Python程序设计')
  28. stu1.study('Python程序设计')
  • 继承的语法是在定义类的时候,在类名后的圆括号中指定当前类的父类。
  • 如果定义一个类的时候没有指定它的父类是谁,那么默认的父类是object类。object类是Python中的顶级类,这也就意味着所有的类都是它的子类,要么直接继承它,要么间接继承它。
  • Python语言允许多重继承,也就是说一个类可以有一个或多个父类,关于多重继承的问题我们在后面会有更为详细的讨论。
  • 在子类的初始化方法中,我们可以通过super().__init__()来调用父类初始化方法,super函数是Python内置函数中专门为获取当前对象的父类对象而设计的。
  • 从上面的代码可以看出,子类除了可以通过继承得到父类提供的属性和方法外,还可以定义自己特有的属性和方法,所以子类比父类拥有的更多的能力。在实际开发中,我们经常会用子类对象去替换掉一个父类对象,这是面向对象编程中一个常见的行为,也叫做“里氏替换原则”(Liskov Substitution Principle)。
  • 子类继承父类的方法后,还可以对方法进行重写(重新实现该方法),不同的子类可以对父类的同一个方法给出不同的实现版本,这样的方法在程序运行时就会表现出多态行为(调用相同的方法,做了不同的事情)。

    class在继承父类时,super的作用是什么

    在子类里执行父类的初始化逻辑,直接调用父类的init,在类体系复杂的时候,比如多重继承的时候,父类们不一定会按照它们在子类class语句中的声明顺序执行,引发混乱。
    super 的原始代码如下:
    1. def super(cls, inst):
    2. mro = inst.__class__.mro()
    3. return mro[mro.index(cls) + 1]
    其中,cls 代表类,inst 代表实例,上面的代码做了两件事:
  1. 获取 inst 的 MRO 列表
  2. 查找 cls 在当前 MRO 列表中的 index, 并返回它的下一个类,即 mro[index + 1]

当你使用 super(cls, inst) 时,Python 会在 inst 的 MRO 列表上搜索 cls 的下一个类。
举例来说,A和B类继承了Base类,C同时继承A类和B类,那么 C 的实例self.**class**.mro()结果是
[<class '__main__.C'>, <class '__main__.A'>, <class '__main__.B'>, <class '__main__.Base'>, <class 'object'>]


子类继承父类的构造函数,分以下几种情况

  1. 子类不重写 init,实例化子类时,会自动调用父类定义的 init
  2. 如果重写了init 时,实例化子类,就不会调用父类已经定义的 init
  3. 如果重写了init ,又想继承父类的构造方法,有2种方法
    1. 直接调用父类里的方法 父类名称.__init__(self,参数1,参数2,...),但它会出现以下问题
      1. 比如在多重继承时,超类(父类)的构造逻辑不一定会按照它们在子类class语句中的声明顺序执行。那么运行结果可能与计划的不同。
      2. 无法正确处理菱形继承(diamond inheritance)。这种继承指的是子类通过类体系里两条不同路径的类继承了同一个超类。如果采用刚才那种常见的写法来调用超类的init,那么会让超类的初始化逻辑重复执行,从而引发混乱。
    2. 使用 super 关键字 super(子类名称,self).__init__(参数1,参数2,....)
      1. 为了解决直接调用父类init所产生的问题,Python内置了super函数并且规定了标准的方法解析顺序(method resolution order,MRO)。MRO列表代表了类继承的顺序,我们可以使用下面的方式获得某个类的 MRO 列表:print(子类名称.mro())
      2. super能够确保菱形继承体系中的共同超类只初始化一次(其他案例参见第48条)。MRO可以确定超类之间的初始化顺序,它遵循C3线性化(C3 linearization)算法。
      3. 通过super()调用init,与在子类内通过类名直接调用init相比,可使代码更容易维护,修改父类的类名,无序调整super这一部分的代码。

面向对象编程经典案例

面向对象编程对初学者来说不难理解但很难应用,虽然我们为大家总结过面向对象的三步走方法(定义类、创建对象、给对象发消息),但是说起来容易做起来难。大量的编程练习阅读优质的代码可能是这个阶段最能够帮助到大家的两件事情。接下来我们还是通过经典的案例来剖析面向对象编程的知识,同时也通过这些案例为大家讲解如何运用之前学过的Python知识。

案例1:扑克游戏。

说明:简单起见,我们的扑克只有52张牌(没有大小王),游戏需要将52张牌发到4个玩家的手上,每个玩家手上有13张牌,按照黑桃、红心、草花、方块的顺序和点数从小到大排列,暂时不实现其他的功能。

  • 首先需要从问题的需求中找到对象并抽象出对应的类,此外还要找到对象的属性和行为。我们可以从需求的描述中找出名词和动词,名词通常就是对象或者是对象的属性,而动词通常是对象的行为。
  • 扑克游戏中至少应该有三类对象,分别是牌、扑克和玩家,牌、扑克、玩家三个类也并不是孤立的。
  • 类和类之间的关系可以粗略的分为is-a关系(继承)has-a关系(关联)use-a关系(依赖)。很显然扑克和牌是has-a关系,因为一副扑克有(has-a)52张牌;玩家和牌之间不仅有关联关系还有依赖关系,因为玩家手上有(has-a)牌而且玩家使用了(use-a)牌。

牌的属性显而易见,有花色和点数。我们可以用0到3的四个数字来代表四种不同的花色,但是这样的代码可读性会非常糟糕,因为我们并不知道黑桃、红心、草花、方块跟0到3的数字的对应关系。如果一个变量的取值只有有限多个选项,我们可以使用枚举。与C、Java等语言不同的是,Python中没有声明枚举类型的关键字,但是可以通过继承enum模块的Enum类来创建枚举类型,代码如下所示。

  1. from enum import Enum
  2. class Suite(Enum):
  3. """花色(枚举)"""
  4. SPADE, HEART, CLUB, DIAMOND = range(4)
  5. for suite in Suite:
  6. print(f'{suite}: {suite.value}')
  • 通过上面的代码可以看出,定义枚举类型其实就是定义符号常量,如SPADEHEART等。每个符号常量都有与之对应的值,这样表示黑桃就可以不用数字0,而是用Suite.SPADE;同理,表示方块可以不用数字3, 而是用Suite.DIAMOND
  • 注意,使用符号常量肯定是优于使用字面常量的,因为能够读懂英文就能理解符号常量的含义,代码的可读性会提升很多。
  • Python中的枚举类型是可迭代类型,简单的说就是可以将枚举类型放到for-in循环中,依次取出每一个符号常量及其对应的值。

接下来我们可以定义牌类。

  1. class Card:
  2. def __init__(self, suite, face):
  3. self.suite = suite
  4. self.face = face
  5. def __repr__(self):
  6. suites = '♠♥♣♦'
  7. faces = ['', 'A', '2', '3', '4', '5', '6', '7', '8', '9', '10', 'J', 'Q', 'K']
  8. # 根据牌的花色和点数取到对应的字符
  9. return f'{suites[self.suite.value]}{faces[self.face]}'
  10. card1 = Card(Suite.SPADE, 5)
  11. card2 = Card(Suite.HEART, 13)
  12. print(card1, card2) # ♠5 ♥K

接下来我们定义扑克类。

  1. import random
  2. class Poker:
  3. """扑克"""
  4. def __init__(self):
  5. # 通过列表的生成式语法创建一个装52张牌的列表
  6. self.cards = [Card(suite, face) for suite in Suite
  7. for face in range(1, 14)]
  8. # current属性表示发牌的位置
  9. self.current = 0
  10. def shuffle(self):
  11. """洗牌"""
  12. self.current = 0
  13. # 通过random模块的shuffle函数实现列表的随机乱序
  14. random.shuffle(self.cards)
  15. def deal(self):
  16. """发牌"""
  17. card = self.cards[self.current]
  18. self.current += 1
  19. return card
  20. @property
  21. def has_next(self):
  22. """还有没有牌可以发"""
  23. return self.current < len(self.cards)
  24. poker = Poker()
  25. poker.shuffle()
  26. print(poker.cards)

定义玩家类。

  1. class Player:
  2. """玩家"""
  3. def __init__(self, name):
  4. self.name = name
  5. self.cards = []
  6. def get_one(self, card):
  7. """摸牌"""
  8. self.cards.append(card)
  9. def arrange(self):
  10. self.cards.sort()

创建四个玩家并将牌发到玩家的手上。

  1. poker = Poker()
  2. poker.shuffle()
  3. players = [Player('东邪'), Player('西毒'), Player('南帝'), Player('北丐')]
  4. for _ in range(13):
  5. for player in players:
  6. player.get_one(poker.deal())
  7. for player in players:
  8. player.arrange() # TypeError: '<' not supported between instances of 'Card' and 'Card'
  9. print(f'{player.name}: ', end='')
  10. print(player.cards)

执行上面的代码会在player.arrange()那里出现异常,因为Playerarrange方法使用了列表的sort对玩家手上的牌进行排序,排序需要比较两个Card对象的大小,而<运算符又不能直接作用于Card类型,所以就出现了TypeError异常,异常消息为:'<' not supported between instances of 'Card' and 'Card'

为了解决这个问题,我们可以对Card类的代码稍作修改,使得两个Card对象可以直接用<进行大小的比较。这里用到技术叫运算符重载,Python中要实现对<运算符的重载,需要在类中添加一个名为__lt__的魔术方法。很显然,魔术方法__lt__中的lt是英文单词“less than”的缩写,以此类推,魔术方法__gt__对应>运算符,魔术方法__le__对应<=运算符,__ge__对应>=运算符,__eq__对应==运算符,__ne__对应!=运算符。

修改后的Card类代码如下所示。

  1. class Card: """牌"""
  2. def __init__(self, suite, face):
  3. self.suite = suite
  4. self.face = face
  5. def __repr__(self):
  6. suites = '♠♥♣♦'
  7. faces = ['', 'A', '2', '3', '4', '5', '6', '7', '8', '9', '10', 'J', 'Q', 'K'] # 根据牌的花色和点数取到对应的字符
  8. return f'{suites[self.suite.value]}{faces[self.face]}'
  9. def __lt__(self, other):
  10. # 花色相同比较点数的大小
  11. if self.suite == other.suite:
  12. return self.face < other.face
  13. # 花色不同比较花色对应的值
  14. return self.suite.value < other.suite.value

说明: 大家可以尝试在上面代码的基础上写一个简单的扑克游戏,如21点游戏(Black Jack),游戏的规则可以自己在网上找一找。

案例2:工资结算系统。

要求:某公司有三种类型的员工,分别是部门经理、程序员和销售员。需要设计一个工资结算系统,根据提供的员工信息来计算员工的月薪。其中,部门经理的月薪是固定15000元;程序员按工作时间(以小时为单位)支付月薪,每小时200元;销售员的月薪由1800元底薪加上销售额5%的提成两部分构成。

通过对上述需求的分析,可以看出部门经理、程序员、销售员都是员工,有相同的属性和行为,那么我们可以先设计一个名为Employee的父类,再通过继承的方式从这个父类派生出部门经理、程序员和销售员三个子类。很显然,后续的代码不会创建Employee 类的对象,因为我们需要的是具体的员工对象,所以这个类可以设计成专门用于继承的抽象类。Python中没有定义抽象类的关键字,但是可以通过abc模块中名为ABCMeta 的元类来定义抽象类。关于元类的知识,后面的课程中会有专门的讲解,这里不用太纠结这个概念,记住用法即可。

  1. from abc import ABCMeta, abstractmethod
  2. class Employee(metaclass=ABCMeta): """员工"""
  3. def __init__(self, name):
  4. self.name = name
  5. @abstractmethod
  6. def get_salary(self): """结算月薪"""
  7. pass

在上面的员工类中,有一个名为get_salary的方法用于结算月薪,但是由于还没有确定是哪一类员工,所以结算月薪虽然是员工的公共行为但这里却没有办法实现。对于暂时无法实现的方法,我们可以使用abstractmethod装饰器将其声明为抽象方法,所谓抽象方法就是只有声明没有实现的方法声明这个方法是为了让子类去重写这个方法。接下来的代码展示了如何从员工类派生出部门经理、程序员、销售员这三个子类以及子类如何重写父类的抽象方法。

  1. class Manager(Employee): """部门经理"""
  2. def get_salary(self):
  3. return 15000.0
  4. class Programmer(Employee): """程序员"""
  5. def __init__(self, name, working_hour=0):
  6. super().__init__(name)
  7. self.working_hour = working_hour
  8. def get_salary(self):
  9. return 200 * self.working_hour
  10. class Salesman(Employee): """销售员"""
  11. def __init__(self, name, sales=0):
  12. super().__init__(name)
  13. self.sales = sales
  14. def get_salary(self):
  15. return 1800 + self.sales * 0.05

上面的ManagerProgrammerSalesman三个类都继承自Employee,三个类都分别重写了get_salary方法。重写就是子类对父类已有的方法重新做出实现。相信大家已经注意到了,三个子类中的get_salary各不相同,所以这个方法在程序运行时会产生多态行为,多态简单的说就是调用相同的方法不同的子类对象做不同的事情

我们通过下面的代码来完成这个工资结算系统,由于程序员和销售员需要分别录入本月的工作时间和销售额,所以在下面的代码中我们使用了Python内置的isinstance函数来判断员工对象的类型。我们之前讲过的type函数也能识别对象的类型,但是isinstance函数更加强大,因为它可以判断出一个对象是不是某个继承结构下的子类型,你可以简答的理解为type函数是对对象类型的精准匹配,而isinstance函数是对对象类型的模糊匹配。

  1. emps = [Manager('刘备'), Programmer('诸葛亮'), Manager('曹操'), Programmer('荀彧'), Salesman('吕布'), Programmer('张辽'),]
  2. for emp in emps:
  3. if isinstance(emp, Programmer):
  4. emp.working_hour = int(input(f'请输入{emp.name}本月工作时间: '))
  5. elif isinstance(emp, Salesman):
  6. emp.sales = float(input(f'请输入{emp.name}本月销售额: '))
  7. print(f'{emp.name}本月工资为: ¥{emp.get_salary():.2f}元')

经典计算题

计算两个正整数最大公约数和最小公倍数的函数

  1. def gcd_and_lcm(x: int, y: int) -> int:
  2. """求最大公约数和最小公倍数"""
  3. a, b = x, y
  4. while b % a != 0:
  5. a, b = b % a, a # 辗转相除法
  6. return a, x * y // a

斐波那契数列

说明:斐波那契数列(Fibonacci sequence),通常也被称作黄金分割数列,是意大利数学家莱昂纳多·斐波那契(Leonardoda Fibonacci)在《计算之书》中研究在理想假设条件下兔子成长率问题而引入的数列,因此这个数列也常被戏称为“兔子数列”。斐波那契数列的特点是数列的前两个数都是1,从第三个数开始,每个数都是它前面两个数的和,按照这个规律,斐波那契数列的前10个数是:1, 1, 2, 3, 5, 8, 13, 21, 34, 55

  1. a, b = 0, 1
  2. for _ in range(20):
  3. a, b = b, a + b
  4. print(a)

100以内的素数:

说明:素数指的是只能被1和自身整除的正整数(不包括1)。

  1. for num in range(2, 100):
  2. # 假设num是素数
  3. is_prime = True
  4. # 在2到num-1之间找num的因子
  5. for factor in range(2, num):
  6. # 如果找到了num的因子,num就不是素数
  7. if num % factor == 0:
  8. is_prime = False
  9. break
  10. # 如果布尔值为True在num是素数
  11. if is_prime:
  12. print(num)