标准数据类型

Python3 的六个标准数据类型中:

  • 不可变数据(3 个):
    • Number(数字)
    • String(字符串)
    • Tuple(元组)
  • 可变数据(3 个):
    • List(列表)
    • Set(集合)
    • Dictionary(字典)

Number(数字)

Python3 支持 bool、**int、float、、complex(复数)**。
在Python 3里,只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。
像大多数语言一样,数值类型的赋值和计算都是很直观的。
内置的 type() 函数可以用来查询变量所指的对象类型。

  1. a, b, c, d = 20, 5.5, True, 4+3j
  2. print(type(a), type(b), type(c), type(d))
  3. """
  4. <class 'int'> <class 'float'> <class 'bool'> <class 'complex'>
  5. """

此外还可以用 isinstance 来判断:

  1. a = 111
  2. print(isinstance(a, int))
  3. """
  4. True
  5. """

isinstance 和 type 的区别在于:

  • type()不会认为子类是一种父类类型。
  • isinstance()会认为子类是一种父类类型。
    1. >>> class A:
    2. ... pass
    3. ...
    4. >>> class B(A):
    5. ... pass
    6. ...
    7. >>> isinstance(A(), A)
    8. True
    9. >>> type(A()) == A
    10. True
    11. >>> isinstance(B(), A)
    12. True
    13. >>> type(B()) == A
    14. False
    ⚠️注意: 在 Python2 中是没有布尔型的,它用数字 0 表示 False,用 1 表示 True。到 Python3 中,把 True 和 False 定义成关键字了,但它们的值还是 1 和 0,它们可以和数字相加。

当你指定一个值时,Number 对象就会被创建:

  1. var1 = 1
  2. var2 = 10

您也可以使用del语句删除一些对象引用。
del语句的语法是:

  1. del var1[,var2[,var3[....,varN]]]

您可以通过使用del语句删除单个或多个对象。例如:

  1. del var
  2. del var_a, var_b

数值运算

  1. 5 + 4 # 加法 9
  2. 4.3 - 2 # 减法 2.3
  3. 3 * 7 # 乘法 21
  4. 2 / 4 # 除法,得到一个浮点数 0.5
  5. 2 // 4 # 除法,得到一个整数 0
  6. 17 % 3 # 取余 2
  7. 2 ** 5 # 乘方 32

注意:

  • Python可以同时为多个变量赋值,如a, b = 1, 2。
  • 一个变量可以通过赋值指向不同类型的对象。
  • 数值的除法包含两个运算符:/ 返回一个浮点数,// 返回一个整数。
  • 在混合计算时,Python会把整型转换成为浮点数。

数值类型实例

int float complex
10 0.0 3.14j
100 15.20 45.j
-786 -21.9 9.322e-36j
080 32.3e+18 .876j
-0490 -90. -.6545+0J
-0x260 -32.54e100 3e+26J
0x69 70.2E-12 4.53e-7j

Python还支持复数,复数由实数部分和虚数部分构成,可以用a + bj,或者complex(a,b)表示, 复数的实部a和虚部b都是浮点型

String(字符串)

Python中的字符串用单引号 ‘ 或双引号 " 括起来,同时使用反斜杠 \ 转义特殊字符。
字符串的截取的语法格式如下:

  1. 变量[头下标:尾下标]

索引值以 0 为开始值,-1 为从末尾的开始位置。
Python3 数据类型 - 图1
加号 + 是字符串的连接符, 星号 * 表示复制当前字符串,与之结合的数字为复制的次数。实例如下:

  1. str = '123456789'
  2. print (str) # 输出字符串
  3. print (str[0]) # 输出字符串第一个字符
  4. print (str[1]) # 输出字符串第二个字符
  5. print (str[-1]) # 输出倒数的第一个字符
  6. print (str[2:5]) # 输出从第三个开始到第五个的字符
  7. print (str[0:-1]) # 输出第一个到倒数第二个的所有字符串
  8. print (str[2:]) # 输出从第三个开始的后的所有字符
  9. print (str * 2) # 输出字符串两次,也可以写成 print (2 * str)
  10. print (str + "TEST") # 连接字符串
  11. """
  12. 123456789
  13. 1
  14. 2
  15. 9
  16. 345
  17. 12345678
  18. 3456789
  19. 123456789123456789
  20. 123456789TEST
  21. """

Python 使用反斜杠 \ 转义特殊字符,如果你不想让反斜杠发生转义,可以在字符串前面添加一个 r,表示原始字符串:

  1. print('C:\\\\ken') # C:\\ken
  2. print(r'C:\\\\ken') # C:\\ken

另外,反斜杠()可以作为续行符,表示下一行是上一行的延续。也可以使用 """…""" 或者 ‘’’…’’’ 跨越多行。
注意,Python 没有单独的字符类型,一个字符就是长度为1的字符串。

  1. word = 'Python'
  2. print(word[0], word[5]) # P n
  3. print(word[-1], word[-6]) # n P

与 C 字符串不同的是,Python 字符串不能被改变。向一个索引位置赋值,比如word[0] = ‘m’会导致错误。
注意:

  • 反斜杠可以用来转义,使用r可以让反斜杠不发生转义。
  • 字符串可以用+运算符连接在一起,用*运算符重复。
  • Python中的字符串有两种索引方式,从左往右以0开始,从右往左以-1开始。
  • Python中的字符串不能改变。

Tuple(元组)

元组(tuple)与列表类似,不同之处在于元组的元素不能修改。元组写在小括号 () 里,元素之间用逗号隔开。
元组中的元素类型也可以不相同:

  1. #!/usr/bin/python3
  2. tuple = ( 'abcd', 786 , 2.23, '一缕清风', 70.2 )
  3. tinytuple = (123, '一缕清风')
  4. print (tuple) # 输出完整元组
  5. print (tuple[0]) # 输出元组的第一个元素
  6. print (tuple[1:3]) # 输出从第二个元素开始到第三个元素
  7. print (tuple[2:]) # 输出从第三个元素开始的所有元素
  8. print (tinytuple * 2) # 输出两次元组
  9. print (tuple + tinytuple) # 连接元组
  10. """
  11. ('abcd', 786, 2.23, '一缕清风', 70.2)
  12. abcd
  13. (786, 2.23)
  14. (2.23, '一缕清风', 70.2)
  15. (123, '一缕清风', 123, '一缕清风')
  16. ('abcd', 786, 2.23, '一缕清风', 70.2, 123, '一缕清风')
  17. """

元组与字符串类似,可以被索引且下标索引从0开始,-1 为从末尾开始的位置。也可以进行截取(看上面,这里不再赘述)。
其实,可以把字符串看作一种特殊的元组。

  1. tup = (1, 2, 3, 4, 5, 6)
  2. print(tup[0]) # 1
  3. print(tup[1:5]) # (2, 3, 4, 5)
  4. tup[0] = 11 # 修改元组元素的操作是非法的 TypeError: 'tuple' object does not support item assignment

虽然tuple的元素不可改变,但它可以包含可变的对象,比如list列表。

  1. tup = ([1,2,3],)
  2. list = tup[0]
  3. list.append(4)
  4. print(tup[0])
  5. """
  6. [1, 2, 3, 4]
  7. """

构造包含 0 个或 1 个元素的元组比较特殊,所以有一些额外的语法规则:

  1. tup1 = () # 空元组
  2. tup2 = (20,) # 一个元素,需要在元素后添加逗号

注意:

  • string、list 和 tuple 都属于 sequence(序列)
  • 1、与字符串一样,元组的元素不能修改。
  • 2、元组也可以被索引和切片,方法一样。
  • 3、注意构造包含 0 或 1 个元素的元组的特殊语法规则。
  • 4、元组也可以使用+操作符进行拼接。

List(列表)

List(列表) 是 Python 中使用最频繁的数据类型。
列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。
列表是写在方括号 [] 之间、用逗号分隔开的元素列表。
和字符串一样,列表同样可以被索引和截取,列表被截取后返回一个包含所需元素的新列表。
列表截取的语法格式如下:

  1. 变量[头下标:尾下标]

索引值以 0 为开始值,-1 为从末尾的开始位置。
image.png
加号 + 是列表连接运算符,星号 * 是重复操作。如下实例:

  1. #!/usr/bin/python3
  2. list = [ 'abcd', 786 , 2.23, '一缕清风', 70.2 ]
  3. tinylist = [123, '一缕清风']
  4. print (list) # 输出完整列表
  5. print (list[0]) # 输出列表第一个元素
  6. print (list[1:3]) # 从第二个开始输出到第三个元素
  7. print (list[2:]) # 输出从第三个元素开始的所有元素
  8. print (tinylist * 2) # 输出两次列表
  9. print (list + tinylist) # 连接列表
  10. """
  11. ['abcd', 786, 2.23, '一缕清风', 70.2]
  12. abcd
  13. [786, 2.23]
  14. [2.23, '一缕清风', 70.2]
  15. [123, '一缕清风', 123, '一缕清风']
  16. ['abcd', 786, 2.23, '一缕清风', 70.2, 123, '一缕清风']
  17. """

与Python字符串不一样的是,列表中的元素是可以改变的:

  1. >>> a = [1, 2, 3, 4, 5, 6]
  2. >>> a[0] = 9
  3. >>> a[2:5] = [13, 14, 15]
  4. >>> a
  5. [9, 2, 13, 14, 15, 6]
  6. >>> a[2:5] = [] # 将对应的元素值设置为 []
  7. >>> a
  8. [9, 2, 6]

List 内置了有很多方法,例如 append()、pop() 等等,这在后面会讲到。
注意:

  • List写在方括号之间,元素用逗号隔开。
  • 和字符串一样,list可以被索引和切片。
  • List可以使用+操作符进行拼接。但是不可以用-操作
  • List中的元素是可以改变的。

Python 列表截取可以接收第三个参数,参数作用是截取的步长,以下实例在索引 1 到索引 4 的位置并设置为步长为 2(间隔一个位置)来截取字符串:
Python3 数据类型 - 图3
如果第三个参数为负数表示逆向读取,以下实例用于翻转字符串:

  1. def reverseWords(input):
  2. # 通过空格将字符串分隔符,把各个单词分隔为列表
  3. inputWords = input.split(" ")
  4. # 翻转字符串
  5. # 假设列表 list = [1,2,3,4],
  6. # list[0]=1, list[1]=2 ,而 -1 表示最后一个元素 list[-1]=4 ( 与 list[3]=4 一样)
  7. # inputWords[-1::-1] 有三个参数
  8. # 第一个参数 -1 表示最后一个元素
  9. # 第二个参数为空,表示移动到列表末尾
  10. # 第三个参数为步长,-1 表示逆向
  11. inputWords=inputWords[-1::-1]
  12. output = ' '.join(inputWords) # 重新组合字符串
  13. return output
  14. if __name__ == "__main__":
  15. input = 'I like 一缕清风'
  16. rw = reverseWords(input)
  17. print(rw)
  18. """
  19. 一缕清风 like I
  20. """

Set(集合)

集合(set)是由一个或数个形态各异的大小整体组成的,构成集合的事物或对象称作元素或是成员。
基本功能是进行成员关系测试和删除重复元素。
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
创建格式:

  1. parame = {value01,value02,...}
  2. 或者
  3. set(value)
  1. #!/usr/bin/python3
  2. sites = {'Google', 'Taobao', 'Facebook', 'Zhihu', 'Baidu','Baidu'}
  3. print(sites) # 输出集合,重复的元素被自动去掉
  4. # 成员测试
  5. if 'Taobao' in sites :
  6. print('Taobao 在集合中')
  7. else :
  8. print('Taobao 不在集合中')
  9. """
  10. {'Google', 'Taobao', 'Baidu', 'Zhihu', 'Facebook'}
  11. Taobao 在集合中
  12. """

set可以进行集合运算

  1. a = set('abracadabra')
  2. b = set('alacazam')
  3. print(a)
  4. print(a - b) # a 和 b 的差集
  5. print(a | b) # a 和 b 的并集
  6. print(a & b) # a 和 b 的交集
  7. print(a ^ b) # a 和 b 中不同时存在的元素
  8. """
  9. {'b', 'c', 'r', 'd', 'a'}
  10. {'d', 'b', 'r'}
  11. {'b', 'm', 'z', 'c', 'r', 'd', 'a', 'l'}
  12. {'a', 'c'}
  13. {'d', 'b', 'm', 'z', 'l', 'r'}
  14. """

Dictionary(字典)

字典(dictionary)是Python中另一个非常有用的内置数据类型。
列表是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
字典是一种映射类型,字典用 { } 标识,它是一个无序的 键(key) : 值(value) 的集合。
键(key)必须使用不可变类型。
在同一个字典中,键(key)必须是唯一的。

  1. #!/usr/bin/python3
  2. oneDict = {}
  3. oneDict['name'] = "一缕清风"
  4. oneDict[2] = "Ken"
  5. twoDict = {'name': '一缕清风','age':18}
  6. print (oneDict) # 输出完整的字典
  7. print (oneDict['name']) # 输出键为 'name' 的值
  8. print (oneDict[2]) # 输出键为 2 的值
  9. print (oneDict.keys()) # 输出所有键
  10. print (oneDict.values()) # 输出所有值
  11. print("*"*50)
  12. print (twoDict) # 输出完整的字典
  13. print (twoDict.keys()) # 输出所有键
  14. print (twoDict.values()) # 输出所有值
  15. """
  16. {'name': '一缕清风', 2: 'Ken'}
  17. 一缕清风
  18. Ken
  19. dict_keys(['name', 2])
  20. dict_values(['一缕清风', 'Ken'])
  21. **************************************************
  22. {'name': '一缕清风', 'age': 18}
  23. dict_keys(['name', 'age'])
  24. dict_values(['一缕清风', 18])
  25. """

构造函数 dict() 可以直接从键值对序列中构建字典如下:

  1. >>> dict([('Apple', 1), ('Google', 2), ('Taobao', 3)])
  2. {'Apple': 1, 'Google': 2, 'Taobao': 3}
  3. >>> dict(Apple=1, Google=2, Taobao=3)
  4. {'Apple': 1, 'Google': 2, 'Taobao': 3}
  5. >>> {x: x**2 for x in (2, 4, 6)}
  6. {2: 4, 4: 16, 6: 36}

另外,字典类型也有一些内置的函数,例如clear()、keys()、values()等。
注意:

  • 字典是一种映射类型,它的元素是键值对。
  • 字典的关键字必须为不可变类型,且不能重复。
  • 创建空字典使用 { }。

Python数据类型转换

有时候,我们需要对数据内置的类型进行转换,数据类型的转换,你只需要将数据类型作为函数名即可。
以下几个内置的函数可以执行数据类型之间的转换。这些函数返回一个新的对象,表示转换的值。

函数 描述
int(x [,base]) 将x转换为一个整数
float(x) 将x转换到一个浮点数
complex(real [,imag]) 创建一个复数
str(x) 将对象 x 转换为字符串
repr(x) 将对象 x 转换为表达式字符串
eval(str) 用来计算在字符串中的有效Python表达式,并返回一个对象
tuple(s) 将序列 s 转换为一个元组
list(s) 将序列 s 转换为一个列表
set(s) 转换为可变集合
dict(d) 创建一个字典。d 必须是一个 (key, value)元组序列。
frozenset(s) 转换为不可变集合
chr(x) 将一个整数转换为一个字符
ord(x) 将一个字符转换为它的整数值
hex(x) 将一个整数转换为一个十六进制字符串
oct(x) 将一个整数转换为一个八进制字符串