数据类型和变量

数据 - 图1

廖雪峰

数据类型

计算机:顾名思义就是可以做数学计算的机器, 因此,计算机程序理所当然地可以处理各种数值。 但是,计算机能处理的远不止数值,还可以处理文本、图形、音频、视频、网页等各种各样的数据, 不同的数据,需要定义不同的数据类型。 在Python中,能够直接处理的数据类型有以下几种:

整数

Python可以处理任意大小的整数,当然包括负整数,在程序中的表示方法和数学上的写法一模一样,例如:1100-80800,等等。 计算机由于使用二进制,所以,有时候用十六进制表示整数比较方便,十六进制用**0x**前缀和0-9,a-f表示,例如:0xff000xa5b4c3d2,等等。 对于很大的数,例如10000000000,很难数清楚0的个数。Python允许在数字中间以_ _下划_线分隔,因此,写成10_000_000_00010000000000是完全一样的。 六进制数也可以写成**<u>0x</u>**a1b2_c3d4

浮点数

浮点数也就是小数, 之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的, 比如,1.23x109和12.3x108是完全相等的。 浮点数可以用数学写法,如1.233.14-9.01,等等。 但是对于很大或很小的浮点数,就必须用科学计数法表示,把10用e替代 1.23x109就是1.23e9,或者12.3e8,0.000012可以写成1.2e-5,等等。 整数和浮点数在计算机内部存储的方式是不同的, 整数运算永远是精确的(除法难道也是精确的?是的!),而浮点数运算则可能会有四舍五入的误差

字符串

字符串是以单引号**'**或双引号**"**括起来的任意文本, 比如'abc'"xyz"等等。 请注意,''""本身只是一种表示方式,不是字符串的一部分, 因此,字符串'abc'只有abc这3个字符。 如果'本身也是一个字符,那就可以用""括起来,比如"<u>I'm OK</u>"包含的字符是I'm,空格,OK6个字符 如果字符串内部既包含<u>'</u>又包含<u>"</u>怎么办?可以用转义字符**\**来标识,比如:
  1. 'I\'m \"OK\"!'
表示的字符串内容是:
  1. I'm "OK"!
转义字符\可以转义很多字符 比如\n表示换行,\t表示制表符,字符\本身也要转义,所以<u>\\</u>表示的字符就是\,可以在Python的交互式命令行-print()打印字符串看看:
  1. >>> print('I\'m ok.')
  2. I'm ok.
  3. >>> print('I\'m learning\nPython.')
  4. I'm learning
  5. Python.
  6. >>> print('\\\n\\')
  7. \
  8. \
如果字符串里面有很多字符都需要转义,就需要加很多\,为了简化,Python还允许用r''表示''内部的字符串默认不转义,可以自己试试:
  1. >>> print('\\\t\\')
  2. \ \
  3. >>> print(r'\\\t\\')
  4. \\\t\\
如果字符串内部有很多换行,用\n写在一行里不好阅读, 为了简化,Python允许用'''...'''的格式表示多行内容,可以自己试试:
  1. >>> print('''line1
  2. ... line2
  3. ... line3''')
  4. line1
  5. line2
  6. line3
上面是在交互式命令行内输入,注意在输入多行内容时,提示符由<u>>>></u>变为<u>...</u>,提示你可以接着上一行输入,注意...是提示符,不是代码 的一部分:
  1. ┌────────────────────────────────────────────────────────┐
  2. Command Prompt - python _ x
  3. ├────────────────────────────────────────────────────────┤
  4. │>>> print('''line1 │
  5. │... line2 │
  6. │... line3''')
  7. line1
  8. line2
  9. line3
  10. │>>> _
  11. └────────────────────────────────────────────────────────┘
当输入完结束符**```**和括号)后,执行该语句并打印结果。 如果写成程序并存为.py文件,就是:
  1. print('''line1
  2. line2
  3. line3''')
多行字符串'''...'''还可以在前面加上**r**使用,请自行测试:
  1. print(r'''hello,\n
  2. world''')

布尔值

布尔值和布尔代数的表示完全一致, 一个布尔值只有TrueFalse两种值,要么是True,要么是False 在Python中,可以直接用TrueFalse表示布尔值(请注意大小写), 也可以通过布尔运算计算出来:
  1. >>> True
  2. True
  3. >>> False
  4. False
  5. >>> 3 > 2
  6. True
  7. >>> 3 > 5
  8. False
布尔值可以用andornot运算。

and运算是与运算,只有所有都为Trueand运算结果才是True

  1. >>> True and True
  2. True
  3. >>> True and False
  4. False
  5. >>> False and False
  6. False
  7. >>> 5 > 3 and 3 > 1
  8. True

or运算是或运算,只要其中有一个为Trueor运算结果就是True

  1. >>> True or True
  2. True
  3. >>> True or False
  4. True
  5. >>> False or False
  6. False
  7. >>> 5 > 3 or 1 > 3
  8. True

not运算是非运算,它是一个单目运算符,

True变成FalseFalse变成True
  1. >>> not True
  2. False
  3. >>> not False
  4. True
  5. >>> not 1 > 2
  6. True
布尔值经常用在条件判断中,比如:
  1. if age >= 18:
  2. print('adult')
  3. else:
  4. print('teenager')

空值

空值是Python里一个特殊的值,用None表示。

None不能理解为0,因为0有意义的,

None是一个特殊的空值 此外,Python还提供了列表、字典等多种数据类型, 还允许创建自定义数据类型,我们后面会继续讲到。

变量

变量的概念基本上和-初中代数的方程变量是一致的, 只是在计算机程序中,变量不仅可以是数字,还可以是任意数据类型。 变量在程序中就是用一个变量名表示了, 变量名必须是大小写英文、数字_的组合, 且不能用数字开头,比如:
  1. a = 1
变量a是一个整数。
  1. t_007 = 'T007'
变量t_007是一个字符串。
  1. Answer = True
变量Answer是一个布尔值True 在Python中,等号=赋值语句,可以把任意数据类型赋值给变量, 同一个变量可以反复赋值,而且可以是不同类型的变量, 例如:
  1. a = 123 # a是整数
  2. print(a)
  3. a = 'ABC' # a变为字符串
  4. print(a)
这种变量本身类型不固定的语言称之为动态语言 ,与之对应的是静态语言 静态语言在定义变量时必须指定变量类型,如果赋值的时候类型不匹配,就会报错。 例如Java是静态语言,赋值语句如下(// 表示注释):
  1. int a = 123; // a是整数类型变量
  2. a = "ABC"; // 错误:不能把字符串赋给整型变量
和静态语言相比,动态语言更灵活,就是这个原因。 请不要把赋值语句的等号-等同于数学的等号。比如下面的代码:
  1. x = 10
  2. x = x + 2
如果从数学上理解x = x + 2那无论如何是不成立的, 在程序中,赋值语句先计算右侧的表达式x + 2,得到结果12 再赋给变量x。由于x之前的值是10 重新赋值后,x的值变成12 最后,理解变量在计算机内存中的表示-也非常重要。当我们写:
  1. a = 'ABC'
时,Python解释器干了两件事情:
  1. 在内存中创建了一个'ABC'的字符串;
  2. 在内存中创建了一个名为a变量,并把它指向'ABC'
也可以把一个变量a赋值给另一个变量b,这个操作实际上是把变量**b**指向-变量a所指向的数据,例如下面的代码:
  1. a = 'ABC'
  2. b = a
  3. a = 'XYZ'
  4. print(b)
最后一行打印出变量b的内容到底是'ABC'呢还是'XYZ' 如果从数学意义上理解,就会错误地得出ba相同,也应该是'XYZ',但实际上b的值是'ABC' 让我们一行一行地执行代码,就可以看到到底发生了什么事: 执行a = 'ABC',解释器创建了字符串'ABC'和变量a,并把**a**指向'ABC'

数据 - 图2

执行b = a,解释器创建了变量b,并把b指向a指向的字符串'ABC'

数据 - 图3

执行a = 'XYZ',解释器创建了字符串’XYZ’,并把a的指向改为'XYZ',但b并没有更改:

数据 - 图4

所以,最后打印变量b结果自然是'ABC'了。

常量

所谓常量就是不能变的变量,比如常用的数学常数π就是一个常量。 在Python中,通常用全部大写的变量名表示常量
  1. PI = 3.14159265359
但事实上PI仍然是一个变量,Python根本没有任何机制-保证PI不会被改变, 所以,用全部大写的变量名表示常量-只是一个习惯上的用法, 、、如果你一定要改变变量PI的值,也没人能拦住你。 最后解释一下整数的除法为什么也是精确的。 在Python中,有两种除法,一种除法是/
  1. >>> 10 / 3
  2. 3.3333333333333335

/除法计算结果是浮点数

即使是两个整数恰好整除,结果也是浮点数:
  1. >>> 9 / 3
  2. 3.0
还有一种除法是//,称为地板除 两个整数的除法仍然是整数:
  1. >>> 10 // 3
  2. 3
你没有看错,整数的地板除//永远是整数,即使除不尽。 要做精确的除法,使用/就可以。 因为//除法只取结果的整数部分 所以Python还提供一个余数运算,可以得到两个整数相除的余数:
  1. >>> 10 % 3
  2. 1
无论整数做//除法还是取余数,结果永远是整数, 所以,整数运算结果永远是精确的。

练习

请打印出以下变量的值:
  1. n = 123
  2. f = 456.789
  3. s1 = 'Hello, world'
  4. s2 = 'Hello, \'Adam\''
  5. s3 = r'Hello, "Bart"'
  6. s4 = r'''Hello,
  7. Bob!'''
  8. print(???)

小结

Python支持多种数据类型, 在计算机内部,可以把任何数据都看成一个“对象” 变量-就是在程序中用来指向这些数据对象的, 变量赋值-就是把数据和变量给关联起来。 对变量赋值x = y是把变量x指向真正的对象 该对象是变量y所指向的。随后对变量y的赋值-不影响 变量x的指向。 注意:Python的整数没有大小限制, 而某些语言的整数-根据其存储长度是有大小限制的, 例如Java对32位整数的范围限制在-2147483648-2147483647 Python的浮点数也没有大小限制, 但是超出一定范围就直接表示为inf(无限大)。