7. 输入与输出


7.1. 更复杂的输出格式

到目前为止我们已遇到过两种写入值的方式: 表达式语句 print() 函数。 (第三种方式是使用文件对象的 write() 方法;标准输出文件可以被引用为 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">sys.stdout</font>。 更多相关信息请参阅标准库参考)。 对输出格式的控制不只是打印空格分隔的值,还需要更多方式。格式化输出包括以下几种方法。 使用 格式化字符串字面值 ,要在字符串开头的引号/三引号前添加 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f</font> <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">F</font> 。在这种字符串中,可以在 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">{</font> <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">}</font> 字符之间输入引用的变量,或字面值的 Python 表达式。
  • >>>
  1. >>> year = 2016
  2. >>> event = 'Referendum'
  3. >>> f'Results of the {year} {event}'
  4. 'Results of the 2016 Referendum'
字符串的 str.format() 方法需要更多手动操作。 你仍将使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">{</font> <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">}</font> 来标记变量将被替换的位置并且可以提供详细的格式化指令,但你还需要提供待格式化的信息。 下面的代码块中有两个格式化变量的例子:
  • >>>
  1. >>> yes_votes = 42_572_654
  2. >>> total_votes = 85_705_149
  3. >>> percentage = yes_votes / total_votes
  4. >>> '{:-9} YES votes {:2.2%}'.format(yes_votes, percentage)
  5. ' 42572654 YES votes 49.67%'
请注意Notice how the <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">yes_votes</font> 填充了空格并且只为负数添加了负号。 这个例子还打印了 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">percentage</font> 乘以 100 的结果,保留 2 个数位并带有一个百分号 (请参阅 格式规格迷你语言 了解详情)。
  • 最后,还可以用字符串切片和合并操作完成字符串处理操作,创建任何排版布局。字符串类型还支持将字符串按给定列宽进行填充,这些方法也很有用。
如果不需要花哨的输出,只想快速显示变量进行调试,可以用 repr() str() 函数把值转化为字符串。

str() 函数返回供人阅读的值,repr() 则生成适于解释器读取的值(如果没有等效的语法,则强制执行 SyntaxError)。对于没有支持供人阅读展示结果的对象, str() 返回与 repr() 相同的值。一般情况下,数字、列表或字典等结构的值,使用这两个函数输出的表现形式是一样的。字符串有两种不同的表现形式。

示例如下: >>>
  1. >>> s = 'Hello, world.'
  2. >>> str(s)
  3. 'Hello, world.'
  4. >>> repr(s)
  5. "'Hello, world.'"
  6. >>> str(1/7)
  7. '0.14285714285714285'
  8. >>> x = 10 * 3.25
  9. >>> y = 200 * 200
  10. >>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
  11. >>> print(s)
  12. The value of x is 32.5, and y is 40000...
  13. >>> # The repr() of a string adds string quotes and backslashes:
  14. ... hello = 'hello, world\n'
  15. >>> hellos = repr(hello)
  16. >>> print(hellos)
  17. 'hello, world\n'
  18. >>> # The argument to repr() may be any Python object:
  19. ... repr((x, y, ('spam', 'eggs')))
  20. "(32.5, 40000, ('spam', 'eggs'))"

string 模块包含 Template 类,提供了将值替换为字符串的另一种方法。该类使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">$x</font> 占位符,并用字典的值进行替换,但对格式控制的支持比较有限。

7.1.1. 格式化字符串字面值

格式化字符串字面值 (简称为 f-字符串)在字符串前加前缀 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f</font> <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">F</font>,通过 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">{expression}</font> 表达式,把 Python 表达式的值添加到字符串内。

格式说明符是可选的,写在表达式后面,可以更好地控制格式化值的方式。下例将 pi 舍入到小数点后三位: >>>
  1. >>> import math
  2. >>> print(f'The value of pi is approximately {math.pi:.3f}.')
  3. The value of pi is approximately 3.142.
<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">':'</font> 后传递整数,为该字段设置最小字符宽度,常用于列对齐: >>>
  1. >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
  2. >>> for name, phone in table.items():
  3. ... print(f'{name:10} ==> {phone:10d}')
  4. ...
  5. Sjoerd ==> 4127
  6. Jack ==> 4098
  7. Dcab ==> 7678
还有一些修饰符可以在格式化前转换值。 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'!a'</font> 应用 ascii() <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'!s'</font> 应用 str()<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'!r'</font> 应用 repr() >>>
  1. >>> animals = 'eels'
  2. >>> print(f'My hovercraft is full of {animals}.')
  3. My hovercraft is full of eels.
  4. >>> print(f'My hovercraft is full of {animals!r}.')
  5. My hovercraft is full of 'eels'.

<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">=</font> 说明符可被用于将一个表达式扩展为表达式文本、等号再加表达式求值结果的形式。

  1. >>> bugs = 'roaches'
  2. >>> count = 13
  3. >>> area = 'living room'
  4. >>> print(f'Debugging {bugs=} {count=} {area=}')
  5. Debugging bugs='roaches' count=13 area='living room'
请参阅 自说明型表达式 以了解 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">=</font> 说明符的更多信息。 有关这些格式说明的详情,请查看针对 格式规格迷你语言 的参考指南。

7.1.2. 字符串 format() 方法

str.format() 方法的基本用法如下所示:

  1. >>> print('We are the {} who say "{}!"'.format('knights', 'Ni'))
  2. We are the knights who say "Ni!"
花括号及之内的字符(称为格式字段)被替换为传递给 str.format() 方法的对象。花括号中的数字表示传递给 str.format() 方法的对象所在的位置。 >>>
  1. >>> print('{0} and {1}'.format('spam', 'eggs'))
  2. spam and eggs
  3. >>> print('{1} and {0}'.format('spam', 'eggs'))
  4. eggs and spam

str.format() 方法中使用关键字参数名引用值。

  1. >>> print('This {food} is {adjective}.'.format(
  2. ... food='spam', adjective='absolutely horrible'))
  3. This spam is absolutely horrible.
位置参数和关键字参数可以任意组合: >>>
  1. >>> print('The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
  2. ... other='Georg'))
  3. The story of Bill, Manfred, and Georg.
如果不想分拆较长的格式字符串,最好按名称引用变量进行格式化,不要按位置。这项操作可以通过传递字典,并用方括号 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'[]'</font> 访问键来完成。 >>>
  1. >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
  2. >>> print('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; '
  3. ... 'Dcab: {0[Dcab]:d}'.format(table))
  4. Jack: 4098; Sjoerd: 4127; Dcab: 8637678
这也可以通过将 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">table</font> 字典作为采用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">**</font> 标记的关键字参数传入来实现。 >>>
  1. >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
  2. >>> print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table))
  3. Jack: 4098; Sjoerd: 4127; Dcab: 8637678
与内置函数 vars() 一同使用时这种方式非常实用,它将返回一个包含所有局部变量的字典: >>>
  1. >>> table = {k: str(v) for k, v in vars().items()}
  2. >>> message = " ".join([f'{k}: ' + '{' + k +'};' for k in table.keys()])
  3. >>> print(message.format(**table))
  4. __name__: __main__; __doc__: None; __package__: None; __loader__: ...
举个例子,以下几行代码将产生一组整齐的数据列,包含给定的整数及其平方与立方: >>>
  1. >>> for x in range(1, 11):
  2. ... print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x))
  3. ...
  4. 1 1 1
  5. 2 4 8
  6. 3 9 27
  7. 4 16 64
  8. 5 25 125
  9. 6 36 216
  10. 7 49 343
  11. 8 64 512
  12. 9 81 729
  13. 10 100 1000

str.format() 进行字符串格式化的完整概述详见 格式字符串语法

7.1.3. 手动格式化字符串

下面是使用手动格式化方式实现的同一个平方和立方的表: >>>
  1. >>> for x in range(1, 11):
  2. ... print(repr(x).rjust(2), repr(x*x).rjust(3), end=' ')
  3. ... # Note use of 'end' on previous line
  4. ... print(repr(x*x*x).rjust(4))
  5. ...
  6. 1 1 1
  7. 2 4 8
  8. 3 9 27
  9. 4 16 64
  10. 5 25 125
  11. 6 36 216
  12. 7 49 343
  13. 8 64 512
  14. 9 81 729
  15. 10 100 1000
(注意,每列之间的空格是通过使用 print() 添加的:它总在其参数间添加空格。) 字符串对象的 str.rjust() 方法通过在左侧填充空格,对给定宽度字段中的字符串进行右对齐。同类方法还有 str.ljust() str.center() 。这些方法不写入任何内容,只返回一个新字符串,如果输入的字符串太长,它们不会截断字符串,而是原样返回;虽然这种方式会弄乱列布局,但也比另一种方法好,后者在显示值时可能不准确(如果真的想截断字符串,可以使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">x.ljust(n)[:n]</font> 这样的切片操作 。) 另一种方法是 str.zfill() ,该方法在数字字符串左边填充零,且能识别正负号: >>>
  1. >>> '12'.zfill(5)
  2. '00012'
  3. >>> '-3.14'.zfill(7)
  4. '-003.14'
  5. >>> '3.14159265359'.zfill(5)
  6. '3.14159265359'

7.1.4. 旧式字符串格式化方法

% 运算符 (求余) 也可被用于字符串格式化。 给定 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">format</font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);"> </font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">%</font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);"> </font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">values</font> (其中 format 是一个字符串),则 format 中的 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">%</font> 转换占位符将以 values 中的零个或多个元素来替换。 此操作通常称为字符串插值。 例如: >>>
  1. >>> import math
  2. >>> print('The value of pi is approximately %5.3f.' % math.pi)
  3. The value of pi is approximately 3.142.

printf 风格的字符串格式化 小节介绍更多相关内容。

7.2. 读写文件

open() 返回一个 file object ,最常使用的是两个位置参数和一个关键字参数:<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">open(filename,</font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);"> </font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">mode,</font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);"> </font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">encoding=None)</font>

  1. >>> f = open('workfile', 'w', encoding="utf-8")
第一个实参是文件名字符串。第二个实参是包含描述文件使用方式字符的字符串。mode 的值包括 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'r'</font> ,表示文件只能读取;<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'w'</font> 表示只能写入(现有同名文件会被覆盖);<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'a'</font> 表示打开文件并追加内容,任何写入的数据会自动添加到文件末尾。<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'r+'</font> 表示打开文件进行读写。mode 实参是可选的,省略时的默认值为 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'r'</font> 通常情况下,文件是以 text mode 打开的,也就是说,你从文件中读写字符串,这些字符串是以特定的 encoding 编码的。如果没有指定 encoding ,默认的是与平台有关的(见 open() )。因为 UTF-8 是现代事实上的标准,除非你知道你需要使用一个不同的编码,否则建议使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">encoding="utf-8"</font> 。在模式后面加上一个 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'b'</font> ,可以用 binary mode 打开文件。二进制模式的数据是以 bytes 对象的形式读写的。在二进制模式下打开文件时,你不能指定 encoding 在文本模式下读取文件时,默认把平台特定的行结束符(Unix 上为 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">\n</font>, Windows 上为 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">\r\n</font>)转换为 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">\n</font>。在文本模式下写入数据时,默认把 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">\n</font> 转换回平台特定结束符。这种操作方式在后台修改文件数据对文本文件来说没有问题,但会破坏 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">JPEG</font> <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">EXE</font> 等二进制文件中的数据。注意,在读写此类文件时,一定要使用二进制模式。 在处理文件对象时,最好使用 with 关键字。优点是,子句体结束后,文件会正确关闭,即便触发异常也可以。而且,使用 <font style="color:rgb(0, 0, 0);">with</font> 相比等效的 try-finally 代码块要简短得多: >>>
  1. >>> with open('workfile', encoding="utf-8") as f:
  2. ... read_data = f.read()
  3. >>> # We can check that the file has been automatically closed.
  4. >>> f.closed
  5. True
如果没有使用 with 关键字,则应调用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.close()</font> 关闭文件,即可释放文件占用的系统资源。


调用 <font style="background-color:rgb(239, 194, 194);">f.write()</font> 时,未使用 <font style="background-color:rgb(239, 194, 194);">with</font> 关键字,或未调用 <font style="background-color:rgb(239, 194, 194);">f.close()</font>,即使程序正常退出,也可能 导致 <font style="background-color:rgb(239, 194, 194);">f.write()</font> 的参数没有完全写入磁盘。

通过 with 语句,或调用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.close()</font> 关闭文件对象后,再次使用该文件对象将会失败。 >>>
  1. >>> f.close()
  2. >>> f.read()
  3. Traceback (most recent call last):
  4. File "<stdin>", line 1, in <module>
  5. ValueError: I/O operation on closed file.

7.2.1. 文件对象的方法

本节下文中的例子假定已创建 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f</font> 文件对象。

<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.read(size)</font> 可用于读取文件内容,它会读取一些数据,并返回字符串(文本模式),或字节串对象(在二进制模式下)。 size 是可选的数值参数。省略 size size 为负数时,读取并返回整个文件的内容;文件大小是内存的两倍时,会出现问题。size 取其他值时,读取并返回最多 size 个字符(文本模式)或 size 个字节(二进制模式)。如已到达文件末尾,<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.read()</font> 返回空字符串(<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">''</font>)。

  1. >>> f.read()
  2. 'This is the entire file.\n'
  3. >>> f.read()
  4. ''

<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.readline()</font> 从文件中读取单行数据;字符串末尾保留换行符(<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">\n</font>),只有在文件不以换行符结尾时,文件的最后一行才会省略换行符。这种方式让返回值清晰明确;只要 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.readline()</font> 返回空字符串,就表示已经到达了文件末尾,空行使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'\n'</font> 表示,该字符串只包含一个换行符。

  1. >>> f.readline()
  2. 'This is the first line of the file.\n'
  3. >>> f.readline()
  4. 'Second line of the file\n'
  5. >>> f.readline()
  6. ''
从文件中读取多行时,可以用循环遍历整个文件对象。这种操作能高效利用内存,快速,且代码简单: >>>
  1. >>> for line in f:
  2. ... print(line, end='')
  3. ...
  4. This is the first line of the file.
  5. Second line of the file
如需以列表形式读取文件中的所有行,可以用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">list(f)</font> <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.readlines()</font>

<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.write(string)</font> string 的内容写入文件,并返回写入的字符数。

  1. >>> f.write('This is a test\n')
  2. 15
写入其他类型的对象前,要先把它们转化为字符串(文本模式)或字节对象(二进制模式): >>>
  1. >>> value = ('the answer', 42)
  2. >>> s = str(value) # convert the tuple to string
  3. >>> f.write(s)
  4. 18

<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.tell()</font> 返回整数,给出文件对象在文件中的当前位置,表示为二进制模式下时从文件开始的字节数,以及文本模式下的意义不明的数字。

<font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.seek(offset,</font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);"> </font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">whence)</font> 可以改变文件对象的位置。通过向参考点添加 offset 计算位置;参考点由 whence 参数指定。 whence 值为 0 时,表示从文件开头计算,1 表示使用当前文件位置,2 表示使用文件末尾作为参考点。省略 whence 时,其默认值为 0,即使用文件开头作为参考点。

  1. >>> f = open('workfile', 'rb+')
  2. >>> f.write(b'0123456789abcdef')
  3. 16
  4. >>> f.seek(5) # Go to the 6th byte in the file
  5. 5
  6. >>> f.read(1)
  7. b'5'
  8. >>> f.seek(-3, 2) # Go to the 3rd byte before the end
  9. 13
  10. >>> f.read(1)
  11. b'd'
在文本文件(模式字符串未使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">b</font> 时打开的文件)中,只允许相对于文件开头搜索(使用 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">seek(0,</font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);"> </font><font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">2)</font> 搜索到文件末尾是个例外),唯一有效的 offset 值是能从 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f.tell()</font> 中返回的,或 0。其他 offset 值都会产生未定义的行为。 文件对象还有一些额外的方法,如使用频率较低的 isatty() truncate() 等;有关文件对象的完整指南请查阅标准库参考。

7.2.2. 使用 json 保存结构化数据

字符串可以很容易地写入文件或从文件中读取。 数字则更麻烦一些,因为 read() 方法只返回字符串,而字符串必须传给 int() 这样的函数,它接受 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">'123'</font> 这样的字符串并返回其数值 123。 当你想要保存嵌套列表和字典等更复杂的数据类型时,手动执行解析和序列化操作将会变得非常复杂。 Python 允许你使用流行的数据交换格式 JSON (JavaScript Object Notation),而不是让用户持续编写和调试代码来将复杂的数据类型存入文件中。 标准库模块 json 可以接受带有层级结构的 Python 数据,并将其转换为字符串表示形式;这个过程称为 serializing。 根据字符串表示形式重建数据则称为 deserializing。 在序列化和反序列化之间,用于代表对象的字符串可以存储在文件或数据库中,或者通过网络连接发送到远端主机。


JSON 格式通常用于现代应用程序的数据交换。程序员早已对它耳熟能详,可谓是交互操作的不二之选。

只需一行简单的代码即可查看某个对象的 JSON 字符串表现形式: >>>
  1. >>> import json
  2. >>> x = [1, 'simple', 'list']
  3. >>> json.dumps(x)
  4. '[1, "simple", "list"]'

dumps() 函数还有一个变体, dump() ,它只将对象序列化为 text file 。因此,如果 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f</font> text file 对象,可以这样做:

  1. json.dump(x, f)
要再次解码对象,如果 <font style="color:rgb(0, 0, 0);background-color:rgb(236, 240, 243);">f</font> 是已打开、供读取的 binary file text file 对象:
  1. x = json.load(f)


JSON文件必须以UTF-8编码。当打开JSON文件作为一个 text file 用于读写时,使用 <font style="background-color:rgb(214, 214, 214);">encoding="utf-8"</font>

这种简单的序列化技术可以处理列表和字典,但在 JSON 中序列化任意类的实例,则需要付出额外努力。json 模块的参考包含对此的解释。


pickle - 封存模块

JSON 不同,pickle 是一种允许对复杂 Python 对象进行序列化的协议。因此,它为 Python 所特有,不能用于与其他语言编写的应用程序通信。默认情况下它也是不安全的:如果解序化的数据是由手段高明的攻击者精心设计的,这种不受信任来源的 pickle 数据可以执行任意代码。