由于字符串文本信息在文件中以utf-8或者gbk编码进行保存的,转化为unicode编码时,自动显示为字符串信息。如果你以正常读取方式读数据,只要声明了编码格式,读取到的数据就是正常的字符串。那么二进制读取有什么用呢?当你不需要查看数据,需要把这边的数据复制到另一个地方时,以二进制读取它会把utf-8或者gbk编码原封不动的照抄搬运到另一个地方,这样省去了utf-8转unicode(查看)再转utf-8的时间.
一.文本信息以二进制方式读取
语法格式:
file = open(filepath,mode)
data = file.read()
file.close()
# 第一步,首先是打开文件 这个不用导入模块file = open(filepath , mode='rb')# 第二步,把这个utf-8直接当成二进制读入到内存,不用管什么意思data = file.read()# 第三部,关闭保存文件file.close()# 至于前面那个data,后面你想用于保存在另一个文件之类的,都是可以的# 如果你想打印出来看,本身是二进制的,你想看字符串,得转化成utf-8print(data.decode('utf-8'))
