bytes类型是python3新增的一种数据类型,用来代表字节串。字符串由多个字符串构成,以字符为单位进行操作,字节串由多个字节构成,以字节为单位进行操作。他们除了操作单元不同,其他的用法基本相同,bytes类型数据也是不可变对象。
bytes类型数据的应用场景
- 计算MD5
import hashlib
string = "123456"
m = hashlib.md5() # 创建md5对象
str_bytes = string.encode(encoding='utf-8')
print(type(str_bytes))
m.update(str_bytes) # update方法只接收bytes类型数据作为参数
str_md5 = m.hexdigest() # 得到散列后的字符串
print('MD5散列前为 :' + string)
print('MD5散列后为 :' + str_md5)
在计算md5值的过程中,有一步要使用update方法,该方法只接受bytes类型数据。
- 二进制读写文件
f = open('data', 'wb')
text = '二进制写文件'
text_bytes = text.encode('utf-8')
f.write(text_bytes)
f.close()
f = open('data', 'rb')
data = f.read()
print(data, type(data))
str_data = data.decode('utf-8')
print(str_data)
f.close()
使用二进制方式读写文件时,均要用到bytes类型,二进制写文件时,write方法只接受bytes类型数据,因此需要先将字符串转成bytes类型数据;读取二进制文件时,read方法返回的是bytes类型数据,使用decode方法可将bytes类型转成字符串。
- socket编程
import socket
url = 'www.zhangdongshengtech.com'
port = 80
# 创建TCP socket
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 连接服务端
sock.connect((url, port))
# 创建请求消息头
request_url = 'GET /article-types/6/ HTTP/1.1\r\nHost: www.zhangdongshengtech.com\r\nConnection: close\r\n\r\n'
print(request_url)
# 发送请求
sock.send(request_url.encode())
response = b''
# 接收返回的数据
rec = sock.recv(1024)
while rec:
response += rec
rec = sock.recv(1024)
print(response.decode())
print(type(response))
使用socket时,不论是发送还是接收数据,都需要使用bytes类型数据。
字符串型和bytes型的相互转换
将字符串转成bytes类型数据需要使用encode方法,将bytes类型数据转换成字符串,需要使用decode方法,转换方法可以指定编码
string = "爱我中华"
bstr = string.encode(encoding='utf-8')
print(bstr, type(bstr))
string = bstr.decode(encoding='utf-8')
print(string, type(string))