从 Python 中的字符串中删除 ‘b’ 前缀
使用 bytes.decode()
方法通过将字节对象转换为字符串来删除字节对象中的 b 前缀。 decode()
方法将返回从给定字节对象解码的字符串,并将删除 b 前缀。
my_bytes = 'zadmei.com'.encode('utf-8')
print(my_bytes) # 👉️ b'zadmei.com'
print(type(my_bytes)) # 👉️ <class 'bytes'>
string = my_bytes.decode('utf-8')
print(string) # 👉️ zadmei.com
print(type(string)) # 👉️ <class 'str'>
字节对象总是以 b''
为前缀,因此要删除前缀,我们必须将字节转换为字符串。
bytes.decode
方法返回从给定字节解码的字符串。 默认编码是utf-8。
相反,str.encode
方法将字符串的编码版本作为字节对象返回。 默认编码是utf-8。
my_bytes = 'zadmei.com'.encode('utf-8')
print(my_bytes) # 👉️ b'zadmei.com'
string = my_bytes.decode('utf-8')
print(string) # 👉️ zadmei.com
编码是将字符串转换为字节对象的过程,解码是将字节对象转换为字符串的过程。
换句话说,我们可以使用 str.encode()
方法从 str 转到 bytes,使用 bytes.decode()
方法从 bytes 转到 str。
或者,我们可以使用 str()
类。
使用 str() 从字符串中删除 ‘b’ 前缀
使用 str()
类从字节对象中删除 b 前缀,例如 string = str(my_bytes, encoding='utf-8')
。 str()
函数将通过将字节对象转换为字符串来删除 b 前缀。
my_bytes = bytes('zadmei.com', encoding='utf-8')
print(my_bytes) # 👉️ b'zadmei.com'
print(type(my_bytes)) # 👉️ <class 'bytes'>
string = str(my_bytes, encoding='utf-8')
print(string) # 👉️ zadmei.com
print(type(string)) # 👉️ <class 'str'>
str
类返回给定对象的字符串版本。 如果未提供对象,则该类返回一个空字符串。
使用 bytes
类的语法是相同的。 该类返回一个字节对象,因此添加了 b 前缀。
我们在示例中使用了
utf-8
编码。utf-8
编码能够在 Unicode 中编码超过一百万个有效字符代码点。
我们可以在官方文档的此表中查看所有标准编码。
一些常见的编码是 ascii
、latin-1
和 utf-32
。
解码字节对象时,我们必须使用与将字符串编码为字节对象相同的编码。
如果出于某种原因,我们需要以一种怪异的方式删除 b 前缀,请尝试使用带有字符串切片的 repr()
函数。
my_bytes = bytes('zadmei.com', encoding='utf-8')
print(my_bytes) # 👉️ b'zadmei.com'
string = repr(my_bytes)[2:-1]
print(string) # 👉️ zadmei.com
repr()
函数返回对象的规范字符串表示形式。
my_bytes = bytes('zadmei.com', encoding='utf-8')
print(my_bytes) # 👉️ b'zadmei.com'
print(repr(my_bytes)) # 👉️ b'zadmei.com'
一旦我们将 bytes
对象转换为字符串,我们就可以使用字符串切片来删除 b 前缀。
字符串切片的语法是 my_str[start:stop:step]
。
start
索引是包含性的,而stop
索引是排他性的(直到,但不包括)。
Python 索引是从零开始的,因此字符串中的第一个字符的索引为 0,最后一个字符的索引为 -1 或 len(my_str) - 1
。
切片 my_str[2:-1]
从索引 2 开始,一直到但不包括字符串中的最后一个字符。
我们基本上排除了 b 字符和引号。