从 Python 中的字符串中删除 ‘b’ 前缀

使用 bytes.decode() 方法通过将字节对象转换为字符串来删除字节对象中的 b 前缀。 decode() 方法将返回从给定字节对象解码的字符串,并将删除 b 前缀。

my_bytes = 'zadmei.com'.encode('utf-8')
print(my_bytes)  # 👉️ b'zadmei.com'
print(type(my_bytes))  # 👉️ <class 'bytes'>


string = my_bytes.decode('utf-8')
print(string)  # 👉️ zadmei.com
print(type(string))  # 👉️ <class 'str'>

字节对象总是以 b'' 为前缀,因此要删除前缀,我们必须将字节转换为字符串。

bytes.decode 方法返回从给定字节解码的字符串。 默认编码是utf-8。

相反,str.encode 方法将字符串的编码版本作为字节对象返回。 默认编码是utf-8。

my_bytes = 'zadmei.com'.encode('utf-8')
print(my_bytes)  # 👉️ b'zadmei.com'

string = my_bytes.decode('utf-8')
print(string)  # 👉️ zadmei.com

编码是将字符串转换为字节对象的过程,解码是将字节对象转换为字符串的过程。

换句话说,我们可以使用 str.encode() 方法从 str 转到 bytes,使用 bytes.decode() 方法从 bytes 转到 str。

或者,我们可以使用 str() 类。

使用 str() 从字符串中删除 ‘b’ 前缀

使用 str() 类从字节对象中删除 b 前缀,例如 string = str(my_bytes, encoding='utf-8')。 str() 函数将通过将字节对象转换为字符串来删除 b 前缀。

my_bytes = bytes('zadmei.com', encoding='utf-8')
print(my_bytes)  # 👉️ b'zadmei.com'
print(type(my_bytes))  # 👉️ <class 'bytes'>


string = str(my_bytes, encoding='utf-8')
print(string)  # 👉️ zadmei.com
print(type(string))  # 👉️ <class 'str'>

str 类返回给定对象的字符串版本。 如果未提供对象,则该类返回一个空字符串。

使用 bytes 类的语法是相同的。 该类返回一个字节对象,因此添加了 b 前缀。

我们在示例中使用了 utf-8 编码。 utf-8 编码能够在 Unicode 中编码超过一百万个有效字符代码点。

我们可以在官方文档的此表中查看所有标准编码。

一些常见的编码是 ascii 、latin-1 和 utf-32

解码字节对象时,我们必须使用与将字符串编码为字节对象相同的编码。

如果出于某种原因,我们需要以一种怪异的方式删除 b 前缀,请尝试使用带有字符串切片的 repr() 函数。

my_bytes = bytes('zadmei.com', encoding='utf-8')
print(my_bytes)  # 👉️ b'zadmei.com'

string = repr(my_bytes)[2:-1]
print(string)  # 👉️ zadmei.com

repr() 函数返回对象的规范字符串表示形式。

my_bytes = bytes('zadmei.com', encoding='utf-8')
print(my_bytes)  # 👉️ b'zadmei.com'

print(repr(my_bytes)) # 👉️ b'zadmei.com'

一旦我们将 bytes 对象转换为字符串,我们就可以使用字符串切片来删除 b 前缀。

字符串切片的语法是 my_str[start:stop:step]

start 索引是包含性的,而 stop 索引是排他性的(直到,但不包括)。

Python 索引是从零开始的,因此字符串中的第一个字符的索引为 0,最后一个字符的索引为 -1 或 len(my_str) - 1

切片 my_str[2:-1] 从索引 2 开始,一直到但不包括字符串中的最后一个字符。

我们基本上排除了 b 字符和引号。