在 Python 中逐字符读取文件

Python 中逐个字符读取文件:

  1. 模式打开文件。
  2. 使用 file.read(1) 方法在 while 循环中逐字符读取文件。
  3. 使用 break 语句在文件末尾退出循环。
with open('example.txt', 'r', encoding='utf-8') as file:
    while True:
        char = file.read(1)

        if not char:
            print('Reached end of file')
            break

        print(char)

代码示例假定我们在同一目录中有一个 example.txt 文件。

example.txt

apple

我们使用 with 语句以读取模式打开文件。

该语句会自动为我们关闭文件。

我们使用 while True 循环进行迭代,直到到达文件末尾。

file.read() 方法接受一个 size 参数,该参数表示要从文件中读取的字符数。

如果我们正在以二进制模式读取文件,则 size 表示要从文件中读取的字节大小。

我们将 size 参数设置为 1 以逐字符读取文件。

如果已到达文件末尾,则 file.read() 方法返回一个空字符串。

在每次迭代中,我们使用 if 语句来检查是否已到达文件末尾。

如果条件满足,我们使用break语句退出while循环。

break 语句跳出最里面的 for 或 while 循环。

如果需要将单个字符添加到列表中,可以使用 append() 方法。

with open('example.txt', 'r', encoding='utf-8') as file:
    characters = []

    while True:
        char = file.read(1)

        if not char:
            print('Reached end of file')
            break

        characters.append(char)
        print(char)

    print(characters)  # 👉️ ['a', 'p', 'p', 'l', 'e']

在 while 循环的每次迭代中,我们将当前字符添加到列表中。

list.append() 方法将一个项目添加到列表的末尾。

或者,我们可以使用 for 循环。


使用 for 循环逐个字符读取文件

逐个字符读取文件:

  1. 模式打开文件。
  2. 使用 for 循环遍历文件。
  3. 使用嵌套的 for 循环遍历每一行。
  4. 嵌套的 for 循环将逐字符读取文件。
with open('example.txt', 'r', encoding='utf-8') as file:
    for line in file:
        for char in line:
            print(char)

代码示例假定我们在同一目录中有一个 example.txt 文件。

example.txt

apple

我们使用了一个 for 循环来遍历文件中的行集合。

嵌套的 for 循环用于遍历每一行。

char 变量被分配到每个字符。

使用这种方法时,我们将整行存储在内存中,如果您的文件有很长的行,这可能不适合。

第一个示例中的 while 循环没有这个问题。

另一方面,当使用嵌套的 for 循环时,我们不必手动跳出循环,因为它是自动为我们完成的。