C 语言中使用 strtok 函数

本文将演示如何在 C 语言中使用 strtok 函数的多种方法。

使用 strtok 函数对给定定界符的字符串进行标记化处理

strtok 函数是 C 标准库的一部分,定义在 <string.h> 头文件中。它将给定的字符串分解成由指定定界符分割的标记。strtok 需要两个参数-第一个参数是指向要标记化的字符串的指针,第二个参数是定界符字符串。请注意,定界符字符串是作为一组字符来处理的,表示单独的定界符。函数返回指向一个空结束的字符串的指针,它代表下一个标记。不过要注意的是,当同一个字符串被多次调用 strtok 进行解析时,在第一次调用函数后,第一个指针参数必须是 NULL

#include <stdio.h>#include <stdlib.h>#include <string.h>int main(int argc, char *argv[])
{
    char *str1, *token;
    int j;
    if (argc != 3) {
        fprintf(stderr, "Usage: %s string delim\n",
                argv[0]);
        exit(EXIT_FAILURE);
    }
    for (j = 1, str1 = argv[1]; ; j++, str1 = NULL) {
        token = strtok(str1, argv[2]);
        if (token == NULL)
            break;
        printf("%d: %s\n", j, token);
    }
    exit(EXIT_SUCCESS);
}

示例命令:

./program "Temporary string to be parsed" " "

输出:

1: Temporary
2: string
3: to
4: be
5: parsed

使用 strtok_r 函数对带有两个定界符的字符串进行标记化

另外,还有另一个版本的函数,叫做 strtok_r,它是一个重入式变体,更适合多线程程序。这两个函数都会修改作为第一个参数传递的字符串,而且它们不能对常量字符串进行修改。下面的示例代码将给定的字符串 token 化为一个两层的层次结构。第一个层次由作为程序第二个参数传递的定界符上的标记组成。内部循环将每个标记从初始标记化中分割出来,最后,程序将结果输出到控制台。

#include <stdio.h>#include <stdlib.h>#include <string.h>int main(int argc, char *argv[])
{
    char *str1, *str2, *token, *subtoken;
    char *saveptr1, *saveptr2;
    int j;
    if (argc != 4) {
        fprintf(stderr, "Usage: %s string delim subdelim\n",
                argv[0]);
        exit(EXIT_FAILURE);
    }
    for (j = 1, str1 = argv[1]; ; j++, str1 = NULL) {
        token = strtok_r(str1, argv[2], &saveptr1);
        if (token == NULL)
            break;
        printf("%d: %s\n", j, token);
        for (str2 = token; ; str2 = NULL) {
            subtoken = strtok_r(str2, argv[3], &saveptr2);
            if (subtoken == NULL)
                break;
            printf(" --> %s\n", subtoken);
        }
    }
    exit(EXIT_SUCCESS);
}

示例命令:

./program "Temporary string to be parsed" " " "aeio"

输出:

1: Temporary
 --> T
 --> mp
 --> r
 --> ry
2: string
 --> str
 --> ng
3: to
 --> t
4: be
 --> b
5: parsed
 --> p
 --> rs
 --> d