在 C# 中压缩和解压缩字符串

本文将演示我们如何将压缩方法应用于 System.IO 文件系统。

Compression 命名空间可以压缩和解压缩字符串的值。压缩这些值应该会导致字节大小显着减少。

压缩的定义

在物理学中,压缩是指由向内作用在质量上的力导致的尺寸减小。当我们谈论数据压缩时,我们指的是将数据更改为更紧凑的格式,而不会造成任何明显的内容丢失。

数据压缩是使用算法将已经存在的信息编码为尽可能少的比特的过程。各种算法的功效有不同程度的不同。

尽管如此,它们通常会在压缩数据所需的时间或 CPU 所需的处理能力方面做出妥协。

C# 中的 .NET 数据压缩算法

有许多替代压缩方法,但为了讨论,我们将集中讨论 GZip。尽管使用诸如 SharpZipLib 之类的第三方库是可行的,但我们将使用 .NET Framework 原生的 GZipStream 类并在 System.IO.Compression 命名空间中找到。

此外,我们将强调压缩和解压缩字符串数据;处理其他类型的过程,例如字节数组和流,将有所修改。

使用 GZipC# 中压缩字符串

GZipStream 的最基本实现要求用户提供底层流和压缩选项作为输入。压缩模式决定你是要压缩还是解压缩数据;底层流根据压缩方法而改变。

下面的代码使用内存流作为我们的底层输出流。输出流被包装在一个 GZipStream 容器中。

当我们将输入数据发送到 GZipStream 时,数据会沿管道以压缩形式传输到输出流。我们可以通过将 Write 操作放在其自己的 using 块中来保证数据已被清理。

save() 方法代码可在本文末尾的源代码中找到。

public static byte[] Compress(string str) {
    var bytes = Encoding.UTF8.GetBytes(str);
    using (var msi = new MemoryStream(bytes))
    using (var memoryStream = new MemoryStream()) {
        using (var gZipStream = new GZipStream(memoryStream, CompressionMode.Compress)) {
            save(msi, gZipStream);
        }
        return memoryStream.ToArray();
    }
}

C# 中使用 GZip 解压缩字符串

解压数据时,被解压的流成为输入流。GZipStream 将继续包含它,但现在将反转流程,以便从 GZipStream 读取数据会将压缩数据转换为未压缩数据。

CompressionMode.Decompress 模式用于解压缩字符串。

public static string Decompress(byte[] bytes) {
    using (var msi = new MemoryStream(bytes))
    using (var memoryStream = new MemoryStream()) {
        using (var gZipStream = new GZipStream(msi, CompressionMode.Decompress)) {
            save(gZipStream, memoryStream);
        }
        return Encoding.UTF8.GetString(memoryStream.ToArray());
    }
}

C# 中压缩和解压缩字符串的完整源代码

using System;
using System.IO;
using System.IO.Compression;
using System.Text;
class HelloWorld {
    public static void save(Stream source, Stream destination) {
        byte[] bytes = new byte[4096];
        int count;
        while ((count = source.Read(bytes, 0, bytes.Length)) != 0) {
            destination.Write(bytes, 0, count);
        }
    }
    public static byte[] Compress(string str) {
        var bytes = Encoding.UTF8.GetBytes(str);
        using (var msi = new MemoryStream(bytes))
            using (var memoryStream = new MemoryStream()) {
                using (var gZipStream = new GZipStream(memoryStream, CompressionMode.Compress)) {
                    save(msi, gZipStream);
                }
                return memoryStream.ToArray();
            }
    }
    public static string Decompress(byte[] bytes) {
        using (var msi = new MemoryStream(bytes))
        using (var memoryStream = new MemoryStream()) {
            using (var gZipStream = new GZipStream(msi, CompressionMode.Decompress)) {
                save(gZipStream, memoryStream);
            }
            return Encoding.UTF8.GetString(memoryStream.ToArray());
        }
    }
    static void Main(string[] args) {
        byte[] string1 = Compress("stringstringstringstringstringstringstringstring");
        Console.WriteLine("Zipped Size: "+string1.Length + " bytes");
        string string2 = Decompress(string1);
        Console.WriteLine("Unzipped Size: "+string2.Length + " bytes");
    }
}

输出:

Zipped Size: 29 bytes
Unzipped Size: 48 bytes