在Python中实现树的可视化

由于许多不同的原因,决策树是一种常见的监督学习技术。决策树的优点包括:我们可以将其用于分类和回归,它们不需要特征缩放,而且决策树可以直接阅读。

本文演示了Python的Graphviz 来显示决策树。

在Python中实现树的可视化

Graphviz图形可视化是一种开源软件,它将结构信息表现为抽象图形和网络的图示。例如,Graphviz 在数据科学中的一个用途是将决策树可视化。

安装Graphviz

安装Graphviz ,通常需要将点状文件转换成图像文件(PNG、JPG、SVG等),这取决于你的操作系统和其他一些因素。

如果你收到错误dot: command not found ,有可能你也没有安装dot 语言。

要安装Graphviz ,请运行以下程序。

  1. Windows:

    winget install graphviz
    
  2. Mac:

    brew install graphviz
    
  3. Ubuntu:

    sudo apt install graphviz
    

关于更多的安装程序,如可执行文件的手动下载和其他版本,你可以去看官方的Graphviz 文档。

安装完毕后,验证你的Graphviz 安装目录内是否有dot.exe 文件,因为我们稍后将需要它来生成可视化的dot 文件。一般来说,默认的安装路径是在C:Program FilesGraphvizbin

将一棵树转换成一个点状文件

Graphviz 的要求之一是dot 格式的树,但首先,我们需要一个样本树。我们可以去看这篇关于树在Python中如何工作的文章,或者我们可以使用下面的命令来方便地浏览这篇文章。

示例代码:

tree = 'digraph G {Hello->World}'
open('sample.dot','w').write(tree)

上面的代码片段将一个简单的Hello->World 2个节点的树形结构写到了sample.dot 文件中,这就满足了我们的要求。然而,如果我们想要一个更复杂的树,我们可以使用这个在线的树制造商,也可以方便地让我们直接下载dot 格式。

将点状文件转换为图像

现在我们有了我们的dot 文件,我们将需要使用dot 应用程序在Graphviz 内运行它。早些时候,我们要求你注意我们的Graphviz dot.exe 路径,因为我们将在这一节中需要它。

使用命令提示符内的命令cd ,进入dot.exe 路径。

cd C:Program FilesGraphvizbin

我们这样做是因为,大多数时候,Graphviz 的安装并不包括我们环境变量中的dot ,所以我们可以使用dot.exe 来运行下面的代码片段。

# dot.exe -Tpng <path of the dot file> -o <destination path of the png file>
dot.exe -Tpng C:PSsample.dot -o C:PSsample.png

一旦执行,这应该会产生使用我们的树在PNG 格式的可视化表示。

在Python中实现树的可视化

关于dot 参数的完整信息,我们可以去看dot 命令的官方文档。