在Python中实现树的可视化
由于许多不同的原因,决策树是一种常见的监督学习技术。决策树的优点包括:我们可以将其用于分类和回归,它们不需要特征缩放,而且决策树可以直接阅读。
本文演示了Python的Graphviz
来显示决策树。
在Python中实现树的可视化
Graphviz
图形可视化是一种开源软件,它将结构信息表现为抽象图形和网络的图示。例如,Graphviz
在数据科学中的一个用途是将决策树可视化。
安装Graphviz
包
安装Graphviz
,通常需要将点状文件转换成图像文件(PNG、JPG、SVG等),这取决于你的操作系统和其他一些因素。
如果你收到错误dot: command not found
,有可能你也没有安装dot
语言。
要安装Graphviz
,请运行以下程序。
-
Windows:
winget install graphviz
-
Mac:
brew install graphviz
-
Ubuntu:
sudo apt install graphviz
关于更多的安装程序,如可执行文件的手动下载和其他版本,你可以去看官方的Graphviz
文档。
安装完毕后,验证你的Graphviz
安装目录内是否有dot.exe
文件,因为我们稍后将需要它来生成可视化的dot
文件。一般来说,默认的安装路径是在C:Program FilesGraphvizbin
。
将一棵树转换成一个点状文件
Graphviz
的要求之一是dot
格式的树,但首先,我们需要一个样本树。我们可以去看这篇关于树在Python中如何工作的文章,或者我们可以使用下面的命令来方便地浏览这篇文章。
示例代码:
tree = 'digraph G {Hello->World}'
open('sample.dot','w').write(tree)
上面的代码片段将一个简单的Hello->World
2个节点的树形结构写到了sample.dot
文件中,这就满足了我们的要求。然而,如果我们想要一个更复杂的树,我们可以使用这个在线的树制造商,也可以方便地让我们直接下载dot
格式。
将点状文件转换为图像
现在我们有了我们的dot
文件,我们将需要使用dot
应用程序在Graphviz
内运行它。早些时候,我们要求你注意我们的Graphviz
dot.exe
路径,因为我们将在这一节中需要它。
使用命令提示符内的命令cd
,进入dot.exe
路径。
cd C:Program FilesGraphvizbin
我们这样做是因为,大多数时候,Graphviz
的安装并不包括我们环境变量中的dot
,所以我们可以使用dot.exe
来运行下面的代码片段。
# dot.exe -Tpng <path of the dot file> -o <destination path of the png file>
dot.exe -Tpng C:PSsample.dot -o C:PSsample.png
一旦执行,这应该会产生使用我们的树在PNG
格式的可视化表示。
关于dot
参数的完整信息,我们可以去看dot
命令的官方文档。