我们在前边学习过用relplot()、scatterplot()、lineplot()等来揭示变量间的关系,其中relplot()是整合了后两者的更高级的API接口。
但是在relplot()中,我们主要是揭示在各个语义(semantic)变量的影响下,某两个变量之间的关系是如何发生变化的。也就是说,它的核心还是揭示两个变量之间的关系,只不过是加入了几个额外变量的影响因素在里边。
那么问题来了,我们经常会遇到有大量变量的数据集,这时候假如我们想要观察每两个变量之间的关系,应该怎么办?
一个很笨的方法就是循环绘制任意两两变量之间的关系,但是这样的话未免太过繁琐。seaborn为我们提供了一个非常方便的函数pairplot(),仅仅需要一行代码,我们就可以完成上述任务。接下来我们就看一下吧。
我们先导入必要的库和数据:
import seaborn as sns sns.set(style="ticks") df = sns.load_dataset("iris")
这三行代码很简单,我们先导入了seaborn,然后设置图形样式为带刻度标记的风格,然后我们导入了iris数据集。
接下来就是见证奇迹的时候了:
sns.pairplot(df, hue="species")
看下效果:
还不错呢,美观而且全面!
在这里,我们给位置参数data传入pandas DataFrame格式的数据,给hue参数传入标签的列名,这样就可以用不同的颜色区分出不同的分类。短短的一行代码几十个字符,一幅称心的图形就出来了,满意吗?
事实上,基于PairGrid类的pairplot()远比上边展示的强大,它甚至支持我们自定义的绘图函数。想要了解更多,可以去看我的《7天学会Python最佳可视化工具Seaborn》系列和《从零开始学Python可视化》系列,那里有更加详细和全面的讲解哦!
本文暂时没有评论,来添加一个吧(●'◡'●)