在Python的绘图模块里,最基础的绘图库是Matplotlib。Seaborn库是Matplotlib的基础上开出来,它主要用来画统计类图表的库。它的图表比Matplotlib好看且代码更少。
我们将图表的分为四类:比较关系、联系关系,分布关系、构成关系。- 比较关系的比较对象,不同类别同一指标的比较(柱形图),某个指标不同时间段的比较(折线图),这两种是单一维度的经典运用。也可以用热力图进行多维度的对比(常见二维),本质是比大小。热力图用的是颜色,柱形图用的是柱子高低,折线图用的是点的高低。
- 联系关系的图表,是两个数值型,可计算、有大小的字段进行比较,判断变量间相关性。常见是散点图,实际上不局限于2个。也可以如3个,气泡图。
- 分布关系的图表,把一组数据堪称一个整体,观察内部数据的分布情况,里面的数据主要集中情况,最小值、最大值、众数等等,向内看。
- 构成关系的图表,反映部分占整体的情况。以饼图最有代表性,漏斗图、矩阵树形图都是其变形。
Seaborn的表现在联系、分布类图表上,有很不错的表现。
以散点图为例,seaborn允许在散点图的基础上进行回归,画出趋势线。还提供了sns.replot()方法既可以画散点图和折线图,还可以画一群散点图散点图上的回归线,以及一次性做多个散点图,这是seaborn独有的。
直方图hist是一种展示表述数据分布情况的代表性图表。Seaborn还以实现以下图表。sns.load_dataset() 加载数据集sns.set_theme() 统一风格sns.set_style('white') 设置背景风格sns.set_palette() 设置配置sns.despine() 去除边框,美化图表sns.color_palette() 获取颜色列表
相见已是缘分了,你还会遇见很多的人,经历很多事,成为自己的“勇士”。