在Excel、PowerBI、Python三者中,都具有原生的箱线图,可以用来快速看一组数据的描述性分布情况。可以看到分位数、中位数,正常数据合理波动范围的上限和下限,以及上下限外的异常值。虽然可以通过箱线图推测数据的偏度,还得依赖看图经验。
小提琴图,形状像小提琴,是在箱线图的基础上,多了数据密度的轮廓,能够完成看出数据的分布情况。在三者的工具中,只有Python可以实现小提琴图的实现。中间的部分是箱线图,在箱线图的两侧是对称的数据密度分布图。箱线图只是在数据进行排序的前提下,进行找出需要的数值。可能存在某些数字多次出现的情况(众数),这可以是无法从箱线图看出来的,小提琴图可以帮我们看到全景。
import seaborn as snssns.violinplot(data=, x=,y=,)
虽可以修道参佛使自己不执于外表(相),但是人要讲良心,问心无愧。