前面的文章介绍了Pandas库对数据清洗,处理的方法,本篇文章详细讲解下matplotlib库数据可视化展示,先看下面两张图:同样的数据,第二张图不仅标题和图例一目了然,纵轴和横轴的标签也更明了,整个图显得更有层次。那么这样的图是怎么用Python画出来的呢,借用Python数据透视这篇文章的示例,先对数据进行清洗然后透视,最后对一月的汇总数据进行柱状图展示,如用Excel对选中数据插入柱状图,显示如下:上图因为要展示的数据多,柱状并列在一起,甚至区分不出来每个员工的数据,而且要手工编辑图表标题,再改改颜色……半小时又没了,更糟的是,老板瞥了一眼说:“这图不够清晰,能不能做得像咨询报告那样?”。用Python处理这张图则灵活很多,可以按自己的要求定义图表的各项属性。2、数据处理后去掉总计行列并筛选一月分数据用于可视化3、编写可视化图标属性
完成的图对应如下:
看下整个实现的过程:
可以看到,用Matplotlib库,几行代码就能按自己的定制需求生成专业又好看的图表,而在excel中重复地复制数据、粘贴图表、调整格式……这些其实才是真正耗费精力的“脏活累活”,有时为了达到效果,还得使用付费模板,学会用 Python 做可视化,不是为了炫技,而是为了让你的分析报告实现自动化和可复用。你只需要维护好数据源,报告每周自动生成。