Python中Matplotlib模块做数据可视化
Matplotlib是Python核心的绘图库之一,它提供类似MATLAB的绘图接口,支持折线图、散点图、柱状图、等高线图等多种图表类型,是数据分析和科学计算的可视化基础工具。常与NumPy、Pandas配合使用。下面分享一个泰坦尼克号生存预测的可视化案例,代码如下:import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = 'SimHei'titanic = pd.read_csv(".\\titanik\\train.csv")fig = plt.figure(figsize=(12, 9), dpi=100)fig.set(alpha=0.2) # 设定图表颜色alpha参数plt.subplot2grid((2,3),(0,0))titanic.Survived.value_counts().plot(kind='bar')plt.subplot2grid((2,3),(0,1))titanic.Pclass.value_counts().plot(kind="bar")plt.subplot2grid((2,3),(0,2))plt.scatter(titanic.Survived, titanic.Age)plt.title("按年龄看获救分布 (1为获救)")plt.subplot2grid((2,3),(1,0), colspan=2)titanic.Age[titanic.Pclass == 1].plot(kind='kde')titanic.Age[titanic.Pclass == 2].plot(kind='kde')titanic.Age[titanic.Pclass == 3].plot(kind='kde')plt.legend(('头等舱', '2等舱','3等舱'),loc='best')plt.subplot2grid((2,3),(1,2))titanic.Embarked.value_counts().plot(kind='bar')如需数据集,在后台回复关键词“泰坦尼克号”即可获取csv数据集文件,本项目非常适合大学生的数据分析作业或者项目案例,或者为其他的研究者提供数据分析的思路。也可以修改color颜色参数,得到更好的效果: