上一篇我们搞定了Seaborn的安装,今天进入实战基础环节!
很多人学可视化,卡在“找数据”和“导入报错”上,而Seaborn最贴心的一点,就是自带多种真实数据集,不用手动准备,同时导入有固定写法,照搬就能避免报错,直接抄作业👇
Seaborn有行业统一的导入简写,搭配Matplotlib和Pandas一起导入,后续绘图更顺畅,记住这几行代码,再也不报错:
# 导入Seaborn,固定简写为sns(所有教程都这么用)import seaborn as sns# 导入Matplotlib,用于显示图表(Seaborn依赖它)import matplotlib.pyplot as plt# 导入Pandas,用于读取和处理数据import pandas as pd# 验证导入是否成功:打印Seaborn版本号,无报错即成功print(sns.__version__)
如果导入时出现“ModuleNotFoundError”,说明Seaborn未安装成功,重新执行上一篇的安装命令即可;若出现中文乱码,后续我们会专门讲解解决方法~
Seaborn内置了10+种真实数据集,涵盖统计分析、分类、回归等多种场景,用sns.load_dataset()函数就能一键调用,返回的是Pandas的DataFrame格式,直接就能用于绘图,省去手动找数据的麻烦!
import seaborn as snsimport pandas as pd# 1. 小费数据集(最常用,包含消费金额、小费、性别、用餐时间等信息)tips = sns.load_dataset("tips")print("小费数据集前5行:")print(tips.head())# 2. 鸢尾花数据集(分类场景常用,包含花瓣、花萼尺寸等信息)iris = sns.load_dataset("iris")# 3. 航班数据集(时间序列场景常用,包含年份、月份、航班数量)flights = sns.load_dataset("flights")# 4. 泰坦尼克号数据集(分类、生存分析常用)titanic = sns.load_dataset("titanic")# 5. 企鹅数据集(新手入门首选,数据简单易理解)penguins = sns.load_dataset("penguins")# 查看所有自带数据集名称(按需选择)print("\nSeaborn所有自带数据集:", sns.get_dataset_names())

Seaborn所有自带数据集: ['anagrams', 'anscombe', 'attention', 'brain_networks', 'car_crashes', 'diamonds', 'dots', 'dowjones', 'exercise', 'flights', 'fmri', 'geyser', 'glue', 'healthexp', 'iris', 'mpg', 'penguins', 'planets', 'seaice', 'taxis', 'tips', 'titanic']
调用数据集时,如果出现“下载失败”提示,可尝试两种方法:
更换网络,重新运行代码(大概率能解决);
手动下载数据集文件,放在代码同一目录下,用Pandas的pd.read_csv()函数读取。
本篇我们掌握了Seaborn的标准导入方法和自带数据集,解决了新手“导入报错”和“找数据难”的痛点,接下来就能正式开始绘图啦~
下篇我们将讲解Seaborn的主题样式设置,一键切换简约、暗黑、复古等风格,让你的图表颜值瞬间拉满,记得持续关注!
往期回顾:
Python学习笔记——从入门到报废(十八、第三方库(上))
(文章使用AI进行排版和润色)