小伙伴们,我🈶回来了,最近太忙了~今天的学习比较简单哦
学习内容:pandas 进阶
核心知识点:数据计算
当日目标:求平均、最大
练习任务:计算输出结果
1. 为什么用 pandas 做计算?
(1)核心思想:告别 for 循环,进一步提高效率
(2)对比做法:
* 第 10 天:需要写 total = 0,然后用 for i in data 进行累加。
* 今天:pandas 已经帮你写好了所有公式。你只需要下达一个指令(比如 mean 或 max),它就能瞬间算出结果。
其实就是相当于构建一个函数工具库,直接调用。
2. 核心操作:选中“列”进行计算
(1)核心思想:表格有很多列,你必须告诉电脑你要算哪一列。
(2)电脑做法:
* 使用 df['列名'] 来锁定目标。比如你的数据里有 score 这一列,就写 df['score']。
* 求平均值:.mean()
* 求最大值:.max()
* 求最小值:.min()
3. 今日练习代码实现
在之前撰写的脚本中,在12天的代码下面增加以下内容:
# (1) 计算平均分
# 核心思想:选中 score 这一列,直接调用求平均的方法 mean
avg_score = df['score'].mean()
# (2). 计算最高分
# 核心思想:选中 score 这一列,直接调用求最大值的方法 max
max_score = df['score'].max()
# (3). 输出结果
print(f"表格中的平均分是:{avg_score}")
print(f"表格中的最高分是:{max_score}")
# (4).扩展:一键获取所有统计信息
print("--- 数据的统计全家福 ---")
print(df.describe()) # 这一行会一次性输出平均值、最大值、最小值、中位数等
5. 关键点深度笔记
引号不能丢:df['score'] 里的 score 必须加引号,因为它是一个文字标签(字符串)。
拼写要精准:列名必须和你 data.csv 第一行写的字母完全一致(大小写也要一样)。
括号要记得:.mean() 和 .max() 是“动作”,所以必须带上英文小括号 ()。