第12天:实际应用——pandas入门
哈喽,小伙伴们,今天我们需要安装python中的插件:pandas,并且学会简单运用
阶段:实际应用
学习内容:pandas 入门
核心知识点:读取数据
1. 什么是 pandas?
(1)核心思想:它是 Python 处理数据的“工具”。
(2)逻辑拆解:
① 定位:如果说 Python 是地基,那么 pandas 就是盖在上面的“自动化办公大楼”。
② 功能:它能把复杂的 CSV、Excel 文件瞬间变成一个像表格一样的对象(在 pandas 里叫 DataFrame)。
③ 优势:昨天我们要写好几行代码才能算平均值,今天用 pandas 可能只需要一行。
注:我认为就是很多写好的程序,直接调用的一个工具库,类比excel中的各种函数。
2. 准备工作:安装 pandas
(1)核心思想:pandas 不是 Python 自带的,需要额外下载。
(2)操作做法:
① 打开你电脑的终端(Terminal)或 PyCharm 底部的 Terminal。
② 输入以下命令并回车: powershell pip install pandas。
③ 等待显示 Successfully installed。
3. 如何用 pandas 读取数据?
(1)核心思想:用最简单的指令,让文件里的数据“跳”进 Python。
(2)代码做法(请确保你的 data.csv 和代码在同一个文件夹):
① 导入库:import pandas as pd(给 pandas 起个简短的绰号叫 pd)。
② 读取文件:使用 pd.read_csv('文件名')。
③ 查看数据:使用 .head() 方法。
4. 详细代码实现与逐行解析
请在你的编辑器中输入以下代码:
import pandas as pd # 初始化:导入pandas工具包,并简写成pd# 第一步:读取数据# 核心思想:把需要处理的数据导入到内存中,取名为df# df是DateFarm的缩写,可以当做是一个"虚拟表格"df=pd.read_csv('data.csv')#第二步:输出前5行#核心思想:先看看一下数据的样式,提前检查数据是否输错print("---以下是数据的前5行---")print(df.head())#默认展示前5行,如果括号写head(3)就是前三行#第三步:查看数据的基本信息print("---数据的行列数---")print(df.shape)#输出的结果是什么就是表示其行列信息
5. 重点笔记(小白必看)
df 是什么?
pd.read_csv() 的路径问题:
为什么要用 .head()?
6. 今日练习建议
任务:成功安装 pandas 并运行上面的代码,打印出你在第11天创建的那几个人的分数。
扩展:试着在 df.head() 的括号里填入数字 2,看看输出结果是不是变成了只显示 2 行?
注1:因为手动输出代码可能出现以下问题,主要问题就是英文符号和中文符号的问题。
注2:在软件内部,修改文件的名称,右击选择 Refactor -> Rename(重命名)