在前几篇文章,我们用csv.DictReader手动解析文件,那是为了理解底层结构。但真实世界里,几乎所有数据分析都使用:
安装:
1、读取CSV文件
data = pd.read_csv("example.csv")
这行代码做了什么?
1、打开文件
2、解析列名
3、构建DataFrame 对象
DataFrame是pandas的核心数据结构,本质是“带标签的二维表格”。你可以查看前几行:
查看列名:
2、数据筛选
假设有如下数据:
import pandas as pddata = pd.DataFrame({ "Name": ["Alice", "Bob", "Charlie", "David"], "Cups_per_day": [3, 5, 2, 7], "Sleep_hours": [7, 5, 8, 4] })
筛选每天喝咖啡超过4杯的人:
data[data["Cups_per_day"] > 4]
这和我们之前写的:
逻辑是一致的,但表达更简洁。
3、统计分析
计算平均睡眠时间:
data["Sleep_hours"].mean()
计算相关关系(基础了解):
你已经开始进入数据分析领域。
从第一篇到现在,我们并不是在背语法,而是在搭建能力结构。变量、循环、函数解决的是内部逻辑,而import和pip让系统开始连接外部能力。这意味着,你不再只是写代码,而是在接入生态。
当你理解import,你就从“写功能”转向“调度能力”。在AI时代,真正重要的不是会多少语法,而是能否拆解问题、组合模块、管理数据流。
Python本身只是载体。pandas处理数据,matplotlib负责表达,AI负责推理,而import是它们之间的连接机制。只要数据流清晰——输入、处理、表达、生成、输出——模块就可以替换,能力就可以升级。
真正重要的,不是你会多少语法,而是你是否已经习惯于把复杂问题拆解成可组合的模块,并用最小可运行版本持续迭代。
[空框|Reframe]