当前位置：首页>python>利用AI,零基础速通Python · 07

利用AI,零基础速通Python · 07

2026-07-03 20:58:30

-这是空框｜Reframe 的第 23 篇文章-

上一篇，我们完成了一次关键跃迁：从“写几行代码”，走向“构建一个最小的数据处理系统”。我们可以读取CSV；可以用for + if做筛选；可以用函数把逻辑抽象成可复用模块；甚至可以把结构化数据喂给AI，让模型生成表达内容。

但如果你继续往下写代码，很快会遇到一个现实问题：很多事情，其实没必要自己写。

你不需要自己实现统计函数，不需要自己写绘图库，也不需要自己构建一个完整的数据处理框架。

这时候，就轮到今天的主角登场了：import。

import是什么？

在语法层面，import是“导入模块”。在系统层面，它意味着：把外部能力加载进当前程序。当你写下：

import math

你不是在定义一个变量，而是在告诉Python：把名为math的模块接入当前环境。然后你可以使用：

math.sqrt(16)

这里有两个基础概念必须理解：math是模块（module），sqrt是模块中的函数（function）。使用格式是：

模块名.函数名

这个“点”（.）非常重要，它代表在某个命名空间中访问属性。

命名空间（namespace）这个概念以后会频繁出现，本质是为了避免不同模块之间的名称冲突。

不同的import方式

Python提供了几种常见的导入方式。

1、直接导入整个模块

import math

使用时：

math.pi math.floor(5.7)

优点：结构清晰，不会污染当前命名空间。缺点：写起来稍微长一点。

2、只导入指定函数

from math import sqrt

使用时：

sqrt(16)

优点：简洁。缺点：如果导入函数过多，容易混乱。

3、起别名（alias）

import pandas as pd

这里的as表示“起一个别名”。以后你只需要写：

pd.read_csv()

而不是：pandas.read_csv() 这是行业习惯，不是语法炫技。

4、不推荐但常见的写法

from module import *

这会导入所有内容。看起来方便，但在真实项目中非常不推荐，因为它会让命名空间变得不可控。

如果你以后参与团队协作，这一点尤其重要。

从本地文件import——模块化思维

假设你有一个文件：tools.py，里面写了：

def greet(name):    return f"Hello, {name}"

在另一个文件中，你可以：

from tools import greet

或者：

import tools

然后调用：

tools.greet("Fangwen")

这一步意味着什么？意味着：你开始拆分系统结构。

程序不再是一个巨大脚本，而是由多个模块组成的能力集合。

这已经是工程化的第一步。

pip——安装第三方能力

到这里，我们进入一个更大的世界。

Python的真正强大，不是语法简单，而是生态系统。

第三方库通过 pip 安装：

pip install pandas

如果在Jupyter Notebook中：

!pip install pandas

pip是Python的包管理工具，你可以理解为Python的“应用商店”。

你可以查看当前环境中有哪些库：

pip list

你也可以导出当前依赖：

pip freeze > requirements.txt

这一步非常重要，因为它涉及到“环境一致性”。

如果你未来做项目部署，环境管理是基础能力。

pandas——结构化数据的核心库

在前几篇文章，我们用csv.DictReader手动解析文件，那是为了理解底层结构。但真实世界里，几乎所有数据分析都使用：

import pandas as pd

安装：

pip install pandas

1、读取CSV文件

data = pd.read_csv("example.csv")

这行代码做了什么？

1、打开文件

2、解析列名

3、构建DataFrame 对象

DataFrame是pandas的核心数据结构，本质是“带标签的二维表格”。你可以查看前几行：

data.head()

查看列名：

data.columns

2、数据筛选

假设有如下数据：

import pandas as pddata = pd.DataFrame({    "Name": ["Alice", "Bob", "Charlie", "David"],     "Cups_per_day": [3, 5, 2, 7],     "Sleep_hours": [7, 5, 8, 4] })

筛选每天喝咖啡超过4杯的人：

data[data["Cups_per_day"] > 4]

这和我们之前写的：

for item in data:    if ...

逻辑是一致的，但表达更简洁。

3、统计分析

计算平均睡眠时间：

data["Sleep_hours"].mean()

计算相关关系（基础了解）：

data.corr()

你已经开始进入数据分析领域。

matplotlib——数据可视化

matplotlib是Python中最常用的数据可视化库之一，在做数据可视化时非常实用。

安装：

pip install matplotlib

导入：

import matplotlib.pyplot as plt

注意：pyplot是子模块。

1、散点图示例

plt.scatter(data["Cups_per_day"], data["Sleep_hours"]) plt.xlabel("Cups per Day") plt.ylabel("Sleep Hours") plt.title("Coffee vs Sleep") plt.show()

关于上述代码的基础概念：

scatter()：绘制散点图 xlabel()：设置横轴标签 ylabel()：设置纵轴标签 title()：设置标题 show()：显示图像

如果不写 show()，图像可能不会显示，这是很多初学者常见问题。

2、增强图表效果

plt.scatter(data["Cups_per_day"], data["Sleep_hours"], color="red") plt.grid(True) plt.show()

可视化的意义不是“好看”，而是帮助人类快速识别模式。

使用AI进行数据分析

现在，把几件事情串起来：

1、用pandas读取数据

2、用规则筛选

3、用matplotlib画图

4、用AI生成解释

例如：

prompt = f""" Based on the dataset below: {data} Explain whether higher coffee consumption reduces sleep. """

虽然，这一步的核心逻辑仍然是：

结构化数据 → Prompt → 模型输出

但此刻的你，不是在写一个脚本，而是在构建一个AI时代的数据分析处理流程。

你现在应该达到什么程度？

看完这一篇，你不需要记住所有内容，但你应该能够：

1、理解import的含义

2、区分import的几种方式

3、使用pip安装库

4、用pandas读取和筛选数据

5、用matplotlib画出基本图表

6、把数据交给AI做分析

从第一篇到现在，我们并不是在背语法，而是在搭建能力结构。变量、循环、函数解决的是内部逻辑，而import和pip让系统开始连接外部能力。这意味着，你不再只是写代码，而是在接入生态。

当你理解import，你就从“写功能”转向“调度能力”。在AI时代，真正重要的不是会多少语法，而是能否拆解问题、组合模块、管理数据流。

Python本身只是载体。pandas处理数据，matplotlib负责表达，AI负责推理，而import是它们之间的连接机制。只要数据流清晰——输入、处理、表达、生成、输出——模块就可以替换，能力就可以升级。

真正重要的，不是你会多少语法，而是你是否已经习惯于把复杂问题拆解成可组合的模块，并用最小可运行版本持续迭代。

[空框｜Reframe]

感谢您的阅读，欢迎您的关注

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

利用AI,零基础速通Python · 07

最新文章

热门文章

随机文章

利用AI,零基础速通Python · 07

新年贺岁片——linux中的signal

投资组合优化实战:用Python实现智能资产配置

最新文章

热门文章

随机文章