🐍 Python数据分析:Python编程基础
大家好!很多同学在学习“Python数据分析与可视化”时,常常急于求成,直接上手Pandas和Matplotlib,结果发现代码看不懂、报错不会调,根源就在于Python编程基础不牢。
今天,我们就回归根本,一起梳理Python最核心的编程基础。这些知识不仅是数据分析的基石,更是你未来成为高手的关键!
🔹 一、Python:简洁而强大的数据科学语言
正如我们的课件所说,Python是一门语法简洁、跨平台、可扩展的开源通用脚本语言。它之所以能成为数据科学领域的首选,离不开其成熟的生态系统:
- 数据可视化:Matplotlib, Seaborn
但在使用这些强大工具之前,我们必须先掌握Python这门语言本身。
🔸 二、Python的六大核心数据类型
课件中明确指出,Python有六个标准数据类型,它们是构建一切程序的基础。
| 分类 | 数据类型 | 特点 | 数据分析中的用途 |
|---|
| 不可变 | | | |
| | | |
| | | |
| 可变 | | | 最常用! |
| | | |
| | | |
❝💡 关键点:理解“可变”与“不可变”的区别至关重要。例如,列表可以随时增删改,而元组则不行。
🔹 三、变量、赋值与动态语言的魅力
Python是动态语言,这意味着:
无需声明类型:score = 95,Python会自动知道score是整数。
同一变量可反复赋值不同类型:
data = "Python"# 字符串
data = 100# 整数
data = 123.45# 浮点数
data = 2 + 3j# 复数
这种灵活性让代码编写更加快捷。
支持多重赋值:
name, age, score = '小明', 20, 95
🔸 四、操作符与表达式:让数据动起来
数据分析离不开计算,Python提供了丰富的操作符:
算术运算符:+, -, *, /, % (取余), // (整除), ** (幂)
print(11 / 3) # 3.666...
print(11 // 3) # 3
print(2 ** 5) # 32
关系运算符:<, <=, >, >=, !=, ==
❝⚠️ 优先级:算术 > 关系 > 逻辑。复杂表达式记得用括号 () 来明确计算顺序!
🔹 五、字符串:文本数据的处理艺术
字符串是数据分析中处理文本的核心。
定义方式:单引号 ' '、双引号 " "、三引号 ''' '''(用于多行)。
转义字符:\n (换行), \t (制表符), \" (双引号)。
- 如果不想转义,可以用原始字符串:
r"C:\new_folder"。
字符串运算:
str1 = "Hello"
str2 = "World"
print(str1 + ", " + str2 + "!") # 连接: Hello, World!
print("Ha" * 3) # 重复: HaHaHa
索引与切片(超重要!):
s = "Python"
print(s[0]) # 'P' (第一个字符)
print(s[-1]) # 'n' (最后一个字符)
print(s[2:5]) # 'tho' (从索引2到4)
str.split(): 按分隔符拆分字符串,返回列表。
🔸 六、流程控制:让程序学会“思考”
程序不是一条直线,而是需要根据条件做选择、重复执行任务。
分支结构 (if-elif-else):
score = float(input("请输入成绩:"))
if score >= 90:
print("优秀")
elif score >= 60:
print("及格")
else:
print("不及格")
❝📌 在Python中,False, 0, None, "", (), [], {} 都被视为假(False)。
while 循环:当条件为真时,一直循环。i = 0
while i < 5:
print(i)
i += 1
for 循环:遍历序列(如列表、字符串、range)。# 计算1到5的和
total = 0
for i in range(1, 6): # range(1,6) 生成 [1,2,3,4,5]
total += i
print(total) # 15
🔹 七、内建数据结构:List, Tuple, Dict, Set
这是本章的重中之重!
- 列表推导式:一行代码创建新列表!
# 将原列表中大于6的数乘以3
vec = [2, 4, 6, 8, 10]
new_vec = [3*x for x in vec if x > 6] # [24, 30]
元组 (Tuple):和列表类似,但一旦创建就不能修改。用圆括号 () 定义。
point = (3, 4) # 一个坐标
**字典 (Dict)**:通过“键”快速查找“值”。
scientists = {'Newton': 1642, 'Darwin': 1809}
print(scientists['Newton']) # 1642
# 常用方法: keys(), values(), items(), get()
集合 (Set):无序且元素唯一,非常适合去重和集合运算(交、并、差)。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
print(set1 | set2) # 并集: {1, 2, 3, 4, 5}
print(set1 & set2) # 交集: {3}
🔸 八、函数:封装你的智慧
函数让你的代码模块化、可复用。
定义函数:
deffactorial(n):
"""计算n的阶乘"""
if n == 0:
return1
result = 1
for i in range(1, n+1):
result *= i
return result
print(factorial(4)) # 24
Lambda函数(匿名函数):用于简单的一次性操作。
# 计算多项式 1 + 2*x + y^2 + z*y
poly = lambda x, y, z: 1 + 2*x + y**2 + z*y
print(poly(1, 2, 3)) # 13
🔹 九、文件操作:与外部世界沟通
数据分析的起点往往是读取一个文件。
基本流程:打开 -> 读/写 -> 关闭。
# 读取文本文件
with open("data.txt", "r", encoding="utf-8") as f:
content = f.read() # 读取全部内容
# 或 lines = f.readlines() # 按行读取,返回列表
# 文件会自动关闭,无需手动close()
处理CSV文件(表格数据的常见格式):
import csv
with open("student.csv", "r") as f:
reader = csv.reader(f)
for row in reader:
print(row) # 每行是一个列表
🔚 总结
今天我们系统地回顾了Python编程的核心基础,包括数据类型、变量、操作符、字符串、流程控制、内建数据结构、函数和文件操作。这些知识点看似简单,却是后续学习Pandas、NumPy等高级库的绝对前提。
万丈高楼平地起,扎实的基础才能支撑起复杂的数据分析项目。 建议大家动手敲一遍文中的代码,加深理解。
📢 互动时间
你在学习Python基础时,哪个概念最难理解?欢迎在评论区留言交流!
✅ 关注我们,获取更多数据科学干货!