当前位置：首页>python>Python数据分析完结篇

Python数据分析完结篇

2026-06-29 23:59:02

sep='::'

是用两个冒号 :: 把每一列隔开的

iloc[0]：按位置取第 0 行

mean_ratings=data.pivot_table('rating',index='title',columns='gender',aggfunc='mean')

pivot_table 就是 Excel 里的「数据透视表」，用来分组、交叉统计.values='rating'要统计、计算的字段：评分;aggfunc='mean'聚合方式：求平均值

ratings_by_title=data.groupby('title').size()

.size()统计每一组有多少行

sorted_by_diff[::-1][:10]

[::-1]：从头到尾，步长-1，就是倒着取数据。

def add_prop(group):

def：固定语法，用来声明「我要定义一个函数」
add_prop：这个函数名叫什么。
(group)：函数的形参，调用这个函数时，会传进来一个东西，在函数内部用group这个名字代表它。

top1000.reset_index(inplace=True,drop=True)

把 top1000 这个 DataFrame 重新生成从 0 开始的默认数字索引，并且：drop=True：丢掉原来的旧索引，不把它变成普通列;inplace=True：直接原地修改原数据，不用赋值.。

 subset.plot(subplots=True, figsize=(12, 10), grid=False)

`subplots=True把`每一列单独分成一个小画布（子图），不是全部画在同一张图里。

`grid=False不显示背景网格线；`

# 从name列提取最后一个字母get_last_letter = lambda x: x[-1]last_letters = names.name.map(get_last_letter)last_letters.name = 'last_letter'table = names.pivot_table('births', index=last_letters,                            columns=['sex', 'year'], aggfunc=sum)

定义一个匿名 lambda 函数，起名叫 get_last_letter,作用：传入一个字符串 x，返回最后一个字符x[-1] Python 取最后一位的写法;names.name是名字这一列;.map(函数)：对这一列每一个元素都执行一遍这个函数;last_letters.name = 'last_letter',设置列名叫 last_letter.

提取所有人名最后一个字母,做透视表：

行：名字最后一个字母;
列：性别 + 年份;
值：对应出生人数总和

Python数据分析历时几个月终于快看完了，大部分理解了，但是还没有灵活运用，举一反三。学海无涯、进一寸有一寸的欢喜。下本书再见。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

Python数据分析完结篇

`subplots=True把`每一列单独分成一个小画布（子图），不是全部画在同一张图里。

`grid=False不显示背景网格线；`

最新文章

热门文章

随机文章

Python数据分析完结篇

subplots=True把每一列单独分成一个小画布（子图），不是全部画在同一张图里。

grid=False不显示背景网格线；

从零入门 Python丨8 个高质量免费网站合集

6python之web端专家诊断es慢原因分析及处理

最新文章

热门文章

随机文章

`subplots=True把`每一列单独分成一个小画布（子图），不是全部画在同一张图里。

`grid=False不显示背景网格线；`