sep='::':: 把每一列隔开的iloc[0]:按位置取第 0 行mean_ratings=data.pivot_table('rating',index='title',columns='gender',aggfunc='mean')values='rating'要统计、计算的字段:评分;aggfunc='mean'聚合方式:求平均值ratings_by_title=data.groupby('title').size().size()统计每一组有多少行sorted_by_diff[::-1][:10][::-1]:从头到尾,步长-1,就是倒着取数据。
def add_prop(group):def:固定语法,用来声明「我要定义一个函数」add_prop:这个函数名叫什么。(group):函数的形参,调用这个函数时,会传进来一个东西,在函数内部用group这个名字代表它。top1000.reset_index(inplace=True,drop=True)把 top1000 这个 DataFrame 重新生成从 0 开始的默认数字索引,并且:drop=True:丢掉原来的旧索引,不把它变成普通列;inplace=True:直接原地修改原数据,不用赋值.。
subset.plot(subplots=True, figsize=(12, 10), grid=False)subplots=True把每一列单独分成一个小画布(子图),不是全部画在同一张图里。grid=False不显示背景网格线;# 从name列提取最后一个字母get_last_letter = lambda x: x[-1]last_letters = names.name.map(get_last_letter)last_letters.name = 'last_letter'table = names.pivot_table('births', index=last_letters,columns=['sex', 'year'], aggfunc=sum)
定义一个匿名 lambda 函数,起名叫 get_last_letter,作用:传入一个字符串 x,返回最后一个字符x[-1] Python 取最后一位的写法;names.name是名字这一列;.map(函数):对这一列每一个元素都执行一遍这个函数;last_letters.name = 'last_letter',设置列名叫 last_letter.
