当前位置：首页>python>Python 可视化进阶用数据标记强化图表信息传递

Python 可视化进阶用数据标记强化图表信息传递

2026-01-31 02:05:59

数据可视化：用标记点亮图表的“叙事力”

代码：

1import numpy as np
2import pandas as pd
3import matplotlib.pyplot as plt
4# 设置中文字体支持
5plt.rcParams['font.sans-serif']=['SimHei'] # 支持中文
6plt.rcParams['axes.unicode_minus']= False # 正确显示负号
7# ---1.散点图(Scatter Plot)---
8def plot_scatter():
9"""创建带有不同标记样式的散点图"""
10x = np.random.rand(30)*10
11y = np.random.rand(30)*10
12sizes = np.random.randint(20,200,30)
13colors = np.random.rand(30)
14plt.figure(figsize=(8,6))
15scatter = plt.scatter(x, y, s=sizes, c=colors, alpha=0.7, marker='o', cmap='viridis', edgecolors='black')
16plt.title('自定义标记的散点图')
17plt.xlabel('X轴')
18plt.ylabel('Y轴')
19plt.colorbar(scatter, label='颜色强度')
20plt.grid(True, linestyle='--', alpha=0.6)
21plt.show()
22# ---2.折线图(Line Plot)---
23def plot_line():
24"""创建带自定义标记的折线图"""
25x = np.linspace(0,10,20)
26y1 = np.sin(x)
27y2 = np.cos(x)
28plt.figure(figsize=(8,6))
29plt.plot(x, y1, marker='o', linestyle='-', color='b', label='正弦函数', markersize=8, markerfacecolor='r', markeredgewidth=2)
30plt.plot(x, y2, marker='s', linestyle='--', color='g', label='余弦函数', markersize=6, markerfacecolor='y', markeredgewidth=1)
31plt.title('带不同标记的折线图')
32plt.xlabel('X轴')
33plt.ylabel('Y轴')
34plt.legend()
35plt.grid(True, linestyle=':', alpha=0.5)
36plt.show()
37# ---3.条形图(Bar Plot)---
38def plot_bar():
39"""创建带标记的条形图"""
40categories =['A','B','C','D','E']
41values =[30,55,42,60,25]
42plt.figure(figsize=(8,6))
43bars = plt.bar(categories, values, color='skyblue', edgecolor='black')
44# 在每个柱子上添加标记和数值
45for bar inbars:
46height = bar.get_height()
47plt.text(bar.get_x()+ bar.get_width()/2., height +1, f'{height}', ha='center', va='bottom', fontsize=12)
48# 在柱顶添加圆形标记
49plt.plot(bar.get_x()+ bar.get_width()/2., height,'ro', markersize=8)
50plt.title('带标记的条形图')
51plt.xlabel('类别')
52plt.ylabel('数值')
53plt.grid(axis='y', linestyle='--', alpha=0.6)
54plt.show()
55# ---4.直方图(Histogram)---
56def plot_histogram():
57"""创建带标记的直方图"""
58data = np.random.randn(500)
59plt.figure(figsize=(8,6))
60n, bins, patches = plt.hist(data, bins=20, color='lightgreen', edgecolor='black')
61# 在每个直方图柱上添加标记
62bin_centers =0.5*(bins[1:]+ bins[:-1])
63plt.plot(bin_centers, n,'o-', color='red', linewidth=2, markersize=6)
64plt.title('带分布曲线的直方图')
65plt.xlabel('值')
66plt.ylabel('频率')
67plt.grid(axis='y', linestyle='--', alpha=0.6)
68plt.show()
69# ---5.饼图(Pie Chart)---
70def plot_pie():
71"""创建带标记的饼图"""
72labels =['苹果','香蕉','橙子','葡萄','其他']
73sizes =[30,25,20,15,10]
74explode =(0.1,0,0,0,0)
75plt.figure(figsize=(8,6))76wedges, texts, autotexts = plt.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%', startangle=90, colors=['#ff9999','#66b3ff','#99ff99','#ffcc99','#c2c2f0'])
77# 自定义文本和标记
78plt.setp(autotexts, size=12, weight="bold", color="white")
79plt.setp(texts, size=12)
80plt.title('带标记的饼图')
81plt.axis('equal') # 保证饼图是圆形
82plt.show()
83# ---6.箱线图(Box Plot)---
84def plot_boxplot():
85"""创建带标记的箱线图"""
86data =[np.random.normal(0, std,100)for std inrange(1,5)]
87plt.figure(figsize=(8,6))
88bp = plt.boxplot(data, patch_artist=True, labels=['组1','组2','组3','组4'], flierprops=dict(marker='o', color='red', markersize=5))
89# 自定义箱体颜色
90colors =['lightblue','lightgreen','lightyellow','lightpink']
91for patch, color inzip(bp['boxes'], colors):
92patch.set_facecolor(color)
93plt.title('带异常值标记的箱线图')
94plt.xlabel('组别')
95plt.ylabel('数值')
96plt.grid(axis='y', linestyle='--', alpha=0.6)
97plt.show()
98# --- 主程序 ---
99if __name__ =='__main__':
100plot_scatter()
101plot_line()
102plot_bar()
103plot_histogram()
104plot_pie()
105plot_boxplot()

在信息爆炸的时代，数据早已不是冰冷的数字，而是承载着故事与洞察的“原材料”。而数据可视化，正是将这些原材料转化为直观叙事的“工匠技艺”。在众多可视化工具中，Python得Matplotlib库凭借灵活的定制能力，成为数据从业者的得力助手，尤其是对“数据标记”的精细把控，更是让图表从“信息呈现”升级为“观点传递”的关键。

数据标记，看似只是图表中一个个微小的符号，却暗藏着四两拨千斤的力量。在折线图里，它是时间序列中的“关键节点”——当我们用红色圆形标记突出每月销售额的峰值，用蓝色方形标记标注促销活动后的业绩变化时，数据的波动逻辑便不再需要复杂的文字说明，观众一眼就能捕捉到“促销带动销量增长”的核心结论。若将标记大小与销量绝对值挂钩，标记本身还能成为“数据强度”的直观体现，让趋势与量级的双重信息同步传递。

散点图中的标记，更是探索变量关联的“放大镜”。当我们研究用户年龄与消费金额的关系时，用不同颜色的五边形标记区分不同消费品类，用半透明效果叠加高密度数据点，原本杂乱的分布会瞬间清晰：红色标记的美妆类集中在20-35岁区间，蓝色标记的家居类则在30-45岁区间形成聚类，这种关联模式远比分组统计表更具冲击力。而标记边缘的黑色描边设计，还能避免数据点因颜色相近而“融合”，确保每一个样本的信息都不被淹没。

即便是看似简单的条形图，标记也能成为“点睛之笔”。在展示各部门季度业绩时，在条形顶端添加白色星形标记，既能标注出业绩冠军部门，又能通过星形大小差异，直观呈现冠军与亚军的差距。这种设计打破了条形图“只比高低、难辨差距”的局限，让数据对比从“定性”走向“定量”，也让图表更具视觉记忆点。

当然，数据标记的运用并非越多越好，“恰到好处”才是核心原则。过多的标记会让图表显得杂乱，掩盖核心信息；而标记样式的选择也需贴合数据场景——用叉号标记异常值，用三角形标记目标值，用圆形标记实际值，符号本身的“语义暗示”能与数据内容形成呼应，降低观众的理解成本。例如在箱线图中，用红色叉号突出偏离正常范围的异常数据，既能警示风险，又不会干扰对整体分布的判断。

从本质上说，数据标记是连接数据与观众的“桥梁”。它将抽象的数字转化为可感知的视觉符号，让图表不再是冰冷的统计工具，而是能传递观点、引发思考的“数据故事”。当我们用Python精心定制每一个标记的样式、颜色与大小，实则是在为数据“注入灵魂”——让观众在看到图表的瞬间，不仅能获取信息，更能读懂数据背后的逻辑与价值。这，正是数据可视化的真正魅力所在。#python程序设计#

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

Python 可视化进阶用数据标记强化图表信息传递

最新文章

热门文章

随机文章

Python 可视化进阶用数据标记强化图表信息传递

如果AI能写代码,我们还学什么?

富士胶片 C3061出现代码: 077-109 故障分析

最新文章

热门文章

随机文章