数据可视化桑基图旭日图树形图关系图词云
图表进阶:何时用桑基、旭日、树图、关系图与词云
常见的折线、柱状、饼图解决“趋势、对比、占比”的基础问题。但遇到“流向、层级、网络、文本权重”时,基础图表就吃力了。下面分四类场景,讲我自己的选型方法与踩坑点。
一、流向:用桑基图讲“从哪里到哪里、量有多大”
- 数据组织:节点列表 + 边列表(source、target、value)。尽量先做“去重+合并小流”。
- 表达重点:尽量让主干流居中且层级清楚,小流汇总到“其他”,否则像“毛线团”。
- 常见错误:分类过细、色彩过多、节点命名过长导致重叠。
工具:
二、层级占比:用旭日图讲“整体-分层-占比”
- 数据组织:树形结构的节点(name、value、children)。如果没有 value,用子节点合计。
- 表达重点:层级不宜超过 3-4 层,过多层会让读者迷路;同层节点建议按占比排序。
- 常见错误:把“层级关系不清楚”的分类硬塞进旭日,导致不如柱状图直观。
工具:
三、层级结构:用树图讲“父子关系与结构骨架”
- 数据组织:严格的树(每个节点一个父节点)。如果出现“多父母”,就不是树图的地盘了。
- 表达重点:正交或径向布局都行,关键是“折叠层级+只展开重点”。
- 常见错误:节点文案太长、边过多;可以把冗余描述放到提示框里。
工具:
四、网络关系:用关系图讲“点与点之间的连接与社群”
- 数据组织:节点(id、label、权重)+ 边(source、target、类型/权重)。
- 表达重点:用力引导布局、社群颜色、节点大小(代表度数/权重)突出“中心与群落”。
- 常见错误:边太多导致遮挡,可考虑阈值过滤或抽样展示。
工具:
五、文本权重:用词云讲“什么词最突出”
- 数据组织:词语 + 权重;建议先去停用词,避免“的、了、和”等占据主位。
- 表达重点:字号范围与色彩对比不要过猛,保持阅读舒适;形状选择要服务主题。
- 常见错误:权重分布过于平均,导致“看上去都差不多”。
工具:
导出与发布的注意点
- 统一主题:一篇报告中的图表主题与色彩风格保持一致;
- 标题与注释:图题明确“该图回答的问题是什么”;
- 导出:PNG/JPG 用于文档,SVG 用于高分辨展示,PDF 用于打印;
- 数据来源:在图下附“数据口径与时间区间”,避免误读。
当你把“问题类型→数据组织→图表映射”这条链路打通,很多“画不清”的图自然就清楚了。工具只是最后一步,前面两步才是关键。