[Note]数据可视化基础
可视化中的数据
数据认知
- 数据模型:对数据的底层描述及对相关的操作
- 概念模型:对数据的高层次描述。定义数据的概念和它们之间的联系,定义数据的语义和它们的含义
数据类型
- 根据数据模型
- 浮点数、整数、字符等
- 根据概念模型
- 如汽车、摩托车、自行车等分类数据
- 根据测量标度
- 类别型、有序型、数值型
可视化的基本图表
- 原始数据绘图
- 轨迹图
- 柱状图
- 直方图
- 饼图:呈现各分量在整体中的比例
- 等值线图: 将相等的数据点连线表示数据的连续分布和变化规律
- 走势图: 一种紧凑并简洁的数据趋势表达方式,通常以折线图为基础嵌入文本或表格中
- 散点图和散点图矩阵
- 散点图表示二维数据的标准方法
- 散点图矩阵式散点图的高维扩展,用来表示高维(大于二维)的数据属性分布
- 维恩图(Venn diagram)
- 使用平面上的封闭图形来表示数据集合间的关系
- 热力图
- 用颜色表达与位置相关的二维数据数值的大小
- 简单的统计值标绘
- 盒须图(箱形图,box-plot)
- 一维盒须图可扩展为二维盒须图
- 盒须图(箱形图,box-plot)
- 多视图协调关联
注:直方图和柱状图的区别:“直方图一般用来描述等距数据或等比数据;柱形图一般用来描述称名数据或顺序数据。直观上,直方图矩形之间是衔接在一起的,表示数据间的数学关系;柱形图则留有空隙,表示仅作为两个或多个不同的类,而不具有数学相关性质。”转自这里
可视化设计原则
- 准确
- 直观
- 美观
直观
视图选择与交互设计
成功的可视化首先考虑的是被用户广泛认可并成熟的视图设计。
如:
- 滚动和缩放
- 颜色映射
- 数据映射方式的控制,即除首先确定默认的直观的数据到可视化的呈现方案,其次提供其他的呈现方式供用户选择
- 数据缩放和裁剪工具
- 细节层次(level of detail)控制, 隐藏或突出数据的细节部分
数据筛选
过多过少均不合适,可以
- 用户选择显示的部分数据,隐藏其他
- 使用多视图或多显示器,数据根据它们的相关性分别显示
美观
- 使用表格
- 过多过少均使数据缺乏准确和美观性
- 区间的均匀性也对用户理解很重要
- 错误的或过多的使用颜色映射容易造成视觉混乱
- 可视化是功能和形式的完美结合
- 聚焦,将用户注意力集中在重要区域
- 平衡,有效利用可视化空间
- 简单,避免视觉混乱,但也要主语过滤而来的信息损失,寻找其中的平衡