[Note]数据可视化基础

可视化中的数据

数据认知

  • 数据模型:对数据的底层描述及对相关的操作
  • 概念模型:对数据的高层次描述。定义数据的概念和它们之间的联系,定义数据的语义和它们的含义

数据类型

  • 根据数据模型
    • 浮点数、整数、字符等
  • 根据概念模型
    • 如汽车、摩托车、自行车等分类数据
  • 根据测量标度
    • 类别型、有序型、数值型

可视化的基本图表

  • 原始数据绘图
    • 轨迹图
    • 柱状图
    • 直方图
    • 饼图:呈现各分量在整体中的比例
    • 等值线图: 将相等的数据点连线表示数据的连续分布和变化规律
    • 走势图: 一种紧凑并简洁的数据趋势表达方式,通常以折线图为基础嵌入文本或表格中
    • 散点图和散点图矩阵
      • 散点图表示二维数据的标准方法
      • 散点图矩阵式散点图的高维扩展,用来表示高维(大于二维)的数据属性分布
    • 维恩图(Venn diagram)
      • 使用平面上的封闭图形来表示数据集合间的关系
    • 热力图
      • 用颜色表达与位置相关的二维数据数值的大小
  • 简单的统计值标绘
    • 盒须图(箱形图,box-plot)
      • 一维盒须图可扩展为二维盒须图
  • 多视图协调关联

注:直方图和柱状图的区别:“直方图一般用来描述等距数据或等比数据;柱形图一般用来描述称名数据或顺序数据。直观上,直方图矩形之间是衔接在一起的,表示数据间的数学关系;柱形图则留有空隙,表示仅作为两个或多个不同的类,而不具有数学相关性质。”转自这里

可视化设计原则

  • 准确
  • 直观
  • 美观

直观

视图选择与交互设计

成功的可视化首先考虑的是被用户广泛认可并成熟的视图设计。

如:

  • 滚动和缩放
  • 颜色映射
  • 数据映射方式的控制,即除首先确定默认的直观的数据到可视化的呈现方案,其次提供其他的呈现方式供用户选择
  • 数据缩放和裁剪工具
  • 细节层次(level of detail)控制, 隐藏或突出数据的细节部分

数据筛选

过多过少均不合适,可以

  • 用户选择显示的部分数据,隐藏其他
  • 使用多视图或多显示器,数据根据它们的相关性分别显示

美观

  • 使用表格
    • 过多过少均使数据缺乏准确和美观性
    • 区间的均匀性也对用户理解很重要
  • 错误的或过多的使用颜色映射容易造成视觉混乱
  • 可视化是功能和形式的完美结合
    • 聚焦,将用户注意力集中在重要区域
    • 平衡,有效利用可视化空间
    • 简单,避免视觉混乱,但也要主语过滤而来的信息损失,寻找其中的平衡

results matching ""

    No results matching ""