[Note]数据可视化简介
发展
信息化时代面临的一个巨大的挑战是数据爆炸。这个挑战不仅在于数据量的体量、高维、多源、多态的特性,还体现在数据获取的动态性、数据内容大的噪声和互相矛盾、数据关系的异构和异质性等,从而导致人类分析数据的能力远远落后于数据获取的能力,由此演化为一门新的科学:数据科学。
信息学科领域最基本的模型“数据(data)、信息(information)、知识(knowledge)、智慧(wisdom)构成了信息科学的基础理论,同时也是数据科学何种的一种数据处理流程,完成原始数据的转化。
数据是对目标观察和记录的结果,本身没有用途。 信息是被赋予了意义和目标的数据。 知识是一种抽象的概念,但可以帮助我们去应用或行动的信息。 理解是知识与智慧的一种状态,是一种对为什么的理解。 智慧是被评估过得理解。
意义
数据可视化的作用体现于从看见物体到获取知识的过程。它兼具知识的获取与艺术的表达,两者同时同在,从而达到真、善、美的均衡,有效的挖掘数据中蕴含的信息、知识与思想。 真,即真实性,反应数据的本质和对事物与规律的真实的感受和认知。 善,即倾向性,表达对社会和生活具体的含义和影响。 美,即艺术性,是艺术与内容的和谐统一。
分类
数据可视化分为科学可视化(处理科学数据)、信息可视化(处理抽象、非结构化的数据)与可视分析(体现数据分析的重要性)。 科学可视化根据数据的种类分为标量(单个数值如密度、温度)、向量(有方向和趋势的值,如风向和力场)和张量(矢量的推广如压力和弥散)。 信息可视化处理的对象为抽象、非结构化的数据集合,如文本、图表、层次结构、地图等。 可视分析学是一门以可视交互界面为基础的分析推理科学。它有效的结合人脑智能和机器智能,以视觉感知为通道,通过可视交互界面,形成人脑和机器智能的双向转换,降低数据的复杂度到人脑与机器智能均可处理的范围。