图表会说话:Excel数据可视化之美
上QQ阅读APP看书,第一时间看更新

从概念到图表

正如我们所看到的,要画一张图表需要有数据表、一个具有坐标系统的二维构思、一个或更多选定的几何图元以及视网膜变量。

我们回到学生专业分布的例子,并利用同一个数据的两个不同版本(图 1.14)来测试这些要素。简单起见,我们仅显示 2010 年的数据,沿着纵轴绘制数据点。每个数据点的坐标形式都是 (2010,y)。例如,社会科学的坐标为 (2010,31.8%)。图中最大的数据同时也对应于图中离原点最远的点,点与点之间的相对距离也反映了图中的差异:在这个例子中,表示社会科学的点(31.8%)距原点的距离大约是表示健康的点(16.3%)的两倍。

图 1.14 沿单轴绘制数据

尽管我们绘制了一幅很小的图,但仍然可以立刻抓住其内容:学生选择的专业集中在三个领域(社会科学、工程和健康),紧接着的四个领域很接近,而最后一个点“农业”则几乎只剩残值。

在图 1.14a 中,保持维度 xz 固定,而维度 y 变化。而图 1.14b,则增加了一个新的变量。这个名义变量使用色彩或灰阶来将学科领域(例如社会科学和人文)分组。换句话说,我们对点进行色彩编码来增加新的信息,改变 z 维度。

新的信息可以用来比较。根据目的不同,这可能会成为优势(增加了原始信息的复杂度),也可能成为噪声(更多偏离要点的细节)。红色的点比其他点更能吸引注意力,影响了我们阅读图表的方式,这与视觉修辞的思想是一致的。