1.2.3 颜色主题

不同的绘图工具(如R语言中的基础绘图函数、ggplot2绘图工具包等)都有其颜色主题。颜色主题是按照一定的美学规律设计出来的,对其灵活使用可以提高插图的美观度。颜色主题对用户(尤其是初学者)友好,使用户不必将大量时间浪费在配色的选择上。用户可根据自身绘图需求选择合适的颜色主题或自定义颜色主题。一些英文期刊会有专用的一套颜色主题,用户在投稿时将插图颜色主题更改为期刊要求的颜色主题即可。

图1-2-9展示的是R语言基础颜色主题(rainbow)、ggplot2默认颜色主题以及parula(MATLAB基础色系)颜色主题的可视化效果。图1-2-10展示的是ggsci包中3种常见期刊的默认颜色主题的可视化效果。

(a)rainbow基础颜色主题

(b)ggplot2 默认颜色主题

(c)parula颜色主题

图1-2-9 R语言基础颜色主题、ggplot2默认颜色主题以及parula颜色主题的可视化效果

R语言的ggplot2包及其拓展绘图工具包涉及的颜色主题主要分为3种类型,分别为单色系、双色渐变色系和多色系。

(a)NPG期刊的默认颜色主题

(b)AAAS期刊的默认颜色主题

(c)NEJM期刊的默认颜色主题

图1-2-10 3种常见期刊的默认颜色主题的可视化效果

1.单色系颜色主题

单色系颜色主题中颜色的色相基本相同,饱和度单调递增。它的主要维度是颜色亮度(lightness),一般情况下,较低的数值对应较亮的颜色,较高的数值对应较暗的颜色,这是因为可视化配图往往是在白色或浅色背景上绘制的;而在深色背景中,则会出现相反的情况,即更高的数值表示更亮的颜色。单色系颜色主题的次要维度是色调(hue),即较暖的颜色出现在较亮的一端,较冷的颜色则出现在较暗的一端。例如,人口密度的变化就可以使用单色系颜色主题进行表示。图1-2-11所示为部分单色系颜色主题示意图。

图1-2-11 部分单色系颜色主题示意图

2.双色渐变色系颜色主题

双色渐变色系颜色主题主要用在有一个关键中心值(midpoint)的数值变量中,其本质是两个连续单色系颜色主题的组合,关键中心值作为中间点,一般使用白色表示,大于关键中心值的分配中间点一侧的颜色,而小于关键中心值的分配中间点另一侧的颜色。此外,我们可以通过颜色的深浅进行判断,即中心值通常被指定为浅色,距中心点越远,颜色越深。图1-2-12所示为部分双色渐变色系颜色主题示意图。

图1-2-12 部分双色渐变色系颜色主题示意图

3.多色系颜色主题

当要表示的数据为类别型数值(类别变量)时,我们可以使用多色系颜色主题。在多色系颜色主题的使用过程中,需要给每个组分配不同的颜色。一般情况下,可尝试将颜色主题中的颜色类别设置为10种或更少,因为使用过多的颜色类别,可能造成分组混乱,导致杂乱的视觉效果。当现有的颜色类别无法表示全部数值时,可将某些数值类别叠加在一起,形成单个其他类别。图1-2-13所示为部分多色系颜色主题示意图。

图1-2-13 部分多色系颜色主题示意图

图1-2-14所示为使用ggplot2包根据tips数据集绘制的单色系、双色渐变色系和多色系可视化配图示例,具体为单色系颜色主题中的ylgnbu色系、双色渐变色系颜色主题中的spectral色系和多色系颜色主题中的set1色系。

(a)单色系可视化配图示例

(b)双色渐变色系可视化配图示例

(c)多色系可视化配图示例

图1-2-14 根据数据集绘制的单色系、双色渐变色系和多色系可视化配图示例

颜色主题在科研图形中起着重要的作用,它可以帮助读者更好地理解数据。以下是颜色主题对科研图形的几个作用。

强调重点:通过使用鲜明的颜色,可以将重要的数据或信息突出显示,帮助读者快速捕捉到关键内容。

分类和区分:通过使用不同的颜色,可以将数据分成不同的类别或组别,使读者更容易辨认和区分不同的数据集。

渐变和比较:通过使用渐变的颜色,可以在图形中表示数据的变化趋势或比较不同数据之间的差异。例如,使用渐变的颜色来表示不同的数值范围,从而展示数据的梯度或变化程度。

提供视觉引导:选择适当的颜色可以帮助读者在图形中找到特定的数据点或信息。例如,使用醒目的颜色来标记关键数据点或重要的趋势线。

增强可读性:使用对比明显的颜色组合可以增强图形的可读性。例如,将亮色和暗色组合在一起,以确保数据和标签清晰可见。