作为一名刚入行科研不久的小编
平时大量的时间花费在了阅读文献上
有些文献排版美观赏心悦目
有些则是惨不忍睹
不由道一声审稿人辛苦
作为论文的灵魂
图片永远是第一关注点
也往往是视觉的重灾区
有的图片深谙我国传统文化
红配绿将喜庆带在身上
有的图片则狠狠地考验读者眼力
几根数据线交叉又撞色
带读者们玩顺藤摸瓜的游戏
也有很多图片选择了中规中矩的彩虹配色
但效果并不理想
不局限于科研领域
在大众与科学界的交流中
图片也是信息的重要载体
你可能不会去关心黑洞成像复杂的建模公式
但你一定对黑洞的照片印象深刻
你可能不会去关心天气预报系统背后的机制
但你一定看过气温的分布图
M87黑洞照片 | 来源:参考资料1
全国气温分布图 | 来源:天气预报_气温预报 (nmc.cn)
好的科研绘图配色令人印象深刻
也能更准确地传递数据信息
今天小编就带大家看一下
怎样去选择最适合自己数据
能够轻松俘获审稿人芳心的
科研绘图配色
01
拒绝彩虹配色
最早使用彩虹配色(rainbow-like colour)的地方已经很难考据了,但彩虹配色无疑是科研绘图中最常见的配色之一。所谓的彩虹配色就是类似彩虹,赤橙黄绿蓝靛紫序列分布颜色。
彩虹配色 | 来源:参考资料3
在人眼中有两种类型的感光细胞,一种是视杆细胞,对光强度的变化敏感,负责黑白视觉;另一种是视锥细胞,对光强度不敏感,但是可以分为三种,分别对三种不同频率的光敏感,负责亮视觉以及认知颜色。三种视锥细胞配合,使得人们能够通过识别不同颜色完成对信息的认知。彩虹配色的每种颜色饱和度较高,亮度也很高,对人具有极强的视觉吸引力。
再加上大多数的绘图软件,如Matlab、Paraview等,都将彩虹配色设置为了默认配色,不科学的彩虹配色在很长一段时间内得到了广泛地应用。
为什么说彩虹配色不科学呢?主要原因有三。
1
颜色不遵循自然感知排序
什么叫不遵循自然感知排序呢?简单来说就是数值大的应该更明显,更亮,让人眼先识别到;数值小的后识别。对人眼识别来说相对亮的颜色更容易识别,但是彩虹配色中颜色的亮度都很高,在我们的视觉系统中无法做到有序感知,这会导致视觉的混乱。下图中左边颜色的亮度都很高,相对于右边的配色左边的彩虹配色更难区分值的大小分布。
彩虹配色(左)与科学配色(右)对比 | 来源:参考资料3
2
感知变化不均匀
在数据变化时,人眼对颜色的识别应该也相应地发生变化,这样才能较好地反映真实数据情况。但是彩虹配色在青色和黄色区域变化较快,而在蓝色、绿色以及红色区域变化较慢,这就会导致人们从颜色中获得错误的数据信息。
以下图为例,左图为灵敏度函数图的真实分布,右图为采用了彩虹配色后的灵敏度函数图。经过对比我们可以发现,在图片上半部低对比度区域,彩虹配色的颜色变化不明显,而在高对比度的下半部,颜色变化又过于尖锐不够平滑。
灵敏度函数图的灰度图与彩虹配色图 | 来源:参考资料3
再看月球表面形貌图,a是彩虹配色图(jet),b则是采用了turku配色的图片。同样的在彩虹配色图中相当一部分的陨石坑形貌难以看到,一部分起伏形貌区域的变化也被夸大或缩小,产生了失真。
月球形貌图。a. jet; b. turku. | 来源:参考资料4
3
对视觉缺陷不友好
研究数据显示世界上约有0.5%的女性以及8%的男性患有色觉缺陷(colour-vision deficiency,CVD)。彩虹配色对于这部分人群十分不友好。
02
配色类与型
其实从上面对彩虹配色的分析中就能看出来,一个好的、科学的配色应该是什么样的,它应该满足三方面的要求:感知颜色顺序(遵循自然感知排序)、感知一致性(感知变化均匀)以及普遍可读性(视觉缺陷友好)。
在绘制地图(map)型数据图时,为了实现最佳的数据表示,让配色有效地传达底层数据及其性质,需要根据情况选择适当的地图种类以及类型(classes and types)。
彩色地图的类与型以及相应的推荐配色 | 来源:参考文献4
1
Classes
彩色地图可分为四个主要类别,顺序类(sequential)、发散类(diverging)、多序类(multi-sequential)以及循环类(cyclic)。
对于没有特殊点的顺序数据,顺序类最为合适。顺序类具有一般性特点,能满足大部分数据集的绘图需求,也推荐将绘图软件中的默认地图配色设置为顺序配色,例如 batlow 。为了突显极值,在浅色背景下,应选用较暗的一端(例如 batlow 的深蓝色一端)代表最大值;在深色背景下则正相反,需要使用浅色(例如,batlow 的浅粉色末端)来突出最高值。
发散类适合表示包含偏离中心值的数据点的数据集,也称双峰数据集。发散类的焦点可以是两边的极值,也可以是中心值。还记得开头展示的气温分布图吗?这就是发散类的一个例子。roma 就是一种发散类配色,这类配色需要将色条的中心与数据的中间值对应,例如将气温的中间值与色条中心的颜色对应。为了突显极值,浅色背景选择两端暗色的配色(如roma),深色背景则选择两端浅色的配色(如berlin)。
气温分布图图例,极高温和极低温分别用深红和深蓝色表示,居中的温度则用浅色表示
多序类是一种特殊的类别,必须仔细调整以适应原始数据。多序类由两个或多个相邻排列的顺序类组成。类似于发散类,但几个部分的亮度增加是相同的方向。与发散类一样,多序类的中间点需要进行调整以对应数据集中的中间值。oleron 便是一种多序类配色。
oleron 配色下的地球形貌图。蓝色部分代表海洋地形,绿褐色部分代表陆地地形,白色作为过渡代表海平面。| 来源:参考资料4
循环类可以用来显示周期性的数据集,比如达尔文火山表面在给定时间内的隆起。它没有开始和结束,一般不需要对数据做过多调整,也是比较通用的一种类型。romaO 便是一种循环类配色。
达尔文火山表面在给定时间内的隆起 | 来源:参考资料4
2
Types
彩色地图可以进一步分为连续型(Continuous)、离散型(Discrete)以及分类型(Categorical)。其中连续型和离散型较好理解,表现在配色上便是颜色变化是连续的还是离散的。通常具有科学性的连续型配色会使用256种颜色,例如 batlow;离散型配色则有可以选用10、25、50或者100种颜色,batlow10便是选用了10种颜色。在使用离散型配色时,需要将彼此接近的点用统一颜色表示,因此需要恰当地选择颜色数量,避免降低数据表示的准确性。离散型与连续型的区别就在于颜色数量的不同。
batlow 与 batlow10
分类型是一种比较特殊的类型,其特点是不需要考虑数据的有序性以及变化特点,旨在显示单独的数据点。因为这种特性,分类型几乎适用于所有的作图,但却很难找到符合科学性要求的配色方案,目前仅有batlows 供大家参考。
batlows
03
选配色思路
针对配色的选择问题,Crameri等人给出了一般思路。在拿到要绘图的数据之后,我们只需要问自己这样几个问题:
1. 数据有序吗?
2. 数据有中间值吗?
3. 中间值与数据的序有关吗?
4. 小的波动是否重要?
5. 数据是否有空值?
6. 数据是否有直觉上适用的颜色?(比如气温用红蓝色)
7. 背景色选取是否正确?
参照下图的导引,问清自己这几个问题之后,配色的选择便不再是问题。
参考资料:
Akiyama, K. et al. First M87 event horizon telescope results. IV. Imaging the central supermassive black hole. Astrophys. J. Lett. 875, L4 (2019).
人眼对光的感知 - 知乎 (zhihu.com)
https://blog.csdn.net/dsfsdffgfd/article/details/90210806
Crameri, F., Shephard, G.E. & Heron, P.J. The misuse of colour in science communication. Nat Commun 11, 5444 (2020).
编辑:乐子超人