数据可视化:如何利用色彩来佐证观点

数据可视化:如何利用色彩来佐证观点
 

在热度图中,用红色往往代表较坏的情况,而绿色或者黄色表示较好的情况。via Trulia

显然,有部分概念并不能和某一颜色产生关联,设计者们可能会将这当做是自由发挥的好机会,但是Stone则将其视为利用数据对文字与色彩的关联进行深度挖掘的时机。在2015年的项目研究中,Stone和Tableau的研究科学家Vidya Setlur利用谷歌的n-gram来计算颜色名称出现的频率,设计了一个能够生成有语义色彩的算法,然后在谷歌图片中检索其代表色。

举个例子,用n-gram方法搜索‘黄色’这个词,会出现与‘出租车’关联的结果。同时,用谷歌图片搜索‘出租车’,会出现各种颜色出租车的图片(比如在纽约的一些新车是石灰绿的),但其中黄色车的频率最高。Stone和Setlur设计了一个算法来对这些图片进行聚类并产生关联最强的颜色,这个时候,就是亮黄色。

即时你没有你自己的语言色彩算法,你也可以自己推断语义概念与颜色之间的关系,毕竟用这个是聪明的做法。