数据视觉化出错,误信息也能“美”

数据视觉化为庞杂的数据创建了功能强大、优雅的视觉影像,但也潜在着欺骗性。“我们正处在重复犯统计学错误的危险当中,只不过这些数据变得更美观了。”

数据视觉化错,误信息也能“美”-36大数据1

伪装意味着将自己混淆在周围环境中。在一个世纪以前,伪装对于掀着弓形浪,顶着烟囱,时刻躲避潜艇威胁的战舰来说是不可能的。于是,伪装术出现了,各种混乱的伪装模式一时间层出不穷,令人眼花缭乱。发现一艘花哨的舰船并不难,但要想让潜望镜操控员在发射鱼雷前迅速地判断出舰船的速度和方向却是一大挑战。华丽的伪装容易导致误判,而一些证据也恰恰证明了这一点。
 
现在,我们就来谈谈数据视觉化,虽然这一概念早在弗洛伦丝.南丁格尔在世时就已提出,但在以数据为基础的新闻报道里,这可算是最新潮流。南丁格尔不仅是历史上最为著名的护士,也是一项精美的视觉化技术——“鸡冠花图”的发明者,同时,她还是英国皇家统计学会第一位选举产生的女性成员。
 
数据视觉化为庞杂的数据创建了功能强大、优雅的视觉影像。它如同一篇优美的散文:带给人的是一次愉悦的体验,让人感觉到双手握着一股善的力量,但同时也具有诱惑力并潜在着欺骗性。由于我们面对数据视觉化的经验不像面对散文修辞的经验这么丰富,因此幼稚的我们会允许自己受到迷惑。在统计学上,太多的数据视觉化等同于令人目眩的伪装:强调通过外观吸引眼球,但最终要么没能达到传递有用信息的目的,要么干脆误导了我们。
 
我们来举个相对来说无伤大雅的例子,美国《纽约客》杂志近日制作了一幅关于不同收入层次的纽约市民乘坐地铁情况的网络图。从中,我们了解到纽约市存在收入不平等的问题。然后,我们被邀请点击不同的地铁线路图去看一看里面具有代表性的图表,向我们展示了各条地铁线上中等收入人群的收入差异。这个网络图确实很华丽,但是远不及一张地图的信息量大。它不过就是一件伪装成数据分析的艺术品而已。
 
另外一个更著名的例子就是由戴维.麦坎德利斯制作的动画图“Debtris”。图中每一个大小不同的方块代表着不一样的价值,其中一个小方块代表 2003 年伊拉克战争的预估成本,为 600 亿美元。而紧随其后另一个方块是预估的整个伊拉克战争的全部成本,为 3 万亿美元。图中还描绘了沃尔玛的收入,联合国的预算,金融危机给世界带来的损失,等等。动画图只是纯粹的花哨的伪装,自始至终都是在拿统计苹果和统计橘子相比而已。
 
麦坎德利斯告诉我们,信息展现在人们面前时可以是华丽的。然而不幸的是,错误的信息也可以是华丽的。或者,就像统计学专家迈克尔.布拉斯兰德所说的,“我们正处在重复犯统计学错误的危险当中,只不过这些数据变得更美观了。”
 
那些漂亮的“鸡冠花图”也不例外。它们显示了克里米亚战争中高死亡率的原因,强有力地论证了更好的卫生条件可以挽救生命。但是,南丁格尔的传记作者休吉.斯莫尔认为,南丁格尔选择“鸡冠花”是为了让论证做到更加细致精准。一个简单的条形图本可以更加清楚:南丁格尔的意图很明显,因为“鸡冠花图”显示出恶劣的卫生条件是致死的主因。
 
这种方式并不是告知人们,而是在说服人们——每当看到数据视觉化信息,我们应当牢牢地记住这一点。
 
VIA:21cbr 作者:蒂姆.哈福德

更多详细信息,请您微信关注“计算网”公众号: