从美国总统大选看大数据时代的数据新闻报道

数据新闻是在大数据时代兴起的一种跨学科、跨领域的新闻生产方式,它需要新的思维方式与多种能力的支撑。本文结合2012年美国总统大选报道,着重分析了英美各大主流媒体开展数据新闻报道的流程与特点。还探讨了社会化媒体对于数据新闻的推动作用,以及数据新闻的兴起与发展给新闻业者所带来的挑战。
 
在当前技术高速发展的信息化时代,信息(数据)规模的爆炸性增长是显著特征之一。从近年发展情况看,“大数据”主要被人们用来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。“大数据”具有规模大、价值高、交叉复用、全息可见等特征。当前对于“大数据”的关注与运用主要集中在IT业、市场营销、公共健康等领域,但事实上大数据的影响也波及到传媒业,数据新闻(Data Journalism)就是在大数据时代兴起的一种新的新闻生产方式。
 
数据新闻的报道流程
 
有关数据新闻的报道流程,不同的媒体与从业者进行了不同的概括、归纳。2010年8月,著名记者、数据驱动型新闻(data-driven journalism)项目负责人米尔科?洛伦兹提出了进行此类新闻报道的四个步骤,即挖掘数据—过滤数据—数据可视化—新闻报道制作完成。与此类似的是《卫报》的数据新闻编辑、数据博客Datablog负责人西蒙?罗格斯在《数据新闻分解步骤:在你见到的数据背后我们都做了什么》一文中的介绍。但他所展现的是一个多线程、全方位的报道流程:一方面处理数据,另一方面不断检验、质询数据的信度与价值,最后通过多种手段与渠道发布完成的报道。而伯明翰城市大学教授保罗?布拉德肖在《数据新闻的倒金字塔结构》中提出了如图所示的“双金字塔模型”(见图一),更全面地揭示了整个报道过程中,数据在质量以及传播上的变化。布拉德肖以倒金字塔来表示数据处理的过程,包括数据汇编、数据整理、了解数据和数据整合等四个部分。数据处理的最终目的是为了完成数据的可视化并实现有效传播。而数据新闻的传播则以“正金字塔结构”进行,包括了可视化、叙事化、社会化、人性化、个人订制化和使用等六个步骤。
 
事实上,不管是上述哪一种归纳,获取数据、处理数据、呈现数据都是数据新闻报道中不可或缺的三个阶段。本文结合英美主流媒体“2012年美国总统大选”的数据新闻报道来对这三个阶段进行解读。
 
1.多渠道获取海量数据。
 
数据新闻通常有两种方式:先有问题,然后根据问题寻找相关数据;或是从海量数据中发现、提出问题。无论采用哪种方式,海量数据都是数据新闻报道的基础。从业界实践来看,它主要包括从政府、企业、机构等公开的数据库中获取的二手数据和由媒体自行调查或抓取的一手数据。前者成本低廉且可靠程度高,是目前最主要的数据来源。以《卫报》“2012年美国总统大选专辑”数据新闻报道为例,在整个专辑的55篇报道中,不仅有与总统选举直接相关的选票数据、各州宣布选举结果的时间、竞选资金募集情况等内容,还涵盖了各种经济数据(如财政预算、债务、美国在对外战争中的花费)、美国人口基本统计特征数据以及各种社会数据等诸多相关背景资料。除了从政府公开的数据库中获得的二手数据之外,《卫报》还积极利用官方网站进行用户调查以获得一手数据。比如针对刚刚出炉的大选结果向全球用户征询意见,其后根据收到的用户态度反馈数据,专门制作了《奥巴马再次当选美国总统:全球民众的态度》动态数据地图。
 
2.全面谨慎地处理数据。
 
获取海量数据仅仅意味着数据新闻的开端。和其他信源一样,记者不应盲从,而需要对数据保留怀疑的态度。2011年度普利策调查性报道奖得主佩奇?约翰强调:所有的数据必须有来源,并经过交叉验证。面对海量数据,记者首先应评价数据的质量与意义,需要认真考察诸如:数据来源是否可靠,时效性如何,出于何种目的、采用什么方法收集而来,包含了怎样的主题,应选择哪些数据等一系列问题。

更多详细信息,请您微信关注“计算网”公众号: