美国学者质疑“大数据”理论

编者:2012年底问世的《大数据时代:生活、工作与思维的大变革》,以一个带有预见性的新概念,引起全球热议,至今仍居各大图书排行榜前位,作者维克托·迈尔—舍恩伯格也因之被誉为“大数据时代的预言家”。舆论认为,“大数据”颠覆了千百年来人类的思维惯例,对人类的认知和与世界的交流方式提出了全新的挑战。同时,因“大数据”理论引发的激辩和质疑也络绎不绝……

近日,美国两本著名学术杂志同时关注大数据话题:《外交》杂志5/6月刊将《大数据的兴起》一文作为封面文章,认为大数据将改变人类思考和看待世界的方式。而《外交政策》杂志则在网站上发表微软研究院首席研究员、麻省理工学院公民媒体中心客座教授凯特·克劳福德的文章《对大数据的再思考》,从五个方面对大数据理论提出质疑。

大数据带来变革

《大数据的兴起》一文作者是近 期 引 发 热 议 的 专 著 《 大 数 据 时代:生活、工作与思维的大变革》作者肯尼思·库克耶和维克托·迈尔—舍恩伯格。在文章中,库克耶和舍恩伯格肯定了大数据对社会的巨大变革能力,称大数据不仅将改变人们的生活和工作,而且将改变人类认识和思考世界的方式。

两人认为,随着技术环境的变化,一方面世界出现“数据爆炸”的现象,另一方面人类处理数据的能力也大为增强。由此,人们对待数 据 的 方 式 出 现 了 三 个 变 化 : 第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性 , 而 放 弃 对 精 确 性 的 追 求 ; 第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相互联系。这一切代表着人类告别总是试图了解世界运转方式背后深层原因的态度,而走向仅仅需要弄清现象之间的联系以及利用这些信息来解决问题。

《大数据的兴起》列举了大数据 在 医 学 、 消 费 品 领 域 的 应 用 实例。但作者同时认为,大数据的影响力绝不仅限于商业范畴,它将深远地改变政府的运作方式和政治的性质。他们在文章中写道,“在推动经济增长、提供公共服务或进行战争等方面,那些能够有效利用大数据的人将拥有胜过别人的巨大优势”。不过,两位作者承认,大数据应用在公共服务领域比较成功的案例出现在城市这一级,因为在这个级别上获取数据和利用信息进行试验要容易一些。

学者提出五质疑

克劳福德的文章认为,大数据是当前的时髦术语,但人们是否能依靠海量数据揭示人类行为的规律仍值得怀疑。她针对大数据理论从五个方面提出质疑。

第一,大数据中存在偏见和盲区。大数据的倡导者认为,“有了足 够 的 数 据 , 数 字 就 可 以 自 己 说话”。但克劳福德认为,数字无法自己说话。不论其规模有多大,数据集归根到底是人类设计的产物,而大数据的工具并不能使人们摆脱曲解、隔阂和错误的成见。当大数据试图反映人类所生活的社会化世界时,认清这些因素就尤为重要。偏见和盲区存在于大数据中,从大数据得出的结论并不比人为的意见更客观。

第二,大数据在一定程度上可以使城市变得更加智能和高效,但具体效果如何取决于市政官员对数据 及 其 局 限 性 的 了 解 。 克 劳 福 德称,大数据的倡导者认为,“大数据将使我们的城市变得更加智能和高效”,在一定程度上确实如此。但另一方面,数据在生成或采集的过程中并不都是平等的,大数据集存在“信号问题”即某些民众和社区被忽略或未得到充分代表。因此,要想运用好大数据,市政官员必须对数据及其局限性有充分了解。

第 三 , 大 数 据 可 能 导 致 基 于群 体 的 歧 视 。 大 数 据 的 倡 导 者 认为 , “ 大 数 据 对 不 同 的 社 会 群 体不 会 厚 此 薄 彼 ” , 其 理 由 是 , 原始 数 据 的 分 析 是 在 大 规 模 水 平 上进 行 的 , 因 而 避 免 了 基 于 群 体 的歧 视 。 但 克 劳 福 德 认 为 , 实 际 情况 并 非 如 此 。 由 于 大 数 据 能 够 作出 有 关 群 体 不 同 行 为 方 式 的 论断 , 而 且 其 使 用 的 主 要 目 的 是 把不 同 个 体 归 入 不 同 的 群 体 中 , 因此大数据不仅不会避免群体歧视,还可能加重这一趋势。