大数据哲学研究的背景、现状与路径

大数据哲学

大数据正在掀起一场数据技术的革命,让我们进入真正的信息时代。它带来生产、生活、教育、思维方式诸多大变革反思,并标志着人类在寻求量化认识世界的道路上前进了一大步。面对大数据技术革命,作为时代精神精华的哲学及时作出了回应和批判,国内外哲学界已展开了大数据的哲学问题研究,而大数据哲学体系也正在形成之中。为此,我们有必要对大数据哲学的兴起背景、国内外研究现状以及未来研究的可能路径作一番回顾、梳理与展望。

一、大数据成为哲学研究的新对象

数据与人类密切相关,它应该是可与文字的发明相提并论的人类早期的重大发明和创新之一。数据由两部分构成,即“数”和“据”。所谓数,就是计量事物大小、规模之类的数字,而所谓据;就是根据,或者说计量的单位或语境。将数字与具体的事物相结合,让数字具有特定的语境意义,从而形成有根据的数字,这就是字面意义上的数据。①

在漫长的发展史中,数据世界曾发生三次革命性的变革。第一次是从无数据到有数据;第二次是从生活数据到科学数据;第三次是从科学数据到人文数据,进入“大数据时代”。

在数据发展的历史长河中,数据似乎并没有引起哲学家们的多少关注。当然,我们可以找出古希腊数学家、哲学家毕达哥拉斯,他在古希腊早期就破天荒地提出了“数是万物的始基”的观点,将数提升到本体论的高度。数和数据虽然具有重大的差别,但尚且可以将毕达哥拉斯看作数据哲学的鼻祖。在之后的两千多年的漫长历史中,数据的作用虽然从日常生活变成了科学研究的重要工具,但哲学家们却几乎把它遗忘。哲学家们热烈讨论着经验、观察、实验和理论等,唯独没有人对其中起着重要作用的数据进行哲学的批判和反思。但是,大数据刚刚兴起就引发了哲学界的热烈响应,数据这个历史上被冷落的范畴很快进入哲学研究者的视野中,成为哲学特别是科学技术哲学研究的新对象,大数据哲学也成了科技哲学研究的最新分支和研究领域。②

所谓大数据,从字面来看,就是规模特别巨大的数据资源,但实际上,大数据不仅仅只是数据规模巨大,更重要的是数据数量的变化引起了质变,数据不仅仅是自然或社会现象的数量表征,而是引发了一系列的本质变化。人们简洁地用4个V来概括大数据的特征③,即(1)量大(volume):数据规模巨大,超出一般技术手段的处理能力;(2)多样(variety):数据类型杂多,除了传统的结构化数据外,还包括文档、图片、音频、视频等非结构化或半结构化数据;(3)迅捷(velocity):数据采集、传输和处理特别迅速,几乎都是在线;(4)有价(value):数据成了新资源,只要找到合适途径,任何数据都可能变废为宝。

大数据技术的迅速兴起与其科学基础、技术条件、产业实践密切相关。首先,现代技术的出现具有坚实的科学基础,而如今的大数据是20世纪中叶信息科学以及世纪末复杂性科学发展的结果。随着计算机的出现,信息及其科学基础问题引起了科学家们的极大兴趣,信息科学及离散数学等在几十年中取得了长足的进展,事实上数据本来就是信息的载体。到20世纪90年代,复杂性科学兴起,它为我们提供了有机自然观,整体、联系、演化的复杂性思维方式以及全新的科学理论和方法。这些新兴科学的先行发展为大数据提供了理论基础。其次,诸多的新兴信息技术为大数据的出现提供了技术条件。人工智能是最近数十年的热点,如今的智能芯片已被广泛应用于各种设备和各种场合,成为传感器最重要的部件,特别是智能手机、智能穿戴设备等将智能技术推向了高潮。智能技术为信息的自动采集做好了准备。20世纪90年代普及的互联网为数据的在线快速传输提供了条件。云存储、云计算则为海量数据的存储和处理提供了可行的技术手段。最后,数据产业的快速发展为大数据提供了社会基础。进入21世纪后,Google、百度、Facebook、腾讯、亚马逊、阿里巴巴等新兴数据公司的巨大成功为大众迅速接受大数据技术提供了产业典范。由此,大数据技术在一两年的短暂时间里就迅速蹿红世界,我们也迅速被推入大数据时代。