大数据与人文社会科学研究的变革与创新

习近平总书记在谈到如何繁荣发展中国特色哲学社会科学时,要求我们善于“运用互联网和大数据技术,加强哲学社会科学图书文献、网络、数据库等基础设施和信息化建设”,这为信息化时代的人文社会科学研究的方式变革与理论创新指出了正确的方向。大数据正在成为当前中国社会快速信息化的最重要表征之一。我们应当深刻认识大数据及其对人文社会科学研究所提供的机会与挑战,自觉促进人文社会科学研究的变革与创新。

充分认识大数据及其多维意义

何为大数据?我国《促进大数据发展行动纲要》指出:“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。”维克托·迈尔-舍恩伯格和肯尼斯·克耶编写的《大数据时代》中提出“大数据”的4V特点:Volume(体量浩大)、Velocity(生成快速)、Variety(模态繁多)、Value(价值巨大而密度较低)。

在我们看来,大数据的产生是人类探寻世界发展规律和规划自我发展道路上的一种积极产物。大数据及其意义似可从以下几个层面来加以解读:

在直接的意义上,大数据是相对于“小数据”或者传统数据而言的,指人类首次有可能从自然、社会和人的活动中获得数量巨大、类型多样、存取高速、富于价值意义的数据并将其集合起来,形成巨大的数据库,把世界和事物的存在方式转变为周全详尽的海量数据存在方式,借助于它们来实现对外部世界和自我进行更为全面、细致、深入和准确地把握。

在较广的意义上,大数据意味着与大数据采集、存贮、处理、传输和应用相关的整个信息技术、设施体系和运行方式等,构建起一个个数据化的世界。人们有可能在不直接接触现实世界的前提下通过接触数据世界而实现对现实世界的认识与把握;通过感知和运行数据世界来重构和影响现实世界,形成真实世界与虚拟世界的互动,展示出自然、社会和人类的数字化进程,表明现代信息科技和网络世界发展到了全新阶段和更高水平。

在更广的意义上,大数据意味着高度信息化时代的人们自觉或者不自觉地从事着数据化的生产、生活、交往、思考与实践,构建起一整套紧密依托于现代信息网络和数据化系统的生产方式、生活方式、交往方式、思维方式和治理方式等,大数据不仅改变着人类的社会生活,也在全面引领着人类生存方式的革命性变革与时代性提升。

在最广的意义上,大数据意味着一种依托于大科技、大信息和大数据而构建的全新的自然图景、社会图景和人类图景,以大数据的方式来看待自然、社会和人类自身,正在转变为一种自然观、社会观、人类观、价值观和方法论,标志着人类认识世界和认识自我、改造世界和改造自我进入到更加全面清晰准确的水平和更加自觉有效的阶段。

探索大数据提供的特殊机遇与挑战

从总体上看,与人文社会现象的多样性和复杂性相对应,人文社会科学也是一个庞大的学科群,内部存在着迥然相异的学科,不同的学科与大数据的关系和关联度也有很大不同。例如,从总体上看,传统的社会科学学科,诸如经济学、管理学、社会学、政治学、法学、教育学等学科对数据的依赖性较强,大数据所展示的意义会更充分,而文学、历史、艺术、哲学等更加关注人们的精神生活、价值理念、心灵世界等,对外在数据的依赖性较低,大数据所展示的意义相对较弱,在大数据时代所受到的影响也相对较小。即就大数据本身而言,也应当看到,大数据并不是一切,并没有根本取代小数据和传统数据;大数据技术尚在发展之中,并不能简单取代传统数据技术;大数据研究也存在很多问题,我们没有必要也不应该简单地用大数据研究来遮蔽传统的人文社会科学研究。

但无法回避的是,方兴未艾的大数据已经给人文社会科学研究提出了很多问题和挑战,也提供了许多创新的机会。

首先,从“假设出发”还是从“数据出发”开始我们的研究?“大胆假设,小心求证”,一直是我们从事人文社会科学研究的基本模式。大数据时代,海量数据甚至“全数据”的存在成为我们很多学科和领域研究的前提,它们表征着许多难以辨析的事实,要求我们做出必要的解读和说明。

其次,以“个别样本”还是以“海量数据”为对象来开展研究?由于采集数据困难,过去人文社会科学的很多研究不得不依赖于抽样调查,采集到的永远是个别样本信息,为此而不得不加大抽样的比例,但最大比例的样本也不可能穷尽对象,因此所有的结论都带有推论的性质。大数据时代,人们有可能通过就一定事物采集全样本,提供全数据,为人文社会科学研究提供更加坚实可靠的对象性基础和前提。