大数据背后的理性慧光 关于《证析》一书的访谈

近日,谷歌正式推出了一项基于大数据分析和智能搜索的新功能-Knowledge Graph(知识图谱)。Google在搜索页面右侧增加了大篇幅更明确的搜索结果,这种新技术可用于在传统的谷歌搜索结果中提供有关人物、地点和事物相关的流行事实,同时还能允许谷歌推进一种新的搜索方式,这种搜索方式不是提供与用户搜索词汇匹配的页面,而是提供与词汇所描述的“实体”或概念匹配的页面。谷歌表示,该公司已经编纂了35亿多个“事实”,这些事实包括5亿多个对象(或“实体”)的相关信息及相互关系。知识图谱是基于对5亿多个对象(或“实体”)之间相互联系交错组成的35亿多个“事实”经过智能搜索分析得出的结果,处理如此大量的数据目前也许只有谷歌这样伟大的公司才能做到。

大数据市场是现今众多公司关注和发力的焦点,如何存储、计算、处理海量信息等技术问题往往是大家所关注的问题,然而大家往往忽略了这样做的理由。

西方借用一个新词analytics借以指代信息化背景下人们对数字如何指导决策的研究与探索。例如,《Analytics》杂志给出的定义是“用数学、运筹学、统计学影响商业决策”,其目的是提升现实世界中决策的质量。郑毅通过多年潜心研究,搜集、阅读、整理大量文献,结合自身多年在数据挖掘领域多年经验和独立思考,撰写了《证析》一书, “证析”是作者对照英文单词“analytics”翻译而来,即对量化证据进行分析以影响决策的实践,Analytics 是本书的主题,是学科和时代发展到现阶段的新产物。

在如今大数据如此火热的今天,除技术以外,人们往往忽视了决定数字化证据在企业决策应用中成败的其他关键因素:包括如何摆正机器在决策中所处的位置、应在什么领域首先引入证析、证析资源如何组织、证析项目如何管理和评估、证析如何与企业现有决策流程相融合、以及如何理性正确的认识证析项目所给出的结论与建议。人们往往会重视技术,但是忽视这些证析实践中普遍遇到的问题,《证析》一书将对这些问题进行探讨。作者从 2009 年底开始构思与写作,其写作的思想与经验主要源于作者为国内大型国有 企业进行数据仓库、数据分析、数据挖掘等服务与研究工作的经历。

日前,《证析》一书已由华夏出版社正式出版,全书分为上下两编。上编主要介绍数字化证据指导商业决策的背景、思想与应用,下编则分别探讨证析在企业中取得成功的关键要素:战略、组织、考核与决策流程。

郑毅(《证析》作者)

我从中科院硕士毕业专业方向是计算机、人工智能,毕业后也一直从事数据挖掘相关工作,同时对数据在社会领域如何发挥作用、如何将技术和社会需求相结合感兴趣。但是在工作中我发现,数据的应用与社会需求之间的结合并不是特别理想,由学术端发起的数据应用以及从企业端发起的数据应用都存在一定局限性,因此自己开始尝试独立做一些相关研究,看看西方企业在如何利用数据,国外的学者对这个问题有什么思考和见解,起初并没有想写书,只是在自己感兴趣的领域做自己感兴趣的事,一边做研究,一边做读书笔记,逐渐积累了三十余万字的读书笔记。此时觉得,既然已经有这么多的读书笔记,如果整理一下形成一本书,跟大家共享一下自己搜集的材料以及对领域的思考。因此这本书的出现,和传统流程并不一样,编辑有一个主题,找作者写稿然后形成一本书。而是边研究边思考边做读书笔记,水到渠成,慢慢成形的。从开始立意到本书出版差不多两年半的时间。

这本书本身的重点不是做技术探讨,更多的是宣扬理性主义的思想与方法,在全球化、大数据这个时代背景下人们更有机会也更有需求进行理性地决策,轻视数据或迷信数据都不是我赞同的,这种实事求是的理性主义态度可以用孔子所提出的“毋意、毋必、毋固、毋我”来概括。

我之前从事数据挖掘工作。坦率来讲,在这个行业探索过程中,走过一些弯路。写这本书只是想能够帮大家搜集一下材料,把自己对这个领域的思考和搜集到的材料和大家分享,能够给大家提供一些不同的思考方法和看问题的角度。如果大家看到这本书,觉得在某一个点上获得了一定启发,在未来的工作上少走一些弯路,我的心愿就达到了。研究和写书时我的心态可以用柴静的一篇文章中的一段话表达“至于能做到什么样子,朱启钤早已说过,知道要做的事有”历劫不磨“的价值,就去做好了,如切如磋,如琢如磨,不知道何日可成,也许”终身不获见“,但是费一分气力,也就深一层发现。他说:‘但务耕耘,不计收获。’”

大数据、证析、云计算都是新兴的领域,在思想、技术、组织文化等方面有很多激动人心的领域值得我们去进一步探索与发现。技术对社会的改变,对整个生活的改变,对整个基础设施架构的改变,对决策的方式、合作方式的改变等等这些会对我们未来的设施和环境的会产生什么样的影响?这些都需要和有必要去做一些前瞻性的的研究和思考。云基地入驻企业已经多达19家,未来将会孵化和承载更多的公司,在这种情况下,数据能够为这些公司带来什么价值,这些企业能够利用数据为社会创造什么样的价值。这些都是让人比较兴奋的事情,值得去研究去探索。

雷涛(天云科技副总裁)

郑毅是一个严谨学者。他跟我周边生态系统当中接触的人不太一样,他们大都是企业端做市场的或做销售的。但他更像一个学者,给人的感觉是比较“清新”的。

他习惯于通过写的方式来表述自己的想法,并把观点写得很充分。这对我们有什么帮助呢?就是给我们这些太多急功近利的市场化的人一些看问题的新的思路,我们经常对很多工具化的东西形成一个固态的思路,而忽略了其背后真正的价值。

但郑毅看问题的时候能静下心来,看问题的本身。《证析》这本书对Big Data本身技术平台、算法没有谈太多,但是对于Big Data本身价值的延展谈了很多,就是如何实现数据可控、可度量,价值化。这本书不仅是专业人士需要看的,销售人员也可以从里面受到很多启发,书里有很多例子,有很多的销售思路,对销售人员是很有帮助的。

技术平台本身是不是真正Big Data的全部?这本书“证析”概念值得推广,是不是把工具用好就可以?还是不管什么工具,能够把数据价值挖掘出来,才是真正的价值?“证析”的立意在后者。

另外,如何评估和度量数据的价值,也是很多人以前忽略的。我们之前认为做BI,就是做报表,统计分析支撑决策。而决策效果如何度量呢?真正做最后一公里数据价值化方面也很重要,决定了决策能够获得更好的执行力。书里提到了一些思路,就是统计学的方式方法,验证这个结果是不是可被度量,可被量化。

证析定义了一个新的思考方式,从价值本身反向思考。就是重新思考一下,工具和数据对我们来说到底意味着什么?因为有了数据而思考价值,还是因为价值而去定义新的信号源产生新数据。工具(技术平台)本身也会发生蜕变,从关注流程和效率的,转向更面向前端市场的数据驱动平台。数据运营将会是一个全新的模式,将IT从支撑角色转化为业务引导角色。

李欣利(本书编辑)

华夏出版社的编辑李欣利是通过一位朋友介绍认识作者郑毅的。第一次读《证析》,让这位有着十几年编辑经验的自身人士就感觉到了该书的与众不同,作者严谨、认真的态度让他佩服不已。但是由于《证析》一书专业性强、覆盖人群比较少,因此他约见郑毅面谈。通过聊天发现,他们两人竟是老乡,因此越聊越熟悉,郑毅对学术研究严谨、认真的态度与坚持让李欣利感动。至今,二人已成为非常好的朋友。

李欣利认为,郑毅是一位具有理想情怀的文艺范儿的理想主义者。《证析》一书虽然涉及的是一个全新的领域,而且是这个概念是第一次引入中国,但是在郑毅笔下并未显得特别晦涩,而是非常具有人文色彩。作者通过许多的例子让大家去理解技术和人,且从整体来看,全书的每个章节都贯穿着作者自身的思考,慢慢的引导人们认识证析的价值。

在商讨《证析》一书的封面设计时,出版社给出的设计并未使郑毅满意,但是郑毅没有直接否定,而是一点点的提出自己的要求,希望封面尽量做到低调并且经典,到最后,李编发现,郑毅选择的竟然是小说风格的封面,郑作家的“文艺范儿”在此体现的淋漓尽致。