圆桌论坛:大数据是怎么解决问题的

糜万军:请各位结合具体的案例,或者是应用的场景,我们讲一些发展了解决了什么问题,是怎么解决的?按应用场景讨论一下。

林春雨:在这之前,我先给大家讲一个刚才发生的例子,今天我一大早,八点半从家里出发去亦庄,因为这个会有两个会议议程。昨天是云计算的大会,我下了APP就看到云计算在亦庄,我的经验主义就决定今天就奔着亦庄去为,这点证明经验是靠不住的。我赶紧用百度地图从亦庄跑回来,我选择了一条错路很堵车,我就在想这时候数据也是靠不住的。因为百度告诉我这边没有太堵,但是我过去的时候堵的时间远远超过百度上面的红线。所以数据也是靠不住的。

这时候我在想未来什么东西最重要?我觉得分析是最重要的。能够准确的把数据分析成有用的结论,这是最重要的。在大数据处理里面,最大的核心是分析。昨天我们跟一个政府的师长汇报项目的时候,他们是从非技术员的角度去理解大数据。最后他的结论是:大数据无非就是把这些散落的垃圾重新组合里面,发现里面的价值。我觉得他的总结非常到位。

去年4月份,我们一直在从事大数据的技术,后来总结成四个缩写:第一个就是SB,第二个是AE,都是IT我们最喜欢的东西。大数据首先要解决数据源的问题,很多公司都在打造数据,你有什么数据。政府、包括证监会都在打造数据,首先要解决数据源的问题。数据源有三类:第一个是互联网数据,第二个业务数据。第三个就是未来的物联网的数据,现在我们也得不到。我们为什么做社交?社交能够把人们的行为记录下来,有足够的数据供你研究,这有是S。

第二、B代表什么?一个是商业,一个是大数据,B为什么那么重要?你的方向比努力更重要。现在大量的人在做股票的预测,作为一家上市公司的高管,我自己无法预测公司股票的走势,我不相信你能够通过一些方法预测这个股票。不是说大数据什么都能做。

第三、A就是分析能力,我们看一些不同的行业,有很强的分析能力hadoop不代表一切。最核心的分析问题,甚至包括数据库的很多问题,他都没有办法解决。

第四、E就可视化,大数据太了大,我们需要有一个可视化的工作,把那些复杂的东西,用最简单的方式表达出来。谢谢大家。

赵国栋:我讲一个金融类的案例,这个公司的名字我不说了,说了有点做广告的嫌疑,因为它还没有上市。这家公司以前是做供应链的管理软件,在做这个业务的同时,他发现他掌握了这个材料里面一些采购商的所有的数据。基于这个数据我们能不能做贷款,后来发明了一套新的模型,完全根据用户采购的数据,上下游的数据,精确的定价这个用户的信用。根据这个信用去银行做贷款。最高的金额做到1500万的贷款,没有担保,也没有抵押,他们做了五年。延伸出来来看,我们探讨互联网行为发展的时候,我们常用的说法是互联网颠覆金融,未来大数据重构信用。

张福波:我想给大家分享一下我们在大数据方面做的事,我们有三个层面?大数据解决IT的技术,大数据解决数据平台的应用,最后是大数据的应用问题。我们是搞IT的,我们发现用户会有一个问题,我80%是传统的架构怎么办?这就是我们的困惑。我们有很美好的想法,但是具体的落地,你会发现一下子需求缩减了,这就没有多大的意义。这是我们在做大数据犯的错误,大数据也好,或者是存储也好,我们必须回答解决用户什么问题。按这个角度来讲,我们可以把存储80%的数据管起来。IT的投资不能浪费,分布式的存储不能解决所有的问题。

我们觉得把存量的数据存起来能达到什么样的应用?就是安全。可能把每个工程师上网,上网的行为记录下来,记录下来以后,对每个人可以建立一个行为的模型。这样就发现,某一个人在一天上机的行为,和原来的历史差别很大,有两种可能,一种是有人冒充他在上网。第二个可能,他在做以前常规的事情。

宣晓华:分析和应用是我们的核心能力,十年来我们在服务运营商,电商企业、金融企业。数据的应用无非有几个,一个是增加收入,第二个是增加成本,第三个是做决策。

在增加收入的过程中,我们有很多的服务企业,都是大零售的企业,不管是运营商也好,航空也好,电商也好,很大的工作是增加收入的。怎么增加收入?因为它有大量的客户,十万、几十万、上百万、千万级也好。怎么增加收入?很大的工作就是能够延长这个客户,在我这家企业的时间。这样就是客户关系关系,或者是客户保有是非常重要的工作。

怎么提升每一个客户消费的价值,一个是把时间延长,第二个是把消费的能力增加,发生交易的收入增加了,这是产生收入非常好的方式。对大部分的零售企业,一个是时间,怎么延长时间?要洞察客户,分析这个客户需求是什么,消费的能力是什么?你能够有方式,提供合适的产品。在这个基础上有合适的价格。

匹配一个产品,和定价是非常重要的。怎么做这件事情,需要大量的分析和大量的产品的组合。基于分析和大量的产品的组合,同时有一个比较合适的渠道给他,让他知道这个合适的渠道,可以是电话,也可以是宣传,也可以是交互式的形式。这样我们做了很多的项目,可能有上百个这样的项目,来帮助企业使用好。

另外一个例子更有意思。我不但没有增加非常好的成本,运营商可以让你欠费,信用卡就是很好的例子。另一种运营商也让你话费用完继续 打电话,通过很好的分析客户的信用,让你在适当的时候欠费继续使用这个服务。这样你打电话的网络成本很低,通过这样就提高了他的收入,这也是提高收入的一种方法。做的决策有很多,比如说给人们发放信用卡,这都跟决策有关系。

史周军:我是来自用友公司的,这个公司目前是负责了大型,中型、小微企业近200多家,近期我们也在看企业的数据发生很大的变化。第一是这个数据,我们原来数据主要是过去的数据,现在的数据,目前有未来的数据。原来我们的数据是按年、按月、按日,目前到了时、分、秒,个别的行业到毫秒、微秒。

第二个是空间的数据,我们原来在企业管理里面,我们处理一些数据的时候,他可能是一些点,甚至是一些流程。目前我们在每一个点上,我们可能有一些关联,如果再加上实时,位置关联信息,状况,这是从点到面了。数据有很大的增长。

第三个维度就是类。在企业管理里面,我们原来更多处理的是一类数据。一些分类,批量的数据。到目前看,这个远远不够,我们已经到了每一个类具体的点,包括这个数据从产生到消失。

还有一个维度是聚集度,原来企业关注的数据更多的企业的人财物大数据,这些数据关系非常的复杂。现在企业已经从核心的数据,到各种的数据。包括一些大量的非结构化的数据。视频、声音,文本、日志的数据,还有流数据。这是从企业的内部,但是这个聚集度,已经从企业走向了产业链。企业内部的数据,包括跟客户,供应商,以及他们的一些社交。这个范围也在大幅度的增加。

正是这四个方面,我们说大数据,大家可能谈更多的是分析,其实远远不只是分析领域,除了我们讲的这些方面,像更广大的交易类,各个领域都涉及到了。这是第一个方面,就是企业未来一定是数据的企业,不同的数据,带来了很多的应用。这些应用,企业这么多的变化,也就是技术推动的变化。我们用友公司怎么推动?我们有两个平台。一个叫EAP,就是我所在的这个部门,还有一个部门是做数据应用的这个就不介绍了。

大数据跟其他的领域,包括跟云做支撑,移动做采集,作为一个端,还有社交,大量的关系数据。从EAP角度来讲,我们分了四层,基础设施层,我们有云平台。另外在数据处理层,我们有AE产品,这个主要是处理结构化的数据、非结构化的数据,还有流数据。结构化的数据,不是关系型数据库数据量就小,它的能力就差。不是这样的。我们结构化的数据里面,处理其他的数据量,依然可以是量级的。

再往上就是有一个分析的平台,包括结构化数据,再往上就是支持互联网,主要是B2B电子商务。另外就是移动、社交之类的。技术领域的面很广,如果说我们企业需要把这些技术做到,挑战非常大,它涉及的领域太广。这也是为什么我们要做一个平台,来帮助我们的伙伴,都可以用这个平台,在这个平台的基础上,更方便的去服务我们的用户客户,创建一个大的产业。

糜万军:我觉得不管是对各公司,对投资人,对创业者,都是属于一个伟大的时代,有很大的机会,大数据加上这个行业,在改善着我们的生活。各位都是数据产业的引领者、实践者,结合技术供应层,谈一下对未来的展望?你觉得未来有什么问题和需求,我们在规划中,或者我们准备颠覆谁,可能会被谁颠覆?

林春雨:拓尔思现在最大的还是政府,我们在政府方面的应用,可能会得到很大的提升。大数据分析分两部分,一个是过去数据的分析,另一个是预测。有一个很大的词是舆情的分析,舆情就是公众的观点,我们需要通过公众观点的采集,把这些东西提供给相关的政府部门进行决策。

有一个例子,某一个领导想做五大工程,他就展开宣传,我们就通过对社交网的采集,就可以分析出来,哪些工作得到了广大群众的拥护,哪些工程做的不好,这个可以有一个判断,他可以根据这个判断决定未来执政的重心,这是政府向更加开放、民主化的进程发展。

第二是预测。有一个天气预报,就是对所有过去历史资料的一个总结,才能预测。其实我们最近跟教育科学院做了一本年度的报告,我们就把往年所有的教育会发生的事情总结起来,发现教育的舆情也是有规律的。六七月份上学之前,会发生很多的乱收费的事情。比如春节之前,会发生很多堕胎的事件。你会发现当你把这个大数据的分析,按照时间线拉长,很多规律性的东西会出来。我们就可以这个规律性的东西,挖掘出最有价值的。这是一个技术,我给大家的建议就是,你注重分析当前的数据的时候,想一下把时间线拉长,把过去的数据再分析一下,会发现有很多的价值。

赵国栋:谈一个产业的趋势,很多的公司,你可能看起来不好说这家公司是属于什么行业?比如谷歌公司,它是媒体行业,互联网行业,还是制造业,还是造汽车的,你不好说它是什么行业?比如国内的小米公司,他现在自己做小米的手机,开发一些应用的软件,他未来可能靠卖电影,靠内容服务去赚钱,他应该属于哪类公司呢。产业里有很大的需求就是融合,产业跟产业的界限变得很模糊。我们很难说它是什么企业,只好笼统的称为大数据企业了。

张福波:我有一些不同的看法。我认为数据应用,就是把“大”去掉,数据已经存在了,数据和大数据差别在哪?为什么叫大数据?大数据对于一些老客户来说,大数据对他来说就是成本。第二,它数据的量级变大,因为是存储协议,不需要做数据的压缩,这也是一种改变。所以我认为对企业来说更多的大数据的成本,就是把数据存储的成本降低了。

对于一个社会来上,当下谈大数据很多,但是你必须要拥有数据,才能做大数据的应用。包括我们运营商也好,包括医疗也好,我觉得未来谁能够在大数据里面,能够做颠覆性,就看谁拥有数据。谁拥有数据,谁就有话语权。数据是他的,他可以做一些什么东西。我看好将来大数据,一个是医疗、养老,还有通讯,社交,这几个领域当中可能会创造出更多的应用出来,给老百姓提供更多的方便。

吴强:大数据的未来,有的时候比较难说清楚,但是大数据的机会很多。我们一开始创办这个公司,就是因为数据越来越多,数据是很有价值的。从这个角度来说,我认为各行各业,一家企业他可以通过数据优化他的流程,他的管理、决策,他的需求是巨大的。我们是数据挖掘的解决方案提供商,一般来说,我们都是针对怎么样对某一个行业,或者是对企业,行业,或者是一个社会,或者是一个个人,怎么让数据变得更美好,效率更高,或者是决策更简单。已经看到了各式各样的企业,跟大数据有关,所以我相信对我们也好,对在座的每一个人也好,有非常大的市场和机会。我们是不是想颠覆谁,或者是被颠覆,我们的定位从来没有想过要颠覆谁,或者是被谁颠覆,我们自己认为是帮助客户,帮助社会,帮助行业提供数据的解决方案。我们本身不是颠覆某一个人,只是让那个行业更有效,更简单。

大数据的持有者是不是某一家公司?我觉得是每一家企业最后都有大量的数据存在,而且有新的方式积累这个数据,变成每一家企业也好,政府也好,社会也好,会有大量的数据存在。数据肯定是一个资源,但是这种资源,不是说某一家,大家能够全部的占有。包括现在每一个人,如果你们看可穿戴式设备的发展,每个人都拥有非常大量的数据,没有人都变得有很多的资源。有了这个资源,怎么样让这个资源对个人有用,这需要大数据的分析,或者是数据的服务来提供。

我们公司来说未来可以做什么?我们要做的一点就是目前只做了很少的行业,金融、运营商我们做了一些工作,我们发展的大量的,为电商提供很多的服务,这种服务的形式不一样,有的是咨询的服务,有的是通过云模式提供的服务,以后还有各种不同形式的服务。但是我们对某些领域很感兴趣,刚才讲的医疗、健康、环保都很感兴趣,包括对个人,怎么样基于个人的数据,帮助他学习,提升健康。或者是帮助他个人用好时候,管理拥有好他的财富,这个可做的事情很多,不是一家公司可以做的。

史周军:简单的说一下,其实大数据,未来从行业来看,大数据的应用比如互联网应用、供应链应用,上下游的企业包括最终的消费者。但是我们从服务的企业更多的来看,可能不是颠覆,而是怎么创新,增加升级战略,怎么在大数据时代改变思维?

从企业角度,我们分析是两大类:第一类是SAT类企业,在大数据时代它的战略,更多的是从技术到应用,到价值,到建立自己的产业链,这是一条路,更多的是利用开源的的技术,整合的平台,让大数据落地。

从更多的其他行业,比如制造业、消费类、流通类,房地产,他们的IT技术没有那么强,这样会依托更多的伙伴。我们用友在未来会帮助更多的企业,但是只靠我们自己肯定不行。所以我们整个的战略,也是平台化,产业链的供应。在打造产业链方面,用友也有很多的措施,我们建立了开发者社区,这里面我们的各类伙伴,一起服务企业客户。还有应用商城,我们伙伴做的应用,可以在商城上去推广。我们的企业客户,也可以在商城少找到应用。

至于技术落地,大数据有各种的数据,各种的关系,如何把数据变成信息,然后把信息变成知识,最终产生价值,这里面挑战非常多。所以从用友的角度,我们今天北京市有重点公共实验室,企业云公共实验室。这里面我们会跟技术伙伴,包括我们的客户,包括产学研结合。在这个工程实验室里面,我们搭各种的环境,包括大数据相关的各类,包括移动终端,社交,包括云本身。

我们还是通过产业链的力量,大家协作,推进共同服务好我们这个企业,在这个大数据时代,怎么更好的转变我们的一些运营思路,提升自己的竞争力,创造更多的价值。

糜万军:时间关系,非常感谢各位嘉宾的分享,感谢在座的各位!