云@开源:开源在云时代的价值

主持人:非常欢迎各位今天来参加我们在云基地专场的活动。接下来我们邀请趋势科技总裁施蒂克为我们致开幕词。

施蒂克:我今天谈的是,我讲这些技术都是班门弄斧,可是我对Openstack有这个热情,我可以讲一下尤其在美国这边,整个Openstack,对我们中国来讲,亚洲来讲是如何,我们在我Hadoop还有Open source上面的一些努力,向各位很快的报告一下。

为什么我对Open source这些事情这么激动,这么激情呢?我是台湾出来的,我在台湾看到我的朋友们他们去做这种ID,这三十年来整个台湾的经济发展,和做PC很有关系,从那时候开始到现在。有一个手机HTC,在一年以前起来了,很不错,可是一下子又掉下来。我们公司现在是超过15亿美金。在这里我就发现,在四五年前有两件事情发生了,第一件事情就是,那时候就开始发现黑客已经不像以前,从外面攻进来,他进来以后把里面的资料偷出来,在2007之前我们关注的问题是怎么把坏人挡在外面,所以我们就在这个像城堡一样,城堡里面做防火墙,可是现在不一样,现在是从里面把东西偷出去,这个事情大了,所以我们就发现有很多资料我们必须去检验,去处理,这些资料比如从HDVP的资料,还有LIN,还有邮件的资料。我们处理事情是从外面来自不一样的,是非结构性的,很大量的过来。怎么处理这么大量的资料,这时候,我们进入了Hadoop,竟然有这样的Open source,才可以处理我们的公司,为了生存必须把这件事情搞定,我们在Hadoop source我们是全世界第七的,这方面的资源很多。这件事情,我们可以把这个公开出来,就可以让我们亚洲的地区共享这件事情。

又有一件事情,就是Open source的问题。我手上这个表,这是人家送给我的一个表,这是耐克的,你可以跑步,我每次早上跑步就把资料手表上,然后这个东西再插到电脑上,就知道我今天的卡路里吃了多少,我运动了多少。现在做鞋子的都来搞这种东西,创造出很多的商机,这是一个很新的,而且对我们来讲有很多的创意,有很多的机会存在。所以有这样的存在,你就可以真的变成我们能主导,真的可以发挥自己的创意,可以做很多事情。

我们天云趋势做的就是CloudStack,我为各位很骄傲,我们国家强盛了之后,即使有再多的钱,可是永远没有像我们这个年头,第一次拥有这个Open source,这才是让人尊敬的,有尊严的,我们可以把我们的智慧发挥出来,各位在这里帮我们拿到最棒的尊严,终于我们可以在科技创新里面发挥作用。我觉得是很好的,每个人都可以改变世界,我为你们很高兴。以后就看你们了,谢谢各位!

主持人:谢谢史蒂夫。非常感谢史蒂夫的分享,趋势科技也参与到云开源的社区项目当中。

我简单花点时间介绍一下开源社区,社区最重要的,就是去里面的每一个人,和社区的文化,首先我想问一下听过开源社区,多少人用过或者准备用Hadoop,你们已经是Apache的一份子。大概是2009年的时候,我和Apache的一些朋友也是在思考,国内其实已经有很多各种各样的开元社区,包括我01年开始做的硅谷社区,但是始终在这么多年中还是缺乏国际上真正运作成熟社区的经验,怎么有更好的治理和更好的项目和产品的社区。Apache实际上今年已经是第四届了,从2009年开始,由英特尔支持,共创中国开源软件科技联盟一些社区,我们举行了第一次,大家可以看到穿红衣服的其实就是谷歌的背后一大推手。接下来两年我们在上海那边组织了两届,今年我们再次回到北京,也非常感谢主办方给我们这样一个很好的机会。

Apache这个平台,这样一个社区,它的主要愿景是希望为这些开发者和用户提供这样一个协作的环境,在这个环境里面,Apache会把很基础的(英文),包括整个(英文)的框架,以及他有一个非常治理良好的(英文),来管理很多的开源的项目,那么这里面也有一套非常严谨的流程,让一个项目真正成为一个Apache的项目。所以Apache是一个更加开放的,更加独立的这样一个协作支撑体系,所以这是他在整个开源社区里头,相对于独立的开源项目最有价值的地方。

Apache从1999年的时候开始创立,已经经过了大概十几年的历史,现在我们大概有2300多个committers,274个成员,不管个人还是企业,整个的组织架构是一个会员制的,你要通过一系列的方式有不同的类型划分。

Apache每一届的董事会都是由社区选举投票来完成的,是完全独立过程,现在在整个社区大概有七个人还是九个人的团体,这些人来自各个不同的公司,包括IBM,包括谷歌,这些都是由个人来独立完成的,而不是由一些公司,由厂方或者资方推荐进行的,它是非常独立的合作的一种模式。

Apache有一个很严谨的框架,任何一个向Apache提交代码的开发者,都必须要在提交代码之前跟Apache签这样一个协议,这样表示你所提交的代码这部分的东西,你要把这个知识产权那部分内容要托管给Apache,由Apache来进行整个代码的开发,来保证法律结构的一致性,避免带来一些相关的法律问题。Apache的团队里面有专门的专家来解决这方面的问题。

Apache到现在为止大概已经有超过70多个顶级的项目,包括大家耳熟能详的,Apache Server,以及最近很多开源云的项目,Hadoop,Chrome,越来越多的企业把他本身的项目作为开源项目,捐助到Apache独立运作,因为Apache的独立性和非商业兴和更长的生命周期,和治理架构。

这个是Apache整个初步的情况和它运转的过程,今年大会内容也非常丰富,早上我们会有来自于Apache社区不同的支持者,他们会分享更多关于开源还有Apache不同项目的一些视角,上午可能比较偏技术和商业,下午的主题由Apache核心开发人员,就具体的Apache现在的项目和相关的项目,来给大家探讨一些更深入的技术问题。所以今天两部分内容会涵概商业也涵概和技术结合的内容。

非常感谢我们这次活动的支持方。

接下来邀请今天的第一位演讲人Raymie。

Raymie:(英文)。

主持人:谢谢Raymie的分享,接下来邀请Hans Qin,分享一下Apache CloudStack在中国的一些影响以及一些情况。

Hans Qin:今天因为时间首先生命一下这个不是CloudStack的基础会,我想分享给大家的是包括(英文)是怎么一个过程,把CloudStack收购进来,之后再把原代码捐献基金会,就是我们开源的组织,然后会给大家介绍一些CloudStack在全球的案例和中国的一些案例,最后可能会有一个简单的跟Openstack的对比。

CloudStack的历史可以追溯到今年,应该是四年以前,在2008年的时候,那个时候其实没有CloudStack,没有这个说法,2008年的时候因为源自于与一个项目,他们当时的产品叫做(英文),其实从那个时候可以看到做…,在2010年的时候,那个团队,当时做VMops,把这个运营买回来了,产品的名字和公司都变成了Cloud.com。

到今年的4月份,我们把所有的原代码和这个CloudStack这个品牌都捐献给了阿帕奇组织。今年在座用过的3.0.2开始的版本,就已经是这个,如果你们仔细去看主界面的时候,你会发现那个许可已经是(英文),CloudStack这个品牌都捐献给了阿帕奇,所以我们不再叫CloudStack,我们推出的商业版本的产品,不再叫CloudStack,我们叫CloudPlatform,今天你们看到的Opensource。我们提供升级,升到3.0.5,包括Surface都是基于我们商业版来做的。

这是简单的一个CloudStack从产生到最后捐献给阿帕奇组织,包括我们阿帕奇组织(引文)的产品。

简单看一下,这张图,我没打算去仔细讲Cloud这一件事情生态环境具体是什么样子,我可能侧重在几个点,第一是云计算这么一个系统,要由哪些来构成,最底层是Hardware,IBM,HP做整机,EMC做存储的,有谁知道思杰在这,是因为我们有一个做负载均衡和网络加速用的,我们列的这几个硬件,其实是有原因的,我在上一层的Hygervison,这些基本上都在我的支持范围内,这是虚拟化这一层。当然到虚拟化这层之后,实际上他干了什么事,他把所有的硬件资源做成别的方式,让上层可以得到虚拟化的一些好处,我的CloudStack实际上是在这,我今天应该把它改成Apache的标,它实际上是去调用这些虚拟化的资源,让用户来实现对硬件自助的使用。实际上CloudStack我可以直接跟他们打交道,比如原来要配置一些防火墙的规则你可能用JBoss的管理工具去做,但是有了CloudStack之后,就直接可以用CloudStack去做。

再往上,我们有很好的DaaS的方案,同时我们也有很好的比如像基于SAAS这一层的方案,最上面我们也有一个纯商业版的软件,叫CloudPlatform,有运营计费方面的功能在里头。

做云计算做得最早的,规模最大的应该就是这个公司,亚马逊,最底层的硬件都不是他家的,比如存储用的NetApp,早期他用Opensource的Xen,这个管理工具很简陋,并不能满足云计算的需求,所以亚马逊自己开发了商业管理软件,再往上层开放了EC2的API,这个API的好处,第一你要做一些二次开发,第二你要做一些批量的部署,你用自己的部署角度,你必须调动他的API,最上面是亚马逊的Platform。在亚马逊里,其实在任何行当中,只要你做到最靠前,那你说的话就是默认的事实标准。所以在CloudStack,我们怎么调动亚马逊风格的应用,最底层的硬件我们没有改变,如果是Opensource这一层我们有XenServer,再往上就是CloudPlatform,完全兼容EC2的API,我还没有来得及去看Apache的CloudStack4.0是不是已经兼容了亚马逊AP3我还不清楚,再往上就是CloudPotal。

这个图不打算多讲,因为时间关系,只是到2015年,未来的三年之内,这个Hybrid,就是混合云,包括私有云和公有云,另外一个是VMware以提供虚拟化出名的,是业界的老大,这个我们没有太多否认的,实际上他的VertiCloud,实际上只能使用他自己的虚拟化,当然后期他又收购了一些别的公司,比如(英文),号称要做多虚拟化支持的云管理,当然这个产品没有正式发布,可是对我的CloudStack不一样,CloudStack我是可以支持目前除了小型机以外的各种各样的虚拟化,包括在我上面列到的各种虚拟化我都可以支持,甚至我还可以对乌力吉进行管理,

另外Cloud类型,包括玩家其实是很多的,首先从传统模式来看,大家都用服务器虚拟化,实际上做云的第一大玩家就是运营商,比如像亚马逊、kt、BT,这些人用的都是我们CloudStack来做云的管理。第二大类玩家就是Medll,和Web2.0,还有第三类就是我们的企业,比如企业的私有云,因为现在很多企业,大企业至少在国内的话,我后面的案例也会分享,都是一个全国性的,有很多很多数据中心,也需要做一个他自己的云。

下面是一些案例,BT,英国电信,他是用CloudStack来做云计算的管理,日本的NTT和KDDI,KDDI在中国武汉、上海都有分布,在国内他们也有数据中心,他们也是用我的CloudStack来作为他们的云的管理平台。

这里列得更多,包括台湾的大哥大,相当于中国的移动的角色,中华电信他们都在用我们的CloudStack,CCW,TATA等等,他们都是用我们的CloudStack作为他们云的管理平台。其实这么多运营商有一个好处,他用CloudStack是一个方面,另外一个他们提出很多需求,他们会有很多的需求,因为运营商的网络环境,包括对可靠性的要求都要强很多,所以他们会给我们提很多需求,要么是我们来实现,现在可能提交给Apache,实际上这些运营商,我知道的运营商,比如像KT,韩国电信,包括KDDI,包括NTT,实际上他们自己实现,实现完了之后提交给我们,CloudStack对于要求最苛刻的运营商级别的云的管理,我没有任何问题,这可能也是CloudStack没法比的。

这是韩国电信,他为什么要做这个事,是因为韩国政府不像中国政府,比如像现在全球做云做的最大的就是亚马逊,亚马逊进中国很难,但是他进韩国很容易,所以韩国电信就面临很多的压力,他不得不自己做一个公有云。另外一个是三星,在座除了i phone,大家用三星还是有的,三星做了一个mCloud,都可以用云计算的这个方案,他选择思杰的原因一个就是CloudStack。

DataPipe他是做大数据的,他在全球有八大数据中心,在东京、香港、上海都有数据中心,但是他的管理是统一的,统一用CloudStack作为一个集群来管理,这是他的官方主页,我们也可以看到思杰在这里面。

这个就更加有意思了,EetFlix做影视租赁的,在网上租电影,花很少的钱,比进电影院更便宜,但是他还做了一件事情,打广告,你看到电影里面正在放一个某一款麦当劳的宣传产品,你胃口大开,正在看电影,你当时就可以通过他的平台拨打电话,让人把这款产品给你送上门,这个做得很好,很灵活,在国内估计还没有这么干。这个是在线汽车销售,核心的在线管理平台,也是用我的CloudStack,其实说了这么多,都是国外的,因为毕竟在国外开始的比较早,实际上在国内,也是在被收购之后,过了可能有半年的时间,在中国才开始做商业化的运作。

这个是中国电信天翼云平台,这个已经上线了,在年初,那个CloudStack还没有捐助给Apache的组织,那个还是2.0.2系列的CloudStack,他们实现了他们天翼的云平台,也是基于CloudStack的。

另外这个案子比较有意思,国家税务总局,他们要做一个,第一期是八个点,包括北京、重庆这两个点,还有另外六个分布,第二期全国71个数据中心,71个点都要统一做云管理,现在用我的CloudStack统一管理,在任何一个数据中心做一个管理集群来实现这个管理。

这个实际上是某IDC,这是一个合作伙伴,基于CloudStack的Opensource的版本做的方案。这个IDC是做云的运营的,他的架构图是值得大家借鉴的,在传统的云里头,我一直在提亚马逊,他实际上底下的存储未必就是用的比如像EMC这样的存储,他其实有很多方式,分布式的存储也用在里面。他们有自己的分布式的文件系统,在一堆的PCServer上,然后做成一个大的分布式的文件系统,让上面的Hypervison去调用,来作为一个管理平台。

实际上他的实现和Hadoop差不多,但是绝对不是Hadoop,因为Hadoop更侧重另外一个方面,而他是通过存储来做。Hy就集成了CloudStack,他的文件系统要跟Hy去集成需要做一些工作。

这是国内一些别的客户,这里头有一些客户已经做完POC了,有一些客户正在计划我们要去跟他们做CloudStack的POC。

最后,这一段话不是我说的,陈辉说的,我用他的话作为今天的总结,CloudStack产品成熟度是连Openstack都比较肯定的,谁能告诉我Openstack是哪个公司发起的?他本身的云管理平台并不是Openstack,而是CloudStack,这个很有意思,我们产品成熟度被他们肯定过了。另外一点,今年十月份在印度有一个类似于这样的大会,但是是思科CTO技术总监上去说了一句话,CloudStack作为一种运营商比较合适,运营商你要选的话你肯定要选CloudStack,不能选Openstack,后来这个话就被国内一些比较大的厂家听到了,就给我们打电话说,思科的CTO说的话我们得研究研究,所以就找我们去做这个CloudStack的合作。

这个陈辉他说的这些话,也是有道理的,也就是说如果你要着眼于五年之内,那你肯定选CloudStack,说都不用说。在五年之后,如果你有比较强的技术实力,你可以去把Openstack这个环境把握好的,你可以去选,否则请选CloudStack。我们为什么捐献给Apache,其实Apache这个组织,在业界,在开源界产生了很多很多著名的优秀的软件,我们把它放到这个里面去也是出于一个考虑,就是CloudStack本身的发展,我们想靠全球的Opensource的同仁来做这件事情。

我的演讲就这么多,大家有没有什么问题需要问我。谢谢大家。

主持人:谢谢Hans,实际上CloudStack从最初的Cloud.com,后来被并购成为一个开源的项目捐献到Apache,其实也是在开源和商业化之间操作非常成功的案例,这也是一个商业软件最终走向更广大市场的商业操作模式,最后的时候我会做一个总结,接下来我们邀请来自中国开源软件推进联盟的陈越给我们分享现在在国内整个Opensource处在什么样的状态,他们的一些研究和一些总结。

陈越:大家好,刚才有很多嘉宾讲开源,包括讲云计算,包括一些国外的社区的情况,我今天想讲一些国内的有关于开源软件发展的一些情况。

在我开始跟大家分享之前,我突然间想起来一个事,前几天我在网上看到了一篇文章,这个文章题目叫做开源软件的七宗罪,这里面分七点批驳了开源软件怎么毁掉了全中国,尤其是中国的IT产业。之后我联系了写这篇文章的这个人我们通过邮件做了讨论,在跟他的讨论过程当中,他其实本身也在从事跟开源有关的技术和软件开发方面的工作。所以说其实他应该是对于开源的模式本身是了解的。

那么我就想,其实跟他的讨论也确实是看到了很多在中国开源发展存在的一些问题,这些问题可能本身有一些客观的原因,但是我们也发现,里面有很多其实是一些共性的,就是大家普遍的存在一些对开源的不管是误解也好,或者说没有正确的理解开源在中国发展的这么一个进程。

以前我们在做社区活动的时候也是,因为自己是做开源方面推广的,所以大家肯定是都说开源怎么好,但是实际上都往往没有向社区的朋友,或者是向企业,向参与社区的这些人去讲开源到底中间需要考虑哪些问题,如果你不去考虑这些问题,你可能会出现什么问题,尤其是在中国。可能很多人讲的是国外的经验,但是其实在我们日常的工作中,碰到的更多的问题是比较有中国特色的问题。

我现在开始我的演讲,中间其实涉及到了一些我和网友之间的一些讨论,我们想通过我们这个开源联盟的观点,向大家说清楚,开源到底在中国应该是怎样发展的。

我是来自中国开源软件推进联盟,有一些知道我们的朋友,有的时候也叫我们Cloud联盟,我们也真心希望我们自己本身确实能够名副其实,能够成为一个云开源的产业联盟。

我们说为什么要在中国成立一个这样的跟开源有关的产业联盟呢?其实我不知道大家知不知道,开源其实在中国大概有这么几个阶段,就是在99年之前,基本上是在大学里的一些学术性的研究,然后有一些从国外回来的留学生或者是科研人员,带回来一些开源代码,大家基本上是利用这些开源代码做科研,做研究的。那么从99年前后,出现了一些以开源为基础做产品的这种公司,但是这些公司现在绝大部分都已不存在了。

其实到了01、02年的时候,开源的这种炒作火热的程度就很低了,在媒体上其实看到的都很少,但是实际情况是大家炒作得少了,但是实际上在底下做事情的多乐。05年左右出现了很多开源基于安全方面的,还有一些中间件,互联网的这种产品。从政府的角度上,它也注意到了开源对于中国IT产业的影响,开源联盟就是在05年的时候,由工信部,当时应该还是叫信息产业部,由信产部牵头成立了这么一个专门在中国推广开源软件和开源技术,和开放技术的这么一个产业联盟。

我们的联盟主要从事的工作,在这边,我列出来的是主要所涉及的问题,包括国际的交流与合作,我们跟Apache,国际上很多的这种开源基金会,或者开源组织都有联系。每年也会有一些相应的交流的活动,联盟还有一个工作的内容,就是标准与规范,这就涉及到联盟下属有四个工作组,第一工作组是跟技术研发相关的,第二工作组是跟教育培训相关的,第三工作组是标准和认证,第四工作组负责开源的推广和企业的合作。

标准与规范工作组就是在WG3的框架下来做的,那么这个框架本身还是一个东北亚的合作框架,也就是说在当时,在05年的时候,中国政府在成立开源联盟的同时,和日本、韩国签订了开源合作的协议,这个协议其中从执行层面上来讲,就是在联盟里建立了四个工作组,当然联盟还不止这四个工作组,这四个工作组主要是跟VR合作的,除了这四个工作组的工作以外,我们联盟还提供知识产权的服务,这个主要是跟开源的许可协议,还有专利相关的一些咨询服务,联盟还包括社区的建设和推广,也就是说我们是为国内的开源社区提供服务的社区。

联盟还通过与媒体的合作,将更多的开源信息,还有一些创新,通过媒体散布出去。最后一项是在联盟中我们通过一些企业的合作,然后让企业能够更多的参与到这个开源的开发或者是应用推广当中。

总体上来讲就是分四个部分,可以总结为四大块,第一个就是共性技术,对于联盟来讲,我们不关注在某一个产品或者某一种技术的推广上,更关注的是共性技术,因为从我们的认识来看,开源软件在中国最大的机会就在于对共性技术的实现上。也就是说只有在共性技术这一块,企业和社区才有比较多的合作的可能。那么第二个就是社区的推广,我们在社区的推广这块也有一些相应的支持和服务的计划。第三个就是产业的促进,我们也是通过联盟下面的成员,进行产业的合作,或者通过第四工作组进行国际交流的合作,在这个工作组里面,像三星、富士通他们都积极的参与了这方面的工作,制定了我们称之为叫“开源软件的IT技术应用规范”。通过这个来支持三个国家的公司在开源软件方面的推广。第四个就是教育培训,联盟其实一个很重要的任务就是通过开源的这种形式,或者通过开源这种模式,把更多技术带到人才的培养当中去。

我们提供一些具体的服务或者说工作,比如说在国际交流合作方面,我们联盟每年在东北亚合作机制下,各个组以项目的形式开展自己的工作。包括我们通过开源中国,开源世界的论坛,和企业,和各个社团,包括和国际上的这些组织进行交流。开源中国,开源世界也是国内唯一的一个,每天会有那么多国际上的一些开源组织过来参与交流。比如在座的像Apache,包括像法国的OW2,这些基金组织,他们基本上每一届都会过来参与交流。

在社区的推广上,我们今年9月份的时候我们启动了一个社区服务,具体的内容待会我会涉及到。每年我们还会支持举办中国的自由软件日,包括支持Linux内核开发大会,和其他社区一起搞的中国开源软件大赛。同时我们现在也在和一些社团和企业合作,在做一个开元的开发者平台,将来在适当的时候可以推出项目托管的服务,具体的我待会也会涉及到。

第三个就是我们商业应用和企业合作这块,我们通过我们的一些活动,向企业提供一些交流的平台,然后同时我们还为企业提供一个开源产品的兼容性测试方案。

最后一个也是我们未来工作的一个重点,就是OSS Geronimo,我查了一下现在国内的网站,或者是一些书上,好像还没有对这个词有比较好的翻译。我们给的翻译叫做开源软件发展的合规性,指导或者指南。具体的含义,待会我还会讲到,大概的意思就是说在开源软件的商用化的,或者说社区的发展过程中,它其实是有一定的规范的。遵循了这些规范,你的社区或者是你的开源软件,可以更好的发展,否则就可能会出问题。本来因为有很多的图,我原来以为是个大会的发言,我就把它去掉了,这里很多图都是说开源软件现在在国内发展的一些统计的数据。

其实开源软件在国内这些年发展是有很大的长进的,LAS现在都可以数出来,现在其实有一大批非常好的,而且是可以进行商用化的软件已经出现了。

Linux内核,从2.6.1到3.6.5中国贡献的排名,按国家排名,在全是世界是第四,大概有1.6万个补丁程序贡献上去。Hadoop有很多的贡献。这几年来看,开源也是一个很好的创业的模式,有很多创业者一开始是通过开源,以这个社区的形式来发展自己的项目,降低自己的投入,也出现了一些活动组织,比如说像车库咖啡,像我们的开源项目,像盛大的创新院,他们搞的沙龙活动,都使这些开源项目能够脱颖而出,有一些确实也通过这种方式创业成功。

在中国现在这种情况下,什么东西对开源发展最重要,其实不是人才的问题,今天我来这个软件园这边我发现有这么多的公司,一座一座的大楼,前面全都是二十几岁,三十几岁年轻的科技工作者,所以技术不是我们的问题,最主要的问题,就是一个机制的问题,或者说一个体制的问题。

在国外这种共性技术的发展,往往是依赖于像Apache,或者是像CloudStack这种基金会的模式去运作。在中国因为有法律,有一些制度上的限制,我们现在还没法突破这种体制,但是我相信,从开源软件发展模式上来看,最终基金会这种模式是一定会成为我们进行共性技术的开发和推广一个主要的模式。我们现在怎么办呢?我们联盟也做了一些探索,因为我们是一个中立的非营利的第三方的身份,以我们牵头和一些社区,和企业联合,然后以成立联合实验室的形式,去变相的托管开源的软件,能够让某一个企业的开源软件,让它平台化,或者让它公共化。

为什么刚才说CloudStack成立了自己的基金会,思杰也把它的CloudStack开放,开源,并且托管,我们有这样一个看法,对于这种共性技术,单个企业是没法对这种公共的共性的这种技术平台进行全球化的推广。所以他必须要将自己的这个平台这种技术,首先公众化,公众化的一个做法,在国外就是他把它放在一个这种非营利性的组织,基金会,台湾是不是叫做财团法人。在中国我们的探索方式,以我们这么多年实践来看,政府的效率太低,我们绕开法律的屏障,通过联合实验室的形式,我们想探讨这个东西是不是能够向前走一步,这是我们研究正在做的一个事情。可能过几天,我们跟国防科技大学会宣布,我们成立一个开放的系统,公共技术平台的联合实验室,我们希望通过这个东西作为我们的一个探索,看看这种模式是不是能够向下走。

还有一点就是我们必须得意识到在中国,在教育领域内开源是非常强烈的依赖于社区的这种传播。但是在开源的项目领域,或者说开源应用的领域,在中国基本上还是要靠企业来主导,这个跟在国外可能还不太一样,在国外基本上是社区和企业是都会起很重要的作用。在中国目前我们还没有看到一个在社区运营下能够有很规范的,很完整的发展起来的项目,基本上全部是要靠企业去主导。那么这个就是中国的现实,所以我们联盟也是在这几年作出了一些调整,我们更多跟企业去合作,推动企业将它的共性技术平台开放出来,然后反过来带动整个这个社区的发展,像华为、淘宝,我们跟他们其实都有合作。

社区的困境是很多的,我这个地方指的社区主要就是一般意义上讲的这种技术社区。我们希望在下一阶段在这方面有更多的工作,我们通过开源的形式推动开放式的教育。我们现在跟Linux,跟三星,跟Blackduck,合作完成一个中国的开源的一种合规性的一套体系,帮助企业更好的将他的然间导向开源的模式,包括它的商业模式,包括它的知识产权,包括它的社区的建设,软件的评测和质量评估。这里面有一大套的规范合作,这是我们正在做的,这个也是我自己在第三工作组里面,一个非常重要的工作。

从这几年的发展来看,开源确实对于中国的IT产业是一个非常举足轻重的作用,我在这里用“开源是新世纪带给我们的最强音”来结束我今天的演讲,谢谢大家。

主持人:谢谢陈越。我想把前面讲的这些,通过这样一个PPT,让大家看一看,开源在国内或者全球大概十来年,整个的发展情况,后面有一个演讲是来自于北京大学计算机专业的马秀娟博士,他们会有一个非常有趣的数学模型来论证社区里的一些创新的模式和我的一些观点。

开源不代表完全的免费,但是实际上蕴藏着巨大的商机。我叫程勇,我在国内做开源,到现在为止11年,从2001年开始做硅谷社区,前五年尝试开源技术的各种模式多一些,包括产品开发,写代码,项目,后来更多的是在做一些社区,跟社区合作比较多一些,我觉得国内缺开发人员,缺一些更好的方法,不缺技术,我们希望通过国际社区把好的方法带进来,后五年我们尝试基于开源的解决模式,这些都是一些尝试,如果大家有兴趣的话,可以来跟我们进行交流。

另外一个合作人是马秀娟博士,他待会会有一些非常有趣的模型来验证大家一般看不到有趣的现象。

实际上开源社区,它有一个演化的过程,从九十年代,每个人都把代码传上去,内容呈现出来下代码,做自己的事情,这种我们称之为中心化的开源社区。之后就出现了有管理的开源社区模式,像Apache,他是非常严谨的治理模式,每个项目有自己的PMC,项目管理委员会,有开发者测试等等,他有一套非常严谨的管理过程,整个运作过程不亚于一个公司几千人的团队。

最近这两年出现一些新兴的社区模式,GitHub,你可以认为它是一种社交化的开源社区新的形态,这些过程就是从九十年代末期到现在,开源社区逐渐演变的模式,会随着整个历史进程不断向前推进。

如果你回看过去十年,所有人对开源的问题,特别从用户的角度,开源免费的还怎么挣钱,我对这些东西关注比较多一些,我不光看技术,也看商业的一面。实际上在过去十年当中,其实已经有大量开源的公司已经获得了成功的商业化的发展,一家上市的是redhat,他已经上市了,比国内几万人的公司都要大。另外很多开源的项目,包括JBoss,都是走入了并购,他做了一个细分市场的定位,满足了某一类特定用户市场的需求,然后被一个更大的商业化的公司并购,成为整个产品线中的一部分,去满足开源产品的需求。如果你想让一个开源公司快速走向商业成功,其实这是一条捷径,在这里面也有一些历史性的事件发生,做一个十亿美金的公司怎么做,其实MySQL就是成功的案例。

这是过去十年发生的事情,过去十年开源软件更多走的是替代性软件,商业软件里面有什么,我这个东西也有一个类似的,所以基本上在商业客户那里竞争的时候,通常是哪家的商业产品,IBM等等都有了,我开源也有了。

现在进入到新的十年之后,进入到云计算时代,开源软件呈现什么样的形态,最近这三四年发生的一些有趣的事情,10gen公司融资额达到了7400万美金,Cloudera这家公司最高的融资额已经做到了1.4亿美金以上,一个公司融资额达到1.4亿美金以上的时候,他已经达到很大的规模了。

基于开源云平台公司背后,他不再是跟谁来替代,现在反而是商业化的公司说我要去适配这个趋势,我要去社区里贡献,我甚至基于社区来做一个版本,这是一种从替代到创新新的趋势,基于全球化的协作社区开发模式,来满足特定需求市场的新的方式,我觉得Opensource和Opensource协作社区开发是解决这个问题的最佳方案。

开源有很多个角度来看,如果我们把它从一个战略高度来看,开源在社区化的运用方式,我在这里把开源社区作为策略定义四个方向,最高级的模式是作为一个商业站的,这里有一个案例就是ecliose。IBM使了很小的力量改变了ID的环境。有一些公司把开源作为市场策略来做,TERRACOTTA,他选择的策略方式就是我通过把我的一部分代码开源,同时我又并购了一些有社区基础的开源的团队和项目进来之后,把它合并成一个大的体系,快速的从这里面找到相应的商业机会。还有一类就是纯技术策略,IBM曾经参与过一个Apache(英文)的项目,纯社区化的产品,更多的目标是实现Apache的服务器,有更长的生命周期,也吸引了不同类型的公司来参与。待会马博士会对这块做一个模型化的分析。

还有一类公司实际上走的是市场和技术的混合路线,它利用社区研发的特点,同时他也把社区作为他的市场手段商业模式来运作,从这里面产生潜在的商业机会,这个案例就是JBoss,他运作非常独立化,实际上JBoss非常挣钱。

真正把开源软件融合到整个的技术也好,商业化的过程当中,实际上不能从单一的角度来看待,这里面我的一个合伙人,他们在芬兰那边,在07年的时候做过一个模型的研究,叫open source Management Framework,就是怎么样把开源软件整合到一个公司整个运作化当中,从开源软件商业化的角度,社区化的角度,从技术的角度,不同的纬度,在开源软件被真正投入到使用当中各个阶段来进行分析和对比,从他的复杂性,以及贡献度上进行评估,形成这样一个模型,这样的话对于一个企业,或者对于一个用户怎么把开源软件成功运用是有一个非常好的参考,这样把整个开源软件不是从某一个角度,有的人说技术,有的人说商业,有的人说社区,他是从整体的来融入开源软件。

我们来看一下成功的案例是怎么操作起来的,JBoss当时是3.5亿美金卖出去的,他卖之前发生了什么事情,几个创始人成立了一家咨询公司,开始通过卖文档,卖服务的方式形成快速发展的社区,当时在JBoss这个社区上面,基本上有大量的下载,在开源领域有一个概念,多少个人去下载可能会有多少人转化成最终的用户。他们通过对Web上的线索进行评分打分,通过电话销售方式,直接追踪到线索,把这些线索一步一步通过销售管道,转化成最终成交的交易额,交易额在一万美金到五万美金之间,额度不是很大,但是数量比较大。

这里有一个很关键的,就是转换比,从Web的线索转换成潜在排名比较高的得分线索,大概是4:1的转换,销售代表打电话打进去,打三个电话里面可能有一个人会感兴趣,最后由线索转换成一个成功的订单,大概是4:1的转换率,通过这样一个转换率,让JBoss在短短两年半的时间里,两年半的时间成长了三十多倍,他正好在快速成长的最高点选择退出的窗口。这个实际上也证了,一个开源软件,除了技术的一面,商业化的一面怎么来做,到底从哪个点下手,怎么去完成这些商业机会,实际上是需要研究的。

开源软件关键的一点就是在怎么来平衡,如果你今天做一个软件,还是朝着去替代某一个商业软件的角度去做,如果你纯是兴趣爱好玩玩没问题,但是如果你想有一定的成功度,甚至可以成为一个可以去运转的商业,我建议不要朝着这个方向走,因为这是以前的发展情况,在今天云时代,在某一个细分市场你能解决什么问题,你能在社区上有什么发展,吸引多少用户,最后能转换成多少真正在商业上为你付费的用户,用你的产品,持续性的创新,这是一个替代和创新的平衡。这个当中核心的运转机制到底怎么来做,接下来有请我的合作人马秀娟模式来分享他一些很有兴趣的研究。

马秀娟:谢谢程老师,我压力很大,其实我也没有做那么难的问题。我做的问题还是很简单的,就是想看一看,当前成功的一些项目里头他们到底是怎么创新的方式,最简单的就是,到底是依靠了公司还是依靠了外部参与者,就像刚才第一个人讲的,公司很希望能够从社区参与里面的一些Web参与者中获益,我想看看当前成功的比如说JBoss,Geronimo,Apache社区里面,JOnAS,这三个开源社区都还是做得很不错,这三个项目还算是比较典型,我的导师是梅宏老师。

下面就是我的具体的一些结果,首先第一个介绍一下这三个项目,为什么选他们,一个是他们有典型性,第二他们后面都由不同的公司来支持。具体来说,因为公司在不同的时间,都有不同的参与情况,都有不同的机制、管理等等,所以具体的情况,我看了一下把这三个项目分成小的这种阶段,按照后面主要的公司不一样,分为小阶段,看看他们的参与情况到底有什么区别。

第一个看了一下开发团队,上面这三幅图,就是JBoss,Geronimo和JOnAS,黑色的每个月有多少提交代码,蓝色的是有多少代码是来自于公司内部的。红色的这条线就是我们非常关心的。外部提交的人没有什么变化的,在JBoss也是这样的,在JOnAS非常有趣,内部的人这几年有增加,增加不多,但是外部的人增加趋势很多。随着红帽的投入,就使得他外部的贡献者是减少的,然后对于OW,布尔公司,他背后的支撑公司是一个法国的硬件提供商,他的策略是我要开放,我要引入外部的开放,比如他会建立跟中国的,还有一些大学的交流,他的这种策略就会吸引很多人。

第二个我们就来看,吸引进来那么多人之后,到底大部分的活是谁干的?其实我们在生活中,比如说在一个公司中我们很明白谁是主力的,在学术上这件事情对我们来说不是很现实,所以我们也引入了一个模型,就是八二原则,我们选出来干了80%的人,看看这些人都是由谁干的,当然了80%基本上都是由一个小部分,比如说在JBoss可能就是由十几个,到二十个人干的,然后在JOnAS都是由十个人干的。看这幅图,我们的结果也是很明显的,对于JBoss这样的公司投入力度比较大的时候,大部分的活都是由公司内部的人完成,对于JOnAS变化没有那么大。在JBoss中,用户所占的比例是要将近20%的,IBM投入之后,用户的数目好象有上升,但是用户报告的问题只占了40%,对于JOnAS虽然有所下降,尤其在第三个阶段,进行冲沟之后,他是没有发布很频繁新的版本,他的用户报告比例是有所下降,但是远没有这么大的一个趋势。

最后一个我们就来看看客户问题的响应速度,这个用户的体验在一个公司开发项目的时候是非常非常重要的,我们就看一个对客户问题响应速度怎么样,这个图显示的是,比如说在一个月,一天,两天,二十天的时候,还有百分之多少的问题还没有被解决,也就是说如果他解决得快,这条曲线下降的应该比较快,很明显,JBoss区别于这两个,JBoss用户的问题,他下降的比较快,所以在JBoss这个里头,在公司的带领下,客户的问题要解决的是比较快的。

总结一下,说起来也是比较白话的,我们发现越强大的公司投入的时候,会减弱外部的参与,但是内部更加规范了,会有一个增强,并且会构筑各种客户体验。其实我们感觉,现在大家都想知道到底公司应该怎么去参与到开源,个人也是一样,参与到开源的时候,尤其是公司,因为有着特定的目标和立场,所以还是要注意采取一些合适的措施,以免适得其反,这就是我的一些结果。谢谢大家!

主持人:我们非常感谢马博士的分享。开源做的时候,你可能做了,但是你可能并不了解它其中真实的一些背景,这个数据模型也是我大概做的十多年开源看到的第一个有从学术上角度来研究社区里面,通过社区活动的参与来分析它背后真实原因的第一个研究,所以我觉得是非常有趣,邀请马博士跟大家来分享,我们今天上午部分就到此结束。

(结束)