从应用角度看IT发展

(图为神州数码信息服务股份有限公司工程院院长  谢耘)

尊敬的各位来宾大家早上好,非常高兴今天有机会和大家沟通一下、交流一下对整个产业发展的一些看法。

今天大会的主题是新技术与应用推动产业变革,我讲的内容从应用的角度来看IT产业未来会发生哪些很本质性的变化。为什么从应用的角度来看,一个是我个人和我们企业是做应用的。二个是计算机诞生那一天起到今天本质上是应用的工具。这么多年来应用其实决定了整个产业大的发展格局和方向,所以我今天主要是从这个角度来看一下,能给我们带来一些什么样的启示。

今年中央二台拍了一个片子叫公司的力量,在这个片子里有一句话当时给我印象很深。就说能看到多远的历史我们就能够看到多远的未来。当我们来看一个产业的发展的时候,我觉得也应该从历史来开始看,因为有一些规模是从现在到未来都起作用,我们能够认识到这些规律,对我们很好把握未来的发展将会起到很大的作用。所以我今天会简单的从历史讲到未来。

第一,在计算机产业发展过程中层先出现了一件非常大的事情,这个事情对整个产业的发展,包括未来都在产生重大的影响。大家知道计算机是上个世纪四十年代诞生的,在三十到四十年代有两个人奠定了整个计算机产业的发展的基础,一个就是图灵,建立了计算机模型,建立了计算机得力论,从理论上指出了方向。第二个人影响其实更大,就叫冯诺依曼机,这个人定义了到今天为止我们使用的计算机的架构,就是用程序来驱动,来处理数据的体系,它是在四十年代提出的,在计算机产业产生诞生这些理论奠基的时候,其实人们就没有满足让计算机仅仅是算数。今天计算机解决的问题还是数值,计算和数值逻辑的问题,在刚奠基的时候其实人们就期望以后我们造一台机器能够有智能,这个智能不是今天的智能。图灵在当时建立了人工智能的黑箱测试原则,什么机器测的有智能,他做了一个定义。在整个产业最开始的时候希望计算机从计算发展到具有智能的能力。

几十年整个产业界、学术界投入大量的人力在这里。最后有两个事情对这件事情产生了非常大的影响,一个是下面这张图机器的图,那个是日本在1981年开始所谓的第五代计算机的情况,什么计划呢?当时日本希望突破冯诺依曼体系结构,构造出一个真正具有智能的计算机,什么是智能,计算机也是智能一部分,但是我们认为这是一种低的智能,我们历史上算盘可以算,计算机无非比算盘快。当时具有人类高等的智能,比如说理解语言,比如说对概念做抽象等等甚至具有情感。人工智能是很高的智能,当时日本倾全国之力造了一台,96年我在悉尼留学的时候看到了这台机器,从此这台机器就消声逆境,这个工程彻底失败,当时日本退出这个工程的时候全世界震动非常大,认为哪个国家先造出第五代计算机,哪个国家就会获得整体上绝对优势,因为机器具有智能之后可以自己繁殖,自己设计自己。80年代中期开始人工智能网络的研究,这更多的是欧美人在做,当时有人叫第六代计算机,这到90年代就停了。我们发现最典型的一个网络无非是用高接非线性对样本数据做拟合,其实这个方法在牛顿时代就有了,只不过被这些科学家做了新的包装,这个努力也彻底失败了。这两个努力的彻底失败导致了IT产业发生了重大变化,也就是走到了今天我们看到的这条路,就是IT产业从此不在把职能放在次要位置,而开始追求让机器越算越快,在可以预见的未来计算机追求的目标都是越算越快,最近MIT一些科学家在抱怨,从80年代开始人工智能的研究遭到了冷落,其中的原因就是投资不够,其实不是投资不够,而是因为几十年的人工智能的研究并没有产生真正支撑人工智能去实现基本理论,在理论上解决不了机器永远造不出来,首先要在理论上能够解决,然后才能把机器造出来,而几十年无数精英投在这没有真正成功,MIT教授的抱怨所以说没有什么太大根据。

有由于这一次努力彻底失败,而失败常常容易被忘记。所以计算机开始走向了越算越快的路程,这是今天从硬件的角度看整个产业发展,大概经历了三个阶段,第一个阶段是80年代前,基本上都是大的机器,放在机房里面要穿上拖鞋还要申请才能用。80年代之后出现了PC,PC可以放在办公室甚至放在家里。到了后来90年代,2000年之后出现各种各样个人的移动设备,现在就变成整个产业发展,从硬件来看基本的东西,横轴标志着越来越快,至少到今天为止摩尔边界还没有看到,还可以继续发挥作用,现在有的手机已经双核了,双核手机计算能力比五、六十年代甚至七十年代大型机都要快,计算机一方面在未来越算越快,纵轴是什么呢?特别是从应用的角度这个图的纵轴表示了什么?表示了计算机的应用在不断的突破时间和空间的限制。大型机的时候计算机的应用在机房里面,是少数精英们用的,出现了PC之后普通老百姓甚至在家里就可以用,计算机的应用在时空上做出了根本性的改变,PC真正革命性的影响,颠覆的影响其实来源于对时空的突破,所以创造了无数新的应有。到了移动设备之后其实对时空做了进一步突破,我们可以随时随地有一台计算机做很多事情。沿着纵轴往下走会到什么地方呢?计算机和我们在生理上可能会更紧密的结合在一起,前些年美国人提出了可穿戴的问题,这两年不太说了。但是真正现在有可穿戴的东西是靠IT技术实现的,美国一个研究所已经做出了一个靠人神经直接控制的机械的手臂,这个手臂可以完成人手的很多功能,包括它可以拿起一个葡萄来吃,不会吧葡萄挤碎也不会掉下去,他可以拿一个勺喝汤,这个汤不会撒,这已经和人的生理上结合了。这个机器手现在可以临床实验了,这是一个典型应用了,还有一个一般性的应用,计算机往下发展,我们今天的照相机,在座的可能都有,可能看到每个嘉宾上台照一张,还是你在操作,再往下走可能不需要你操作了,你身上的计算机会把生活、工作中的场景信息自动的记录下来,然后加以整理给你未来使,这就是沿着纵轴,计算机下一步发展很重要的方向。

这个东西还不是当前最迫切产业需要面对的问题,为什么呢?因为就是到今天这个地步,就是到了个人嵌入式设备大量普及的情况下,其实还有有很多应用问题没有解决。我们下面从应用的角度再来看一下我们产业几十年来诞生到底经历了一些什么。

计算机刚开始诞生的时候是做数值计算,为曼哈顿工程服务造原子弹,在中国也是为两弹一星服务,当时计算所造的计算机基本上都给军工用。计算机第一个阶段是做数值计算的,包括今天的天气预报等等其实还是数值计算。在这个阶段支撑它的基础理论是什么呢?是计算数学理论,各种各样计算数学的理论在支撑计算机实现这些应用。随着IT计算机发展很快进入到数据的分析,这是在70年代开始的,开始做了什么样的数据处理,什么样的应用,就是基于结构化数据的处理,我们飞机一张机票上的信息,包括名字,航班号,还有起飞的航站地点,落地的地点,起飞的时间和落地的时间。一张机票上的信息是分成一段一段有明确意义的数据,这些一段一段有明确意义的数据构成的数据我们就叫结构化的数据。银行帐号是这样,在ERP人财物也是这样,计算机第二阶段的应用是基于结构化的数据,这个时候支撑的理论是什么呢?就是现在的二维关系数据库,所以甲骨文才可以赚这么多钱,因为大家都离不开它,但是随着计算机的发展,IT设备不断普及,大量信息被电子化之后就进入到第三个阶段,就是我们计算机需要处理的数据也好,信息也好,已经不是简单的结构化了,绝大多数是非结构化的,你不能采成一个一个简单字段,我今天PPT没有办法拆成标准化字段,包括现在网上的信息,今天的IT是处在面对大量非结构化的信息如何处理和应用的问题,处在这么一个阶段。在今天我们有没有好的办法,好的工具来解决这个问题,应该说不幸的是我们还没有。大家说有啊,在网上很方便,我用搜索引擎想要什么就要什么,搜索引擎恰恰是在没有办法的时候找到的一个办法,你们去银行办事从来不是说把名字告诉我,我搜一下看看你的帐号在那儿,不会吧,因为银行的数据已经很有效的管理起来,不需要用搜索的方式来做。当然用搜索方式来做的时候说明这些信息没有被有效的管起来,这个问题是目前IT最大的一个挑战。日本野村综合研究所每年会推出IT贡献导图,今年导图北京科委翻译成汉文发行,今年的导图里面核心谈的问题不是云计算,更不是物联网,而是数据的问题,这种大量的海量的非结构化的数据到底怎么样,他认为这是IT面临最大的挑战。

前一段跟法国投资银行人也在聊,这个仁义值投资IT产业,聊完其他的事情到我们公司做一个问题,他说你作为公司最高技术主管,你认为IT产业最重要怎么发展,他说越宏观越好。我说你这是非结构化的问题将会非常突出,他说是,这么多年我一直在关注这个事情,因为信息产品不断普及我们产生了海量的非结构化的数据,如果我们没有一些办法处理这些数据,人类将被这些数据彻底埋葬掉,这是一个非常非常大的挑战。因为我曾经是在联想时代开始做个人产品,对这个问题一直关注,这些年也花了一些时间来研究这种事情。

下面简单说一下非结构化的数据到底怎么处理的一些原则。第一个原则就是分类的原则,非结构化数据不可能用一个简单的统一的所谓非结构化数据库,数学模型,这是做不到的,因为非归够化性质差别非常大,比如说电子病历,这属于非结构化,我们小学读书也属于非结构化,我们甚至空间遥感,我们整个城市的监控,我们个人的生活以及企业等等都属于非结构化信息,这些信息之间有的可以是有共同的性质,有的可能把的很大。所以处理非结构化数据必须要进行分类,而这不是从表面分类,而是从底层结构去分析,这样用同样的数学方法来解决。

第二,整体性的原则,要从信息的产生开始到产生环境到应用环境,包括信息之间的关系来研究,来建立数学模型怎么样来描述,而且要把时间的演化加进来,因为信息是随着时间在变的。所以要建立一个动态的全新的模型,这个模型从数学上是个什么东西,它是一个复杂耦合的多数学结构的动态的模型。所以真正解决这个问题是非常有挑战性的,不是说简单大家学过一些程序,问问用户需要什么编一下就可以解决的,不是。这是在理论上具有挑战性的工作。

把现在的热门的云计算、物联网和我刚才说的云非结构化的信息处理放在一张图上看一下是什么关系,对整个产业有什么样影响。我分成三个大的部分,底下就是基础的技术和基础的理论,中间是具体的产品,上面是服务。云计算是什么呢?云计算本质上是IT新的服务消费模式,当然它有技术支撑,产品支撑,但是这个产品支撑是什么呢?是因为IT产品大幅度降价,导致可以用云的方式来提供服务,如果IT产品非常贵,没有任何一个厂商说提供云计算,虚拟化80年代就有,早就开始研究分步式计算,为什么云今天才有,因为IT便宜了,这大幅度降价,云计算是在上面的问题,是在消费层面的问题。物联网是什么问题呢?这本质在于传感器大幅度降价,我1984年在大学的时候小平同志35周年高国庆阅兵,我们都去搞地图,当时印象非常深的事情天安门广场装了摄象头,为什么呢?当时一个摄象头一万多块钱,今天一个摄象头多少钱?为什么物联网今天说的这么厉害,是因为便宜了,如果一万多块钱一个摄象头,北京会有那么多摄象头看着大家吗,不可能的。这也是性价比发生了变化,从产品往上产生了变化。

非结构化的问题是什么呢?这是在最底层发生的变化,当非结构化信息处理的理论和模型突破之后,将从最底层对整个产业产生根本性的联系,对云计算,对物联网,对很多想不到的领域会产生革命性的联系。我们总讲中国信息产业发展有什么机会,我觉得机会不是,要看大家有没有本事。在历史上曾经在计算机得数值计算的年代,其实我们中国是有特别的贡献。在五、六十年代,中国在计算机产业上和国际上的差距没有今天这么大。其中一个很独特的贡献是什么呢?刚才讲的数值计算支撑了计算机当时的应用,我们中科院计算所冯康老师在60年代独立的在国际上创立了刚才我说的有线原理,这是今天在固体力学里面最基本的数值计算的方法,中国人曾经是有很独创性的贡献,在今天非结构化问题日益突出的年代,我们中国人会不会有人做出这个贡献来,我想在座的年轻同志应该做到,我已经老了,他们是不是有志于研究一下这个问题,这个问题的突破,如果周围人真的有一些突破性的贡献,它将为我们整个的产业产生非常大的影响,它将开启完全全新的应用领域。今天为什么在IT领域竞争如此之艰难,因为我们是跟着外国人屁股后面走,很多的习惯,很多的标准变成了一致,如果我们能够开通新的应用,用新的方法解决一些新的问题,这样的话中国的IT产业就会真正找到突围的突破点,真正能够突出重围另开辟全新天地,这是我个人的看法,希望在我有生之年能够看到这个事情的发生,就讲这些,谢谢大家。