深度学习+超级计算:上帝的计算机长什么样?

深度学习+超级计算:上帝的计算机长什么样?

按:作者系SenseTime(商汤科技)深度学习科学家周斌博士,中国首位HPC(High-Performance Computing,高性能计算)和GPU跨领域研发高级工程师,中科大客座研究员。2013年,周斌被NVIDIA授予了全球第12个CUDA Fellow 的称号,成为了中国唯一获此称号的学者,拥有此称号的还有胡恩伟、青木孝之、Ross Walker、Jone Stone 等世界知名专家学者。

SenseTime 最近推出了超算平台SenseBox,据称,其存储和计算能力可以让深度学习项目获得更快的训练时间和更好的训练数据,从而培育出新一代的更强“大脑”。

如果有一天醒来,发现自己成了上帝,(无所不能的感觉真好!)你会怎么样?这样的场景虽然只存在于科幻中,但是随着深度学习所引领的人工智能技术的进步,人类创造出强人工智能已经成为了一个严肃的科研问题。人类,乃至宇宙,可能是某个“上帝”所制造的程序代码,就像罗伯特·J·索耶在《计算中的上帝(Calculating God)》所描述的那样。在我们创造的人工智能体眼中,我们就是上帝。

上帝的计算机长什么样?

我们作为人工智能体的上帝,还是需要一台计算机(请原谅我狭隘的想象力,作为深度学习+的程序员,他的身边永远都有几台计算机)来运行上帝的代码——虚拟的宇宙和智能,这样的计算机长什么样?

这是个很有意思的话题:上帝的计算机需要无穷快的速度,无穷大的存储,无穷智能的接口……幻想到此打住,归根结底,我们虽然是上帝,但只是我们创造的智能体的上帝。回归到现实,为了创造容纳智能体的计算机,我们需要利用手边的材料来搭建能够用于进行深度学习的超级计算机。

曾几何时,在我刚开始深入研究这个领域的时候,超级计算机还是躲在深闺大院、处于庙堂之上,研究物理、化学、生物、数学、密码、气象等等高深莫测的科学(我都有所涉猎,很多问题归结为数学和计算)。现在,信号处理、图形图像、视频、天气预报、生物信息学、网络搜索等等应用领域都能发现超算平台的身影:

在气象领域,超算平台可以显著提升天气预报和沙尘暴模拟的精确程度,这也是我在美国乔治梅森大学所做的研究。我国新一代全球与区域同化预报系统(Global—Regional Assimilation and Prediction Systems,简称“GRAPES”)也是基于超算平台的气象项目,中国国家气象局的天气预报曾采用“GRAPES”系统;

在医疗领域,实现医学图像的有效识别是目前计算机科学和医学交叉领域研究的热点,在肿瘤图像识别的相关研究领域,超算平台的应用能使GPU的识别速度和精度得到大幅提升,从而整体提升医疗服务质量;

在军事领域,超算平台堪称现代化国防建设的重要科技支柱,中国目前最先进的中程空对空导弹“霹雳12”就应用了相关技术。

以上种种进步都离不开平台超算本身的发展、迭代,中国的超级计算机一直处于世界领先地位:中国“天河一号”超级计算机GPU系统研发时,“天河一号”的运算水平就曾排名世界第一;现在“天河二号”超级计算机系统更是连续五次位列世界超级计算机500强排行榜之首。上帝的计算机或许是个玩笑,但是作为智能体上帝的计算机,很可能就诞生在现在的各种超算之中。

深度学习之超算平台

如今,为了容纳深度学习的超大规模计算需求,超级计算机已经成为训练各种深度神经网络的利器。深度学习技术试图通过大规模的神经网络和大数据提供的海量训练集合,将大脑学习识别的过程加以抽象,从而获得极高的识别准确度,这些都带来了极大的计算需求和吞吐需求。于是,这些以往高居庙堂的屠龙之技有了用武之地:GPU协处理器、高速InfiniBand网络、RDMA、GPUDirect等成了利器,提供着高吞吐、低延迟、高性能的系统平台。虽然离着无穷还有无穷,但是为分布式大规模的深度学习算法提供了极高的带宽和极低的延迟,使通信的开销最小化,为训练各种深度网络提供了强大的平台。