我如何理解深度学习?

  好了,深度学习原理部分基本讲完了,当然,这仅仅是术的追求,笔者也只是知道皮毛,那这类深度学习对于我们理解这个世界到底有什么帮助?

  首先,深度学习的神经网络这么一层层构建到底在干什么?

  从物理理解的角度讲,通过现有的不同物质的组合形成新物质,给你举个例子,碳和氧原子通过组合,可以形成三个新物质,见下图:

物联网

  形成的新物质之间又可以相互组合,形成更为复杂的新物质,如此循环,从而形成我们这个世界,这是其物理意义。

  从数学的视角,其实就是在做一层层的空间变换,让原来无法区隔的空间变成可以区分,你要理解,这个世界绝对不是线性的。

  空间变换有五种形式,回忆一下前面讲的。

物联网

  其中:

  aw:做的空间变换是升维/降维、放大/缩小及旋转;

  b:做的空间变换是平移;

  σ:实现弯曲

  比如一维空间,以分类为例,当要分类正数、负数、零,三类的时候,一维空间的直线可以找到两个超平面(比当前空间低一维的子空间。当前空间是直线的话,超平面就是点)分割这三类。但面对像分类奇数和偶数无法找到可以区分它们的点的时候,我们借助 x % 2(取余)的转变,把x变换到另一个空间下来比较,从而分割。

  对于二维空间,平面的四个象限也是线性可分。但下图的红蓝两条线就无法找到一超平面去分割:

物联网

  神经网络的解决方法依旧是转换到另外一个空间下,用的是所说的5种空间变换操作。比如下图就是经过放大、平移、旋转、扭曲原二维空间后,在三维空间下就可以成功找到一个超平面分割红蓝两线:

物联网

  上面是一层神经网络可以做到的,设想网络拥有很多层时,对原始输入空间的“扭曲力”会大幅增加,如下图,最终我们可以轻松找到一个超平面分割空间。

物联网

  所谓监督学习就是给予神经网络网络大量的训练例子,让网络从训练例子中学会如何变换空间。每一层的权重W就控制着如何变换空间,我们最终需要的也就是训练好的神经网络的所有层的权重矩阵。

  这就是深度学习的变换空间本质。

  从物质组成的角度讲,前面由碳氧原子通过不同组合形成若干分子的例子。从分子层面继续迭代这种组合思想,可以形成DNA,细胞,组织,器官,最终可以形成一个完整的人。继续迭代还会有家庭,公司,国家等。这种现象在身边随处可见。并且原子的内部结构与太阳系又惊人的相似。不同层级之间都是以类似的几种规则再不断形成新物质。你也可能听过分形学这三个字。可通过观看从1米到150亿光年来感受自然界这种层级现象的普遍性。

物联网

  图像识别中的人脸识别,只是一种应用,图像由像素组成,像素可以形成菱角,棱角可以形成五官,五官可以形成不同的人脸,每一层代表不同的物质层面 (如分子层)。而每层的W存储着如何组合上一层的物质从而形成新物质。