深度学习不是AI的未来

对大部分人来说,“人工智能”意味着科幻电影中能够给出聪明解释的人工智能,电影中人类可以快速决定自己是否同意,这样易于进行法律验证。大多数听到公司是“人工智能第一位”或“增加人工智能”的人,包括法官和撰写《一般数据保护条例》(GDPR)等法律的人,都会期待和电影中一样的“人工智能”,即如果被法院传召,它能够捍卫自己的决定,这令用户和法官都印象深刻。然而我们得到的是无法解释的“深度学习人工智能”,仅仅因为其缺乏可解释性,这些人工智能即使在它们能够解决的问题上也不会经常得到使用。深度学习无法节省成本,也不会取代那些需要敏锐的自动决策的工作。即使在人类必须作出最终决策的情况下,人工智能工具能够解释自己的建议,也比它不给出理由就做出回应更加可取。可解释的人工智能一旦被(重新)发现,将会更加安全、合法、廉价、快速,并且取代深度学习和人类。深度学习在 20 世纪60到80年代发明,而到2010年才重新被发现,或许未来可解释的人工智能基础也已经被某些研究者描述出来,但是由于不是深度学习,所以可能在许多年内都没人关心和开发该类型的人工智能,直到它们被重新发现和炒热。

关于自动决策的GDPR也需要防范基于种族、意见、健康状况等产生的歧视。但是使用用户生成的数据,如社交媒体和新闻(而不是真实的数据,例如医疗或财务记录)训练的深度学习模型通常暗含邪恶的偏见。如前所述,深度学习可以读取大量文本和数据,并模仿其内容,但无法批判性地理解内容。深度学习只相信它在数据中频繁看到的事物、底层模式和趋势,因此它会放大人类社会的偏见和问题。如果数据显示被逮捕的黑人比白人多,那么一旦有人犯罪,深度学习将首先怀疑黑人。数据显示公司董事会董事中男性比例高于女性,深度学习将在招聘中更倾向于男性应聘者。

深度学习决策会比训练数据的平均样本包含更深刻的偏见,如种族歧视、性别歧视。这个问题在所有的机器学习算法中都会发生,但是深度学习模型是其中最难测试、检测、控制和调整的。例如聊天机器人变得纳粹化、充满仇恨,或者美图软件中给黑人照片美白。这个问题很难解决,与其试图解决它,很多深度学习实验直接因为它而突然取消。

2

你无法通过在训练之后添加补丁,来修复一个带有偏见、种族和性别歧视的深度学习模型。深度学习是一个神经网络,与其他人工智能方法不同,你无法通过局部补救来修改某个答案,而是必须使用不同的、完全平衡以及公正的、稀有的真实世界数据对该网络进行重新训练。深度学习可以在不理解数据的情况下模仿数据中的内容:它不会否定任何数据,不会发现社会上的偏见,而只是“学习数据”。你应该雇佣一个人类员工,专门创建来自理想社会的假的、公正的数据,在这里白人与黑人被逮捕的频率相同,董事会中50%的董事都是女性,等等。但是,由人类专家创建海量无偏见数据的成本如果仅是为了训练深度学习模型,用人工智能取代人类的价值又在哪里呢!此外,即使你已经训练出真正公正的深度学习模型,你也没有证据可以向法官或用户证明其决策的公正性,因为它无法提供解释。

深度学习用于没有法律风险的非商业应用或者游戏,其重要性将会降低。当可解释的人工智能流行起来时,深度学习将会像磁带或阴极电视一样被抛弃。在游戏中输给机器人的人类不太可能说服法官因为人工智能公司无法解释人工智能是怎么赢的而对其罚款。不满FaceApp把自己的自拍照修的更老、更年轻,或者换了性别的人也不太可能说服法官因为FaceApp无法解释人工智能是如何决定新面孔的而对其罚款(除了一个“种族变化”滤镜,遭到大规模抗议后被移除,完全不需要法官参与)。在医疗图像中进行疾病检测是一项安全的深度学习应用,前提是用户在服药之前先向人类医生寻求确认。

合法的深度学习市场非常有限:在决策结果造成财政、健康上的区别,或者存在歧视,而深度学习无法帮助人们理解决策是否公正以及为什么公正的时候,法官都可以进行处罚。那么自动驾驶呢?似乎在艺术、游戏或高级幽默以外的领域使用深度学习都有法律风险。有需要时,现有的非深度学习方法可以取代深度学习,新方法也会被(重新)发现,因此人工智能的发展将会继续顺利进行。尤其是如果每个人都将研究(并投资)人工智能和机器学习科学领域中的所有新旧算法,而不只是深度学习:这也是成为“人工智能全方位专家”的唯一路径。