用户观点:计算机科学中的符号与搜索(二)

 符号和物理符号系统

让我们回到符号论题上,对物理符号系统作出定义。形容词“物理的”指明两个重要特征:

1. 这种系统显然是遵循物理学定律的,它们可由用工程化分量构成的工程化系统来实现;

2. 虽然我们使用术语“符号”,预先勾画的是我们意向式的解释,但是它并不局限于人类符号系统。

一个物理符号系统是由一组叫做符号的实体组成的,这些实体是一些物理模式,可以作为另一种叫做表达式(或符号结构)的实体的分量而存在。所以一个符号结构是由一些以某种物理方式相联系的符号实例(或标记)组成的(如一个标记紧接着另一个标记)。在任一瞬间,该系统都包含一个这些符号结构的集合体。除了这些结构而外,该系统还包含一个由按照一些表达式运作,以产生出另一些表达式的过程,如创造过程、修正过程、再生过程和破坏过程组成的集合体。物理符号系统是一台机器,它产生出一个随时间而演化发展的符号结构集合体。这种系统存在于一个对象世界之中,这些对象的数量比符号表达式本身更多。

对这些表达式、符号和对象的结构而言,有两个核心概念:指称和解释。

指称一个表达式指称一个对象是指,在已知该表达式的情况下,一个系统或是能够对该对象本身施加影响,或是能够以取决于该对象的方式规范其行为。

在任一情况下,其结果都是经由表达式而抵达对象,这正是指称的实质所在。

解释系统能够解释一个表达式是指,该表达式指称一个过程,同时在已知该表达式的情况下,系统能够执行这一过程。

解释意指依赖行动的特定形式:已知一个表达式,系统就可以完成所指定的过程,也就是说,它能根据指称这些过程的表达式而再现和执行它所拥有的过程。

根据上述理解,一个具备指称和解释能力的系统必然也满足若干新增的必备条件,具有完备性和封闭性。由于篇幅的关系,我们只能简单谈这些。所有这些都是重要的,而且有着十分深远的影响。

1. 符号可以用来指称任何一种表达式。就是说,给出一个符号时,并没有实现规定它能指称什么表达式。这种任意性仅仅是对符号而言的,而符号标记和它们的相互关系则决定着一个复杂表达式所指称的是什么对象。

2. 存在着一些表达式是指称计算机所能完成的每一过程的。

3. 存在着一些过程是以任意方式建立任何表达式并修正任何表达式的。

4. 表达式具有稳定性,它们一旦建立,在明确地被修改或被取消之前,会一直存在下去。

5. 系统所能拥有的表达式个数基本上是无限制的。

我们刚刚定义的这种系统是计算机科学家们所熟悉的。从其属性来看,它与一切通用计算机极为相似。如果采用符号处理语言,如LISP语言,来定义一台机器,那么其亲缘关系就真的变得像同胞一样了。我们策划这种系统的意图并不是要提出某种新东西,恰恰相反,我们是要证明,对于符合这种特性的系统,我们现在已知什么,又作出了什么假设。

 

现在我们可以阐述一个一般性的科学假设了——符号系统的定性结构定律:

物理符号系统假设对一般智能行动来说,物理符号系统具有必要的和充分的手段。

所谓“必要的”是指,任何表现出一般智能的系统都可以经分析证明是一个物理符号系统。所谓“充分的”是指,任何足够大的物理符号系统都可以通过进一步的组织而表现出一般智能。我们想用“一般智能行动”来表示与我们所看到的人类行动范围相同的智能:在任一真实情境中,对该系统目的来说是恰当的、并与环境要求相适应的行为,会在一定的速率和复杂性的限度之内发生。

物理符号系统假设显然是一个定性结构定律,它规定了系统的一般类别,在这些系统中我们会看到那些具有智能行动能力的系统。

这是一个经验假设。我们已定义了一个系统类别,还希望了解这个类别的系统是否说明了我们在现实世界中看到的一组现象。在我们周围的生物界中,主要是在人类行为中,智能行动随处可见。它是一种行为形式,我们可以依据其结果识别它是否是由人类完成的。该假设的确可能有误。智能行为并非这么容易产生,以至于任何系统不管其愿意不愿意都会表现出这种行为。有些人经过分析,确定能以哲学或科学为根据得出这一假设为误的结论。而科学的态度是,只有拿出关于自然界的经验证据,我们才能攻击这一假设,或为它作出辩护。

现在我们需要回顾一下这一假设的形成过程,并看一看它的证据。

符号系统假设的形成

物理符号系统是通用机的一个例子。所以符号系统假设就意味着智能将由一台通用的计算机来实现。然而这一假设远远超出了通常在物理决定论的一般基础上得出的结论:任何可实现的计算,只要得到详细说明,就可以由通用机来实现。由于它明确地断言智能机器是一个符号系统,所以它以特定的构造方式断言了智能系统的性质。了解这一新增的特性是如何出现的,十分重要。

形式逻辑 该假设的起源要追溯到弗雷格、怀特海和罗素就形式化逻辑提出的方案:以逻辑方式获取基本的概念式数学观念,把证明和演绎观念置于可靠的根基上。这种努力在数理逻辑中达到了顶点,这就是我们所熟悉的命题逻辑,一阶和高阶逻辑。它形成了一种独特的观点,常常被称为“符号游戏”。逻辑,也包括所有数学,是根据特定的纯句法规则,用无意义的标记所做出的一场游戏。所有的意义都被清除了。我们具有的是一个机械系统,尽管是非强制性的(我们现在也称之为非决定论的),而有关这一系统的种种事情都可加以证明。这样的成功首先是通过一步步远离所有看来与意义和人类的符号相关的东西而取得的。我们可以把这一阶段称为形式符号处理阶段。

这种一般性态度充分反映在信息论的发展中。申农曾定义了一个仅仅对通信和选择有用的系统,而与意义毫无关系,这一点一再被指出。人们后悔以“信息论”这个一般性名字为这一领域命名,而打算把它修改为“选择信息的理论”,当然没有成功。

图灵机和数字计算机早期数字计算机的发展和自动装置理论的发展可以放在一起讨论,它们是以图灵本人30年代的研究为起点的。在何者是根本的这一点上,它们的观点是一致的。我们采用图灵本人的模型,因为它充分表明了有关特点。

图灵机由两种存储装置组成:无限长纸带和有限状态控制装置。纸带上有数据,即人所共知的0和1。该机器在纸带上有非常小的一组适当的操作——读、写和扫描操作。读的操作不是数据操作,而是为控制状态提供条件分支,而控制状态则表现为读头下数据的函数。正如我们都知道的那样,就计算机能做什么而言,上述模型包含了一切计算机的基本要素,虽然别的带有不同存储装置和运作装置的计算机也可能以不同的空间和时间条件完成同样的计算。特别要指出的是,图灵机模型内含两种观念:关于不能计算的东西的概念,以及关于通用机——即能做任何机器都能做到的任何事情的计算机——的观念。

30年代,在现代计算机问世之前,我们已在两个方面对信息加工取得了深刻的认识,这的确是令人惊讶的。它对A·图灵的天才创造具有启迪作用,并对当时的数理逻辑发展作出了贡献,计算机科学也无疑深深受惠于它。与图灵的著作同时,还出现了逻辑学家E·波斯特和A·丘奇(各自独立完成)的著作。他们从独立地逻辑系统观念(分别是波斯特生成和递归函数)开始,在不可判定性和通用性方面得出了类似的结果,这些结果不久即得到了证明,原来这三个系统完全是等价的。的确,所有这些定义最一般的信息加工系统类别的尝试取得了一致的结论,这种情况具有某些说服力,使我们确信:我们已在这些模型中获得了信息加工的基本要素。

从表面上看,这些系统中没有一个把符号概念当作某些作指称用的东西。数据仅仅被看作一些0和1的数字串——对于计算向物理过程的还原来说,数据无作用这一点的确非常重要。有限状态控制系统总是被看作一个小控制器,为了在不破坏机器通用性的情况下弄清小到何种程度的状态系统是可用的,得做一些逻辑游戏。就我们所知,未曾有一种游戏为有限控制增添了新的动态方式的状态——把控制存储看作是持有大部分该系统的知识。在这一阶段上所完成的只是解释原理的一半——证明机器可以根据说明运转。因而,这是自动形式符号处理的阶段。

存储程序概念在40年代中期,(在电子数字积分计算机之后)随着第二代电子计算机的发展,出现了存储程序概念。将这一进展誉为在概念和实践两方面的里程碑是恰如其分的。现在程序可以是数据,也可以作为数据来运作。当然,图灵的模型中已隐含着这种能力:说明与数据同在一条纸带上。然而只有在机器获得足够的内存,使得在某个内部位置上找到实际程序在实践上是可行时,这一思想才得以实现。电子数字积分计算机毕竟只有20个字节。

存储程序概念实现了解释原理的另一半,这一部分指出可以对系统拥有的数据作出解释。但是它仍未包含指称的概念——作为意义基础的物理关系的概念。

表处理下一步——表处理,是在1956年完成的。现在数据结构内容成了我们物理符号系统意义上的符号,即被指称的模式意义上的符号,因而具有了所指对象。一些表拥有容许向另一些表做存取的地址——这就是表结构的观念。在表处理刚出现时,同行们一再向我们提出数据存在于何处的问题,就是说,最终是哪一个表拥有作为系统内容比特的集合体,这种情况向我们证明这是一个新观点。同行们惊异地发现,根本没有这样的比特,有的只是指称别的符号结构的符号而已。

在计算机科学的发展中,表处理同时表现为三件事情:

它是机器中真正的动态存储结构的创建,而以前一直认为机器只有固定结构。它在替换和改变内容的操作之外,为我们的操作总体增添了建立和修正结构的操作。

它及早地证明了这一基本抽象方式:计算机是由一组数据类型和一组对这些数据类型来说是恰当的操作组成的。这样,计算系统就能运行任何一种对应用来说是恰当的数据类型,而不受处于基础地位的机器影响。

表处理产生出一个指称模型,而这样定义符号处理与我们今天把这一概念用于计算机科学时具有同样的意义。

正如经常出现的那样,当时的做法已预示出表处理的所有基本因素:地址显然被用于实现存取,磁鼓机则用于被连接的程序(所谓1加1编址),等等。但是,以抽象方式出现的表处理的概念形式开创了一个新天地,在这里,指称和动态符号结构定义出许多特征。将早期表处理系统嵌入语言(IPL、LISP语言)的做法常常受到指责,说它是将表处理技术扩展到整个编程实践的障碍,然而它却是将抽象方法结合起来的工具。

LISP语言还有一个步骤值得注意:麦卡锡在1959-1960年创立了LISP语言(McCarthy 1960)。它完成了对动作的抽象,是将表结构从它们在具体机器内的嵌入状态中取出,创建一个新的带有S表达式的形式系统。可以证明,它与其他通用的计算方案是等价的。

结论 指称符号和符号处理的概念直到50年代中期才出现,者并不是说较早的进展是非本质的,或不够重要。这一总的概念综合了可计算性、(通过多种技术的)物理可实现性、通用性、过程的符号表述(即可解释性),最后还有符号结构和指称。每一步进展都为这一整体提供了不可或缺的部分。

这个链条的第一个步骤是由图灵创立的,它是由理论方面的兴趣推动的,但是其他各步都深深地根植于经验。我们始终受到计算机本身进展的引导。存储程序原理出自电子数字积分计算机的经验。表处理方法出自构造智能程序的尝试,随机存储装置的出现使它受到启发,它为编址的指称符号提供了一个明显的物理实现方式。LISP语言则是来自表处理方面不断发展的经验。

(未完待续)


------------------------------------------------------------------------------------------------------------------------------------------
以上文章被中国计算网收录于2018年12月7日,转自c3同学共创空间,欢迎CAE与计算机行业人士投稿于中国计算网
搜索微信公众号: cncompute_Mall   直接关注,更多惊艳的资讯等你来关注~您也可以来投稿~