演讲全文:慵懒的密码学专家们是如何做人工智能的

  在做准备这段时间,我可以向你们介绍一下CAPTCHA全自动计算区分人与计算机系统,也就是图灵测试,就是抓住你了,CAPTCHA从英语说法来的,抓住你了,CAPTCHA这个项目主要是区分计算机和人类,它的有关一个程序告诉什么是计算机,什么是人,而且是全自动的,可以把它看成是一个卫兵,它站在门口,如果要是一个人的话,那就是请进,要是电脑的话,那就对不起了,别想进来,因此,我们想搞这么一个程序,它可以允许人进来,但是把电脑排除在外。这里边有一点自相矛盾的地方。很奇怪的这么一点,因为电脑必须要决定一个人它是人还是电脑呢?我们必须要搞这么一个程序,它能够进行这种测试,还要给它评级评分,给测试,给表现人评分,可是这个方案却通不过这个测试,多亏我多年在大学任教,所以我知道考试有多难,我知道当学生考试很难,去考学生很容易。所以它是有可能编这么一个程序的,它可以去把人和计算机区别开来,可是这个程序却自己通不过这种测试,这是可能的,而且编制这么一个CAPTCHA也是可能的,解决比较难的问题,姚教授刚才提到量子加密的问题,根据分解的问题,分解大数是一个非常困难的复杂的问题,我们CAPTCHA也想在比较复杂的问题上进行程序编码,我们面临的复杂问题就是人工智能,简称AI。我们想根据以下来见证CAPTCHA,如果方案程序为一个电脑编制这样一个程序,使他们通过CAPTCHA程序的话,这样这个电脑就解决人工智能的问题了。我们现在尤其一些黑客经常编写程序,他们想电脑通过卫兵,我们希望黑客和我们一起来解决所涉及到的人工智能的问题,今天我要讲的题目是50%布朗要讲的,另外一半是我学生要讲的,这些是他们做的研究,CAPTCHA的程序,我只是介绍几种可能性,CAPTCHA可能的运行方式,它有一个一千字的词汇表,这一千字的词汇表就是包括英语一千个字眼,我挑选额一千个字眼,因为五岁的孙子可以认识这一千个字,对我来说五岁的孙子能够通过CAPTCHA程序是很重要的一件事,因此识别从5岁一直到80到85岁的人,因为我的妈妈是84岁,因为我们的妈妈也能够通过CAPTCHA。它们工作的道理从一千个词汇量挑出七个字,随意的挑选,一旦挑出来之后,对这些字做了修改,把这些字打乱了图形,一旦有打乱了图形之后,你会看到测试是怎么进行的,现在测试就是你看到这样一个很混乱的图形,看一看你是不是能够把混乱的图形变回到最初的那七个字,这里可以看到这是打乱的图形,这里面有七个字,包括图形里,所以看到这里有一个门槛,你可以把它定为七个字,你可以改变这个门槛,我们从字典挑出七个字,把七个字打乱了,变成这样一个图形。孩子们是很敏锐的,你知道吗,非常小的孩子,眼光非常敏锐的,不同图形的字,有的在树上,各种鸟的动作,他们观察力非常敏锐,比如说你可以把字放在瓶子里,孩子都能识别出来,这是很令人惊奇的事。所以我们现在的识别设备却做不到这一点,他对混杂的图形他可以识别出来,这是很难的,这是人工智能的问题,如果有一个黑客,能够编写一个程序,能够识别出这个字的话,那就更好了,这比CAPTCHA更要好,我们有一个更好字的识别系统,这样我们就可以阅读美国国会的图书馆里的图书了。

  这就是我们的测试,我还想谈一谈它的用途。

  你记得刚才向我们讲述了交谈间谈话间的问题,怎样把蠕虫赶出交谈间,另外他还想一个办法,把我们的垃圾邮件从电子邮件清除出去,完全把这些赶出去,或者完全阻止他们,但是完全可以打消他们的速度,因此许多用途用于电子邮件,可以用于浏览和采购,这是又一个用途,这是很可怕的一个用途。美国有投票站了,在美国最好的销售电脑的研究生院是哪里,康耐尔大学肯定是康耐尔大学,各个学校的学生投自己的票,卡奈基梅隆突然找了,你知道为什么吗?有一个蠕虫,投票,我们要人去投票,让蠕虫去做吧,他做得更好,他的票很多,几千人,麻省理工学院又比他多了几票,麻省理工学院比我们多了一票,不管IMT总是比我们多几票,这都是蠕虫搞的。因此,确定之一票是人,而不是蠕虫,如果把蠕虫排除出去我们就可以知道,我们确保每一个投票的人首先要通过卫兵,什么是CAPTCHA呢,CAPTCHA是一个程序,可以区别用户是计算机还是人,我们现在把计算机和人区别开来,电脑想把人和计算机区别来,因此CAPTCHA可以做这样的测试,大多数可以通过这个测试,但是现在目前的电脑通不过这个测试。而且我想计算机绝对不可能比我们人类所有的事情都比我们做得好,这就是我们对计算机的总结,实际上它有点像这种系统,是自动化,是一种程序,而且是公开的程序,我们把它所有的程序共同上我们的网站来看一看我们的CAPTCHA是怎么工作的,完完全全是变化的,图灵测试通过一种测试把人和计算机区分开来,而且我们大家应该记住,是如何上网站,因为它P拼写稍微有点怪。P是原代码,说明我们的原代码应该是公开的。为什么要把它公开呢?下面有一些原因。首先把它公开以后,把CAPTCHA设计师能够加以关注,当你通过测试的时候,你可以看一看某些单词是单词的程序,有欺诈倾向的人民才能够看一看CAPTCHA程序是怎么样工作的,因此最好的办法是把它公开,所以我们所有的数据都是公开的。还有其它的原因。