机器翻译的前世今生

这是日本发明的爱犬翻译机。狗狗的颈部套上一只无线麦克风,主人握有一只手持接收器。爱犬的吠声、狂叫和哀呜将分别与数据库存贮的声音对比后翻译成为“好无聊呀”、“我喜欢你”等。CFP

 近年来,各种翻译机不断问世。人们在关注软件质量的同时,对外形的要求也越来越高。图为卡通造型的翻译机器人。资料图片

 美国南加州大学的科学家们最近提出一种全新的机器翻译方法——解码外语。科学家认为这种翻译方法今后甚至可以破译“海豚音”或“外星人语言”。

 机器翻译,简称“机译”,是利用计算机实现从一种自然语言(源语言)文本到另一种或多种自然语言(目标语言)文本的翻译;而用以翻译的软件叫做机译系统。机译涉及语言学、计算机科学、认知科学、数学等多个学科,是一门前沿交叉学科。这一充满挑战的研究领域,被列为21世纪世界十大科技难题的第一位。

最新成果

新思路:

解码外语

美国南加州大学的科学家们最近提出一种全新的机译方法——解码外语。之所以叫“解码”,是因为他们把英语视为一种初始语言,把需要翻译的外语看成类似一种加密后的高级文字,通过解码破译,把外语“破解”成英语。这种翻译方法可以运用到任何一种语言中。虽然目前还只能翻译一些短句或电影字幕,尚未运用到长句或片段翻译中,但它却给机译研究打开了一条新的思路。科学家声称:因为不需要任何既有的文本为基础,这种翻译方法今后甚至可以对“海豚音”或“外星人语言”进行破译。

新应用:

即时翻译

日前,谷歌推出了一款手机翻译软件,能让手机即时翻译用户通话。对着谷歌Android智能手机讲话的用户,将会听到他们的话被翻译成另外一种语言;而通话对方的话也会被翻译成该用户的母语。这是因为它拥有较强的语音识别技术,可以通过声音实现自动检索,再将语音识别和机译结合在一起。这款软件的翻译语言目前仅限于英语和西班牙语。但谷歌表示,不久的将来将会推出包括其他语言的升级版本。

从盲目乐观到“不可行”——机译发展浮沉

 早在古希腊时代就有人提出利用机械装置来进行语言翻译的想法;然而,只有在计算机问世后,机译的梦想才逐渐变成现实。被誉为机译鼻祖的美国数学家、工程师沃伦·韦弗(Warren Weaver)于1947年的各类交谈和信件中多次提到机译的设想,并于1949年7月发表了其有着广泛而深远影响的备忘录——《翻译》,正式提出了机译问题。此后的60多年中,机译研究经历了艰难而曲折的发展历程,有成功和兴奋,但更多的是挫折和困惑。

1954年,美国乔治敦大学在IBM公司协助下,用IBM-701型计算机首次完成了英俄机译试验,向公众和科学界展示了机译的可行性,从而拉开了机译研究的序幕。随后苏联、英国、中国、法国、日本、加拿大等也相继进行了机译试验。机译研究一时出现热潮;在这个时期,机译虽然刚刚处于开创阶段,但很快就进入了盲目乐观的泡沫期。

当时由于人们忽略了自然语言和翻译本身的复杂性以及机器自身的局限性,机译系统的翻译质量很差,还闹出了不少笑话。最著名的例子是,当英语谚语“心有余而力不足”翻译成俄语时,其意思却变成“酒是好的,肉变质了”。1964年,为了对机译的研究进展作出评价,美国科学院成立了语言自动处理咨询委员会(ALPAC),开始了为期两年的综合调查分析和测试。ALPAC于1966年11月公布了一个题为《语言与机器》的报告;该报告全面否定了机译的可行性,并建议停止对机译项目的资金支持。这份报告的公开发表给了正在蓬勃发展的机译当头一棒,各国的机译研究陷入了近乎停滞的僵局。

打开电脑上网翻译 ——互联网让机译再次风靡

全球化进程的加速以及国际交流的日趋频繁,让人们对于翻译的需求空前增长,而互联网的发展让机译迎来了一个全新的机遇。从上世纪80年代中期开始,基于语料库或多引擎的机译方法在研发中得以广泛运用,机译系统的性能、效率和译文质量都有了明显的提高;各式各样的翻译软件如雨后春笋般层出不穷。