科幻电影中的人声OS:Siri等语音助手的未来?

      第66届美国编剧工会奖昨日揭晓,金球奖最佳编剧得主斯派克·琼斯凭借影片《她》击败《美国骗局》等对手,捧得最佳原著剧本奖。

科幻电影中的人声OS:Siri等语音助手的未来?

       好莱坞总是能够告诉人们未来的生活将会变成什么样。但很少有人知道,几十年来,电影为现在许多具有远见的科技,提供了灵感。

       当然,科技同样也激发了电影的创作。例如在拍摄《少数派报告》(Minority Report)之前,大导演史蒂芬·斯皮尔伯格(Steven Spielberg)就曾前往硅谷,想要直到50年以后科技会发展到何种地步。

       美国电影导演斯坦利·库布里克(Stanley Kubrick)经典电影《2001太空漫游》中的超级电脑HAL9000,还有《星际迷航》(Star Trek)中能够与飞船驾驶员互动的电脑,以及《霹雳游侠》(Knight Rider)中那部会说话的汽车KITT等,都对智能语音助手Siri 产生了很大影响。

       当然,与直接通过想象创造角色相比,将先进技术组合在一起并不是件容易的事。打个比方,斯派克·琼斯(Spike Jonze)新电影《她》(Her)中,那个由斯嘉丽·约翰逊(Scarlett Johansson)配音的电脑系统Samantha,现在能否构建出来?是否真的能够排遣“寂寞”?

       回首2007年,戴格·吉特劳斯(Dag Kittlaus)等人一起研发出了Siri,当时的他们想要创造全球首个真正意义上的虚拟个人助手,人们只需要进行简单的对话,就能够与自己的设备进行互动。Siri存在的意义是将事情做好。但是,有趣的事情发生了,Siri 一夜之间造就了一种文化现象。Siri不再只是一个新的便捷手机使用方式,Siri很有趣,甚至有些像人类。人们会跟Siri 一聊就是好几个小时。那个时候,Siri就像是《她》中的Samantha。

       不过,电影中那个拥有斯嘉丽性感嗓音的操作系统,比起今天的Siri,情商更高。那么,Siri 达到电影中那样的级别吗?这说不定,不过别抱太大希望。

       在《她》中,Samantha是百分百计算机智能,其与男主角泰奥多尔·托姆布雷(Theodore Twombly)交流互通,并且了解并最终与泰奥多尔建立了一条非常强烈的情感纽带。要做到这些,Samantha不仅需要让泰奥多尔完全相信她与人类无差,同时还要引发他的“性趣”。为了取得成功,并继续赚订阅费,Samantha需要理解大量的频谱成分,让其能够拥有情感、对话甚至观察和分享自己世界的能力。在智能软件领域,做到这些可不是件小事。

       为了让“这简直不可思议!”科技运行起来,Samantha任何一个小失误都不能有,永远都不能听错或理解错泰奥多尔说过的任何一个字。在当前这个喧嚣的世界,难度非常高。特别是在吵闹的场所,比如马戏表演现场,想听到身边人的生意都很困难,更不要说在这个闹哄哄的场所中理解听筒里传来的每个单词的细微差别。

       电影中,泰奥多尔的口袋里有一个照相手机镜头,Samantha通过这个镜头左右转、观察、理解并评论她所看到的世界,这个场景如何实现?

       这就需要进行大量的实时图像识别缩放、空间理解、面部及情绪识别,同时还要理解上万种社会情境的细微差别,从而预测出对面座上的那对儿是不是第一次约会。

       电影中,Samantha是多么健谈的一个人!她不仅能和泰奥多尔探讨各类话题,还非常懂得泰奥多尔的情绪变化,发现他语调的轻微变化以及带有情感色彩的口语表达,甚至展现出其对流行文化修辞的应用能力。

       建立一个能够熟练与真实用户调情的程序,其复杂程度非常之高。不仅要有非常性感音效,还要能够在对的时间作出回应,与用户完美和谐共处。但不管怎样,对一家企业来说,开发这样的一款产品听起来确实是个不错的想法。