Google是如何做移动搜索的(一)

长久以来Google的旗舰产品已成为我们生活的一部分。但Google并不认为搜索理所当然就应该是那样的。此文编译自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有关Google搜索变革研究的第一部分。

天为什么是蓝的?

小孩经常问这个问题,但是很少有家长在不需要帮助的情况下能回答得上。不久以前,找到正确的答案至少需要钻研百科全书,甚至还需要跑一趟图书馆。不过最近,爸爸妈妈只需要打开电脑,Google 一下,点击链接,问题的回答就呈现在面前,然后父母阅读一下解释,再用小孩可以理解的方式阐述一遍即可。

但到了 2015,甚至这种看似快捷的过程也算不上快了。首先,在移动设备上问题的提出更有可能是通过口述而不是在搜索框敲字。其次,尽管从一堆链接排序中选择最相关者仍然是特定查询的有效办法,那些有着明确定义问题(如天空为什么是蓝的)的人更希望马上知道答案。如果 Google 不能马上提供答案,这些人就会失望、甚至愤怒。

那么……“好吧,Google……为什么天是蓝的?”

对于 Google 最近几年对搜索进行的变革,Google 搜索团队负责人 Amit Singhal 以飞机空中更换引擎来打比方,其改动包括排名算法,添加新的企业信息,以及在用户完成问题输入前开始搜索等。除了引擎切换以外,在移动搜索即将超越桌面搜索的大背景下,Google 也在考虑对“座舱”—使用界面进行彻底的重新设计,甚至考虑整个使命的重新定位。

搜索一直是公司的旗舰产品,搜索广告仍是公司的主要收入来源,Google 对搜索的重视跟外界对 Google 的关注点是不一样的。现在开始有人质疑 Google 搜索在走下坡路(参见Google统治终结了吗)。理由包括:1)垃圾结果太多 2)过分强调信息的更新度而非相关性等。Singhal 强烈抨击这种言论,认为说法与事实完全相反,Google 的搜索做得比 2 年前好得多,那些批评者陷入的是一股对过去的怀旧情绪。

尽管如此,Facebook 的社交网络屏蔽 Google 的爬虫抓取信息令 Singhal 感到忧心忡忡,担心封闭的网络会威胁到 Google 的地位。但事实证明他过过虑了。Facebook 的 Graph Search 仍非常稚嫩,对 Google 几乎没什么影响。微软的 Bing 在搜索质量上有得一比,但市场份额不到 1/5。在基础设施、人才厚度、经验、雄心等方面没有竞争对手可以与 Google 匹敌。G+ 尽管远未能成为引起轰动的社交网络,但的确吸引了许多搜索用户的加入。

要说到威胁,Google 搜索最大的威胁并不是来自于竞争对手,而是搜索对象的变化—从 web 迁移到了星罗密布的 app 孤岛。不过 Google 认为这种情况自己是可以克服的—毕竟开发者跟网站站长一样希望自己的信息被发现。从 2013 年秋,Google 开始设立 App Indexing 将移动 app 内的数据纳入整个索引内。现在已经有 15% 的 Android 登录用户可获得含 app 内信息的搜索结果。但是 iOS app 是一个很大的坑。

目前抓取 app 信息的挑战尚未影响 Google 的搜索统治地位。Google 每天接受的搜索查询超过 30 亿次,每年执行的搜索超1万亿次。美国 2/3 的搜索用的是 Google,在全球其他地区(中国除外)情况类似。最近 Google 搜索份额的变化只是因为Yahoo跟Firefox的默认搜索引擎交易导致的。而且 Google 还拿到了 80% 的移动搜索份额。2013 年 Google 出现了 5 分钟的中断的结果是全球流量下挫了 40%!

尽管搜索不是外界关注 Google 的热点,但它本身却正在进行稳步而密集的再造。实际上 17 年的时间里 Google 从未停止对搜索的改进,但最近几年 Google 搜索变革的速度明显加快,为的是保持领先优势。

其中的一些变化用户已经有所体会。搜索更快了、内容更新了、更加社会化了、结果呈现更加丰富了。这些变化不是一夜之间完成的,而是 Google 持续不断的升级改进的结果。Google 每周都要开搜索质量协调会,对算法进行微调。每 2、3 年都要对排名系统进行重大升级,最近一次的代号为 Hummingbird。据称过去 3 年排名系统进行的改动要比此前 13 年的加起来还要多。

Google 搜索的变革主要体现在三个方面:知识图、语音搜索和 Google Now。知识图把全球的信息组织为一个浩瀚的数据库;语音搜索把口语吸收进了搜索;而 Google Now 则提供了未问先答的能力。这三大变化都与 Google 聚焦于移动有关。

知识图(Knowledge Graph)

知识图谱的推出源自对 MetaWeb 的收购。MetaWeb 2005 年由知名计算机科学家与创业者 Danny Hillis 创办,2007 年推出。做的是语义网。MetaWeb 做的事情也是通过扫描互联网去回答问题,它拥有 1200 条人、地点与事物的实体记录,一度被认为是 Google 的竞争对手。不过最终 Hillis 意识到只有在 Google 的大树下自己搭建全球信息数据库的宏伟目标才能实现。而彼时尽管 Google 也提供了一些问题(比方说奥巴马生日)的直接答案,但是却无法回答“西海岸学费低于 3 万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过 40 的演员”这样的问题。双方一拍即合。

Google 意识到,事物是搜索的重要部分,而让大众关心的事物的事实与信息迅速呈现是一种很好的方式。于是在 MetaWeb 的基础上,2012 年 5 月,Google 推出了提供搜索主体关键事实的知识图作为搜索的辅助呈现在搜索结果页面的右侧。现在它的条目已经超过了 5 亿。那么那些搜索结果会出现知识图呢?Google 会将查询词条扩展为其他形式和同义词等等,然后进行算法测试看看是否与知识图(Knowledge Graph)结果相关,确定相关后再从中择取相关结果呈现(比方说敲“达芬奇”试试)。根据估计,目前约有 25% 的搜索可唤出知识图。

在 Google 搜索与知识图整合的这 2 年多的时间里,知识图也在不断演变。原先它是静态的,但现在正慢慢吸纳 Google 搜索本身在分析用户行为方面的学习能力。比方说“谁在《太空炮弹》中饰演 Barf?”这样的问题问多了以后,知识图就知道要把演员、电影和情节等东西列进去。

此外在知识的新鲜度方面知识图也有了大幅改进。以往知识的更新最长可能需要 2 个星期。但现在系统已经能处理新闻,所以更新调整只需要几分钟。

当然,Google 的改进计划还有很多。包括增加知识域(最近添加了汽车、视频游戏、雨果文学奖得主),提供除简单事实以外更加复杂的、更主观性、模糊化的搜索结果。用户的兴趣点就是改进的出发点。而 Google 最终想要实现的效果是,让你不仅觉得跟你对话的不是冰冷的机器,而是既无所不知又懂附庸风雅的圣人。

但这个目标目前还有点遥远。令产品经理 Emily Moxley 恼火的是,尽管现在知识图已经知道一些电视节目,但却既缺乏新剧集的信息,也不知道什么时候上映,在哪里能够看到。在知识图成为圣人之前,Google 需要要先实现这一“中期目标”。

或者这个要求还有点高。因为 4 年时间过去了,Google 至今仍未给出上述那两个类似问题(“西海岸学费低于 3 万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过 40 的演员”)的一站式的答案。知识图,任重而道远啊。

未完待续......