搜索未死,数据永生

两年前,我在一篇关于搜索引擎的文章中写到:

 当你向互联网上传一个页面,来自世界各地的无数“蜘蛛”便会蜂拥而至。它们抓取并复制你的网页,跟踪着网页中的链接,悄悄地爬上更多的页面,用触角将它们纳入索引数据库。数据库像轰鸣的机器,拆解网页上的文字内容、标记关键词的位置、字体和颜色,并生成庞大的表格。这时,你输入一个单词,点击Google或百度上的“搜索”按钮,它会在0.2秒内得到响应,带着单词奔向索引数据库的每个神经末梢,检索到所有包含搜索词的网页,依据它们的浏览次数与关联性等一系列算法确定网页级别、排列出顺序,最终按你期望的格式呈现在网页上。这就是一个“关键词”的云端之旅。

两年后的今天,如果仍然这么定义搜索的话,那搜索引擎的确离死不远了,但这最多说明网页搜索离死不远了。而在一部智能手机上,当你用Google或百度地图的app输入一个地址寻找出行路线的时候;当你打开Waze导航对它说:“去斯坦福接上×××”(你甚至不需要说出精确地址)的时候;当你对虫洞语音助手说“我饿了”,它就能帮你推荐附近你最喜欢的一家餐厅的时候;当你在亚马逊上对比同一款充电器在不同卖家的价格的时候;当你用IFTTT这款“万物连接器”应用将你手机里的日历、闹钟、地图和交通提醒工具绑定在一起的时候……你在做的事,无一不是搜索。

谁说搜索死了?离开了Google或百度首页搜索框的搜索,越来越无处不在。你通过一款互联网应用(无论是网页还是app),用任何一种方式(无论是文字和语音)输出一个需求指令,任何实现这个指令需要的数据查找、连接、筛选、反馈结果直到自动帮助你解决问题的过程,都是离开了搜索框的搜索引擎。搜索引擎越来越通晓人类的语言和意图,能识别语音、图像及表情等非文本材料,返回更精确的结果,其中包括大量的多媒体内容——而且还能自动连接和操作它们。

背后无一不是越来越复杂且丰富的数据。搜索未死,是因为数据永生。

举两个最简单的例子:第一,为什么当你向苹果的Siri语音提出一个需求之后,它通常会在几秒中之内将你的答案指向一些Google或百度上的链接内容;而类似的语音助手Google Now却能瞬间直接触及你最核心的目的——推荐菜品、提供路况建议和选择、预订电影院车位?第二,为什么亚马逊首页上你几乎看不到任何在淘宝首页上的那些花花绿绿像狗皮膏药要一样的悬浮banner广告,而它呈现的大部分首页商品结果仍然是你需要的——哪怕背后是商家付费显示的?两者的答案都是数据。

Google Now将个人地理位置轨迹、社交数据、消费习惯和日程表等信息,与Google搜索引擎直接连在了一起,通过数据分析能自动识别人们语音指令背后的真实需求。而亚马逊基于买家历史购买记录的数据,通过筛选和过滤其中的无用数据,可以分析出你可能最需要、并且离你最近最节省物流成本的商品是什么——因此,亚马逊现在敢成为一家广告公司,搭建基于数据分析的,与搜索引擎广告平台原理几乎完全相同的广告产品。

Google和亚马逊是掌握每个人“个性化”数据最多的两家商业公司,它们是大数据公司,同时也是未来的搜索引擎公司。Google的搜索早就跳出了搜索框,进入了地图、Google Now、日历、云存储、Google+甚至无人驾驶汽车(你操作无人驾驶汽车的过程其实只是搜索),而亚马逊将成为在与人们的日常消费和购物领域最聪明、最有识别能力、最让Google不安的搜索引擎工具。

“数据永生”还在将搜索引擎带向下一步。

我今天早上用手机在Google.com和baidu.com搜索“CA986”的时候,显示的结果多少让我有点意外。Google和百度的搜索结果都是关于该航班今天从旧金山出发到北京再到上海的实时情况,包括预计到达时间、实际到达时间、当前状态、停靠航站楼和登机的登机口等信息。而百度的结果还包括了近期准点起飞和到达率,以及在旧金山国际机场和首都机场相应登机口附近,人们用新浪微博更新的相关内容(尽管我觉得有点多余)。这些搜索结果在PC的网页版上是无从显示的。确实,人们在移动环境下,对这种实时、场景感和动态数据的搜索结果需求更真切。

但百度一位负责移动搜索的朋友和我说,这只是第一步。接下来他们试图实现的是:当你用语音助手提出一个指令之后,不但能基于数据检索与分析推送给你最需要的答案和结果,还能自动帮你完成一切。比如,你对着语音助手说“找酒店”的时候,搜索引擎会基于地理位置找到你最需要的酒店类型,然后自动地打开安装在你手机上的酒店快捷管家之类的app,帮你搜寻到合适的房间——接下来该做什么就做什么可以了。