Cars.com利用大数据提升网站性能

汽车销售网站Cars.com通过对Web用户的点击量和机器生成的日志文件进行分析,提升了企业的营收,并且成功抵御了恶意机器人。

电子商务已经在营收和用户体验质量之间建立起了关联。对于Cars.com的大数据而言,对体验程度进行衡量已经成为其大数据分析的主要努力目标。通过对每月1200万次的网站访问量进行分析,该公司不仅针对消费者优化了用户体验,还获得了深度的运营洞察力和诈骗防范能力。

作为一家汽车消费者搜索、咨询和购买汽车的专业网站,Cars.com利用横幅广告对所有主要汽车制造商的轿车、SUV和中小型货车进行宣传的策略,不仅增加了网站的营收,还从汽车销售中赚取了广告费用。更快的用户界面可以让访问者花更多的时间浏览网站,并大幅提升了访问者购买汽车和点击横幅广告的机率。

Cars.com的应用管理团队有三个目标:保持高性能、保护内容、为广告商追踪流量来源。在网站后台,机器人和爬虫流量是一个持久的威胁,因为它们会导致网站性能下降。一些恶意机器人也会抓取车辆列表等内容,以供诈骗网站的垃圾邮件制作者诱骗消费者泄漏个人信息。

日志文件掌控着识别恶意行为和性能优化的关键,但是获取博客流量数据并对其进行人工分析却十分繁琐且非常耗时。由于没有实时报告,管理团队只能通过在服务器基础设施上预留空间,以确保一直保持较快的网页加载速度。

Cars.com最终选择了Splunk以实时从大量不同来源收集、索引、搜索和分析由机器生成的大数据集。其核心是由Splunk专利的Machine Data Web来组织和分析日志数据。Splunk还包括预制报告,以帮助管理团队识别非法的网页抓取和机器人流量,将它们与正常的访问流量区别和分离出来。报告还能够成为有价值的销售工具和强大的支持工具,以帮助内部人员采取适当的措施应对不必要的流量。

有形资产投资回报是通过两种方式实现的。首先,高效的实时数据收集每年可以节约400多个工时。其次,其可以帮助适应流量高峰期。例如,在2012年度美国橄榄球超级杯大赛中,详细的性能统计提供了可操作的洞察力,帮助节约了大约16万美元的服务器和管理成本。

Cars.com的技术运营经理Jon Abend说:“Splunk让我们能够在最短的时间内应对出现的大量问题。除了Web日志外,我们现在还能够轻松地分析应用日志、应用服务器、中间件组件、系统计量日志等。如果不具备均衡管理各类系统的能力,我们可能就无法为性能工程师、中间件团队、搜索引擎营销团队等各类用户提供服务。”

从2012年年初,Cars.com的大数据环境开始管理35TB以上的数据。Cars.com网站每小时会新增250万条博文,每周会增加1TB的数据,每月需要处理7.5亿多条咨询信息。通过这种大数据分析洞察力,Cars.com将能够一直保持网站较快的访问速度。(网界网 范范编译)