为什么大数据技术并不一定总能解决问题?

定性数据能够帮助我们更为深层地审视客户、行为及趋势。

在如今这个“酒香也怕巷子深”的时代,企业技术领域总是充斥着无数宣传及炒作。具体到当下,可能很多朋友都会把“大数据”技术看作是蕴藏着自身企业所需答案的宝库。然而 ,其并不总能践行如此美好的承诺——至少可能与传统所差别。

大数据

首先,让我们谈谈到底什么叫作大数据。事实上根据IDC的调查报告显示,那些通常被称为大数据的信息——包括由企业资源规划(简称ERP)、客户关系管理(简称CRM)以及其它商务系统(包括目前企业常用的分析工具)等量化并捕捉到的海量数据——事实上只占企业平均数据总量的10%左右。

而其余部分则可以称作“非结构化”或者说“质化”数据,而这部分数据在内容上相当混乱。这类信息可能来自客户调查、响应记录、在线论坛、社交媒体、文件、视频、新闻报道、指向服务中心的通话以及由销售团队收集到的趋势性论据等等。这类内容通常以文本而非数字的形式存在,这就意味着其很难被“量化”,或者说转化成数值形式。

这就产生了新的问题。虽然大部分分析工具都能够实现信息量化——换言之,也就是数字处理——但非结构化数据当中通常包含大量背景信息,这意味着企业需要找到适合的理解角度才能让这些信息产生价值。

“数据带来的问题往往要比结论更多,而我们总是需要就定性数据趋势背后的‘为什么’作出一番证明。”Forrester调查公司分析师Anjali Lai指出。“如果在架空背景之下进行数据分析,那我们往往无法把握事情的全貌。而定性数据则能够提供这一必要的背景视角。”

想象一下,大家所在的公司希望理解为什么在线销售额度一直无法达到预期。要解决这个问题,大家可以斥资购置昂贵的营销分析工具,从而获得用户在各页面上的平均浏览时间或者用户取消购物车内容的比例等基于行为的重要数据。不过即使拥有大量此类数据,我们仍然未必能够在“为什么”这道方程题中得出正确的答案。

“大家可能很清楚,自己的网站每天拥有一万名访问者——这就是定性数据,”YouEye公司首席产品官Collin Sebastian指出,这是一家专门针对定性数据设计软件与服务产品的企业。“定性数据能够告诉我们,其中有四千名访客对于特定产品类型很感兴趣,他们希望了解什么、哪些内容属于意外情况,他们又会选择哪些产品作为替代选项等。”

定性数据的重要意义绝不仅限于确定数据点之间的关联性,例如告诉我们哪些访客在网站上停留的时间更长、购物的意愿更强烈。除此之外,定性数据还可以识别出因果关系,从而回答那些难以捉摸的“为什么”问题。访客为什么会在我们的网站上耗费更长时间——这到底是因为网站内容足够精彩,还是单纯因为我们设计的购物过程太过繁琐?

“当前,每位CMO需要管理的信息仪表板平均达14套之多,”Sebastian表示。“这就是最为典型的分析瘫痪案例:我拥有1000万个数据点,从17种不同的角度对我的问题作出审视——但我还是不具备能够真正理解其涵义的必要背景信息。”

从历史角度讲,对定性数据的分析往往需要以手动方式进行——也就是属于人力密集型工作。“我们根本不可能单纯在收集到数据之后向文件数据库提交查询,并指望着其返回一项可视化结果,”Booz Allen Hamilton公司首席数据科学家Kirk Borne解释道。

定性数据分析的结果一般会被限制在特定范围当中,但这种状况目前已经开始扭转。除了市面上开始出现更多专门针对定性工具设计的工具及软件包之外,我们还拥有了“越来越多理想的定性数据向量化数据转换的途径,并能够借此让定性分析在定性数据当中充分发挥潜能,”Borne指出。

YouEye是一款利用视频与音频记录用户同客户网站内容、广告或其它素材交互流程的在线工具。一般来讲,每次调查所选取的用户数量会在50位到300位之间,具体取决于客户要求。视频利用人工编码、自然语言处理及机器学习等机制进行转录与编码。在处理接近尾声时,客户能够得到一份包含强调部分的调查结果。