物联网时代来临,如何正确发挥数据分析的价值?

  大数据也好,小数据也罢,已经有很多的专家讨论过运用数据到底可以带来什么价值。只是在这么多的数据分析的论述之后,笔者观察到市场上大多数人对于数据收集与分析仍旧是一头雾水。很多读者在给笔者的回馈意见中,笔者最担心的是在物联网应用方案设计之初的系统架构中 (system architecture),数据分析的角色没有被优先对待,以致于相关方案的设计只是一大堆硬体的集合 ,自动化或者有之,说好的智慧化则往往消失无踪。

  首先,笔者要澄清一点,数据的来源很多,联网装置只是收集数据的一种手段,并非只有物联网应用方案才能搜集资料。举例来说,传统的收银机也在累积数据,只是没有电子存储装置,一切都是保留在纸带上,取用非常不方便,基本上很难用来做精细的营业分析。直到收银这个功能与工业电脑结合,数据开始有了进一步被分析的方便性。

  然而,为了加快结帐速度,现行电子式收银机能收集的栏位仍有限制,所以如果读者在结帐时特别注意,几乎每一台电子式收银机都外挂了不少其他装置,一开始是几种信用卡刷卡机,插卡式或感应式的不一而足,最近随着第三方支付的普及,额外的条码扫描装置也开始出现。然而这些装置收集的资料都集中在业务成交结帐时,零售业者仍旧无从得知每个时点有多少人经过门口,多少人走进卖场,更不用说个别顾客绕行路径,甚或是在每个柜位或货架前的停留或注视时间。近来随着资通讯科技与相关视觉辨识软体的进步,这些资料搜集都由不可能逐渐变为可能。

  此外,数据分析科技的进步随着运算与储存装置性能提升与价格下滑,数据科学家得以将目光由结构化资料 (structured data) 投向非结构化资料 (unstructured data)。简单来说,语音与文字资料的记录得以被分析。首先,传统客服电话的对谈内容已经可以直接语音转文字,再将透过自然语言处理 (natural language processing, NLP) 文字探勘进行客诉分析,让客服人员与顾客抱怨的对话内容与处理过程都变成顾客档案 (customer profile) 的一部分。

  甚至,为了节省客服人力,运用相关数据科技开发出来的聊天机器人 (chatbot) 也应运而生。顾客在网站上或在卖场内的输入装置都可以直接询问聊天机器人(通常是文字对话)与卖场或商品相关的资讯。如此一来,不但资料搜集的流程直接进入电脑,聊天机器人甚至可以根据对话过程主动建议顾客适合的商品。

  相比之下,传统客服人员虽然可以做到更细致的服务或应付更随机的问题,但人脑记忆容量有限,我们不可能苛责客服人员记得卖场内成千上万种商品的品名特色或所在位置,更无法期待客服人员随时调阅提问顾客的顾客档案,即时掌握顾客的品味,在对话结束前的黄金时间内做最有效的商品推荐。

  非结构化资料的来源还可以是网路上的社群讨论或任何内容媒体流传的一篇报导及底下的留言评论。 君不见网路留言的病毒式扩散效果,早已是每一个行销人员必修课程。不理解粉丝团或网路搜寻优化 (searching engine optimization) 威力的行销人员,想来在公司内发言权也将逐渐式微。针对网路时代新的行销宣传趋势,网路舆情分析 (social listening/social media monitoring, SL) 早已经广为企业行销人员采用。

  甚至,居于市场领导地位(或有心急起直追)的厂商,还逐渐了解到市场商情调查 (market intelligence, MI) 不再是剪刀糨煳加一大堆的研究人员解读,运用 NLP 开发的 MI 系统让市场商情走向的掌握不再是大公司才能拥有的独门利器。

  相对于滥竽充数的类似产品,优秀的数据科学家开发的 SL 与 MI,可以让企业迅速掌握产业趋势、发掘潜力产品或技术,也可以监控网路上意见领袖或重量级媒体报导对于企业自己或竞争同业产品的影响,更快速的采取因应之道。此外,结合 SL 与 MI 的精神,精擅 NLP 的资料科学家还可以开发出竞争同业的监控方案。

  行文至此,读者可能已经体会到"资料爆炸"这个名词的严重性。看中这个市场潜力的业者,从传统系统整合商、标榜数据分析的软体开发商、提供高速资料处理的硬体系统,到物联网应用方案提供者,大家无不强调自家开发的产品或方案能够为企业快速处理分析急速增加的资料。在被这些玲琅满目的众多选择中,企业应该先问自己,资料搜集的目的为何 ; 更精确地说, 企业希望解决的问题是什么,哪一种或几种资料可以有效地回答这个待解决问题。