基于云采集引擎做数据众包交易,“发源地”获得数千万人民币Pre-A轮

融资大数据交易平台“发源地”获得数千万人民币Pre-A轮,资方为众合创投、鼎鑫资本、众善创投。

基于自主研发的SaaS 2.0云采集引擎,“发源地”通过众包UGC模式采集/接入数据源,清洗、融合、脱敏后进行交易,满足企业对于数据分析、数据运营以及精准营销等方面的需求。

在发源地平台上,供应商/开发者可以帮助需求方快速完成数据定制。区别于一边连接买方、一边连接卖方的传统B2B平台,发源地可以将数据、规则、算法沉淀下来并能够复用,提升行业数据的利用率。

如果说一个发布买卖双方供求信息的平台只能产生交易流水,平台价值有限,基于SaaS工具“云采集引擎”来做数据交易,就存在着更多的可能性。发源地创始人马建军介绍,“云采集引擎”相当于机器人的角色,输入指令(算法、规则、模型),能够进行数据的采集、清洗、结构化处理。未经清洗、过滤处理的大数据掺杂着各种垃圾信息,为了提升数据的可用性,在输出的时候需要经过一定程度的关联与整合。发源地的数据源既不是原始数据、也不需要深加工,而是经过初加工的“标准化产品”。目前,平台共沉淀下来上万个数据源,既有公开数据源,也有通过合作获取的非公开数据源。

如果说数据是一座金矿,金子固然重要,挖矿的方法也同样重要。云采集引擎沉淀下来的不仅仅是数据源,还有获取数据的方法和规则。这些算法和规则基于平台工具使用,这样一来,就产生了沉淀和黏性,既有数据沉淀、也有算法规则的沉淀。根据发源地提供的数据,平台已经积累了包括供应商、开发者、需求方在内的20万用户。

盈利方面,发源地不收佣金、平台工具也是免费的。马建军表示,增值服务会成为未来的盈利点。如基于平台的导出更新、离线调用、数据推荐,以及基于SaaS引擎的数据清洗、加工、脱敏方案等等。

马建军告诉记者,当数据源增长到百万级别,发源地有可能成为“结构化的百度”,这也是发源地的最终目标形态。当数据量足够大,需求方可以低成本、高效率的找到数据;对于供应商和开发者来说,数据有了变现的途径。这些数据源和算法在平台上沉淀下来,就有了复用的价值,提高数据的利用率。

数据服务产业链上,记者还报道了新三板公司数据堂、获3.6亿元C轮融资的聚合数据。数据堂在2015年推出了网上数据商城Data Mall,对接数据的供需方;聚合数据更像是一个数据超市,整合第三方数据,将标准化的API接口开放给开发者,开发者可在此基础上任意二次开发。相较而言,发源地期望以数据源而不是以API方式切入。马建军表示,“未来两到三年内,数据源交付方式必将取代高成本的API模式”。

数据被认为是一种“防御性”的资源,价值高、无法完全复制、缺少替代品,但它还没有被很好的开发和利用。“数据的安全和隐私”是大众和舆论最在意的部分,也成为了数据行业可能存在的风险。此外,企业作为数据的生产者并不是稳定的供给者,有些公司并不愿意为了短期利益进行数据变现。对此马建军表示,发源地所有数据源都需要通过合作和技术脱敏,以解决版权和隐私安全问题。而数据源层作为整个大数据产业链的地基,已有越来越多的企业意识到数据金矿的价值,需要平台来解决信息不对称的问题。 

团队背景上,创始人兼CEO马建军曾成功创办多家企业,过去8年专注大数据领域研究,曾负责腾讯首个游戏大数据预测引擎研发。核心团队来自腾讯、百度、阿里等公司的高管和技术专家,拥有多年数据行业经验及多项大数据技术专利。