数据产品经理:实战进阶
上QQ阅读APP看书,第一时间看更新

1.1.2 数据产品组成

一个完整的数据产品通常由采集清洗、计算管理、分析展示和挖掘应用四个部分组成。

(1)采集清洗

采集指的是产品通过各种技术手段,将现实世界的信息线上化之后,再传输到企业的服务器和数据库中。根据采集源头的不同,可以分为日志信息采集和业务库表采集两种。前者主要是从各种联网设备中采集,有App日志、服务器日志和智能设备日志等;后者一般从企业的业务数据库中获取,如电商企业中用户的下单数据、支付数据等。为了准确采集这些内容,我们会构建一套埋点系统来进行规范和管理(具体参见第4章)。由于采集的信息一般会存在数据缺失或冗余、数据错报等情况,因此不能直接使用,需要一个预定义的清洗流程进行整理和优化。

(2)计算管理

从严格意义上说,这些经过初步采集和清洗得到的信号尚不能称为“数据”,因为此时人们并不能根据这些信号扩大自己对客观世界的认知。这就仿佛川流不息的车辆在你面前呼啸而过,但你却不知道这意味着什么。这些信号,只有根据不同的业务场景和需求汇总计算之后,才能称为“数据”。此时,你便可以知道,在刚才过去的10秒里你面前驶过了25辆车,和昨天同段时间对比略微偏高,因为今天是周五,大家下班早。

数据分为度量、指标和维度,它们随着业务的进展会逐渐膨胀,变得十分复杂。我们可以构建一套元数据管理系统来更好地管理这些数据(详见第8章)。

(3)分析展示

存放起来的这些数据,就像乐高积木一样,需要经过合适的分析思维和展示方案进行组装,才能变成漂亮的模型,发挥相应的数据价值。合适的分析模型可以大幅降低用户使用数据的门槛,更好地获取数据背后的洞察,如漏斗分析模型和留存分析等。同时,这些分析思维需要搭配一定的可视化工具才能更好地传达。

(4)挖掘应用

除了分析展示外,数据的价值还体现在与业务结合的挖掘和应用上。通用的业务场景有搜索、推荐、排序和风控四种,数据通过构建合适的策略和模型来提高这些场景的业务效率,如用户画像、反作弊模型、推荐展示策略等(第11章系统介绍了用户画像)。同时,也有基于某些特定业务场景的数据应用,如针对销售推广人员的数字化绩效系统和针对客户留存唤醒的精细化用户运营系统等。