首页 » 互联通信 » 推荐产品经理必知必会①:数据处理,数据营销。

推荐产品经理必知必会①:数据处理,数据营销。

龙城装饰工程通讯 2024-11-15 0

扫一扫用手机浏览

文章目录 [+]

在正式先容推举策略之前,我们须要理解推举策略产品经理如何对数据进行处理,统统策略都离不开数据。
重点在于:

理清公司已有数据;理解公司有哪些数据表;判断数据表内的数据质量如何。

推荐产品经理必知必会①:数据处理 推荐产品经理必知必会①:数据处理 互联通信

一、常见的底层数据表

电商领域常见的7张离线Hive表:

推荐产品经理必知必会①:数据处理 推荐产品经理必知必会①:数据处理 互联通信
(图片来自网络侵删)

切片表:按照韶光分区,将每天的新数据放在一个独立的韶光分区里,例如:7月1日与7月2日的不同。

增量表:汇总所有数据,新增数据直接在原始表内添加,不增加新分区,订单表与卖点数据均是增量表,由于其须要选择某个时段or历史所有数据,直接截取即可,如果存在不同分区,截取就会很麻烦。

二、数据表加工

ETL(extract-transform-load,抽取——转换——加载):从底层数据表抽取数据,然后再洗濯加工,终极得到上层表,这一过程不断进行。

三、数据归一化与标准化

不同类型的数据须要转化为同一量纲才能进行比较,须要归一化/标准化,实质上是一种线性变换(缩放+平移)。
(归一化≠标准化)

1. 归一化

Min-Max(最小最大值)归一化(最常用的办法):

x = ( x − min ) / ( max − min )

归一化后的数值处于[0,1]之间,实际数据中存在无阐明度的极大(小)值,故须要挑选得当的最大(小)值。

适用场景:数据分布集中。

均值归一化:

x = ( x − mean ) / ( max − min )

归一化后的数值处于[-1,1]之间

适用场景:数据存在极值,但在业务视角这一极值是合理的。

Log对数函数归一化:

归一化后的数值处于[0,1]之间,非线性的归一化办法,缩小数据间的差距,使之分布均衡。

适用场景:样本数据跨度大,头部极值涌现频率相对高。

2. 标准化

归一化/标准化可以肃清不同数据之间量纲差异巨大带来的无可比拟性:

若非常值和噪声较多,利用标准化数据处理办法可以肃清不同特色差异权重的影响,使之权重趋同(归一化保留了潜在权重关系)。
KNN和K-Means等涉及间隔的业务中,若各特色变量对终极间隔影响同等,须要用标准化处理,别的运用根据业务需求进行。

以上先容的数据处理方法在策略产品事情中会常常用到,一定要熟习哦!

本文由 @策略产品经理方案 原创发布于大家都是产品经理。
未经作者容许,禁止转载

题图来自Unsplash,基于CC0协议

该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。

标签:

相关文章

人工智能代码,代码ai。

人工智能的学科代码080717T人工智能 专业代码:080717T 学位授予门类:工学学士学习课程有高等数学、线性代数、概率和数理...

互联通信 2024-11-15 阅读1 评论0