日常工作中,分析师会接到一些专项分析的需求,能够根据原始数据清洗出相对干净的特征表很重要。
进行数据清洗的方式与工具有很多,根据场景需求的不同进行选择,今天给大家分享的是如何使用SQL进行数据清洗。
~
01、删除指定列、重命名列
02、重复值、缺失值处理
03、替换字符串空格、清洗*%@等垃圾字符、字符串拼接、分隔等字符串处理
04、合并处理
05、窗口函数的分组排序
06、数据去重:精准删除
07、数据验证
08、数据转换
09、关联表清洗
10、复杂查询优化
11、错误处理
12、数据标准化:统一标准,数据规范一致