1分钟了解数据分析挖掘体系(附细致思维导图)

总体上来讲,数据分析挖掘体系可分为数据预处理、分析挖掘、数据探索、数据展现和分析工具。

数据预处理

数据预处理包含数据清洗、数据集成、数据变换和数据规约几种方法。

而数据清洗包括缺失值处理和异常值处理;

数据集成包括同名同义、异名同义、单位不统一的实体识别和冗余性识别。

数据变化包括函数变换、规范化、连续属性离散化、属性沟通和小波变换。

数据规约包括属性规约和数值规约。