mapreduce数据清洗
- 作者: 专业姨妈巾使用现场指导
- 来源: 51数据库
- 2020-10-04
数据清洗包含很多方面,比如数据格式校验以及转换、空缺值填充、异常值检验以及截断处理等等。语言有很多,常用的是SQL、SAS。把这两个用好了,包你无敌。
对于数据挖掘来说,80%的工作都花在数据准备上面,而数据准备,80%的时间又花在数据清洗上,而数据清洗的工作,80%又花在选择若干种适当高效的方法上。
对于数据挖掘来说,80%的工作都花在数据准备上面,而数据准备,80%的时间又花在数据清洗上,而数据清洗的工作,80%又花在选择若干种适当高效的方法上。
推荐阅读