题目标题

有哪些处理异常值的⽅法?

难度:初级

机器学习
参考解析

l 缺失值太多直接删除
l 缺失值不多,可以考虑填充,例如均值填充(正态分布),众数或中位数填充(⻓尾分布)
l 将缺失值视为⼀个类别
l 对于某些模型可以不处理,例如树模型(sklearn中只有xgboost⾃⼰有处理的⽅式⽽已其他没有)