题目标题

有哪些异常值检测的⽅法?

难度:初级

机器学习
参考解析

l 数字异常值(Numeric outlier),使⽤IQR,适⽤于1维空间,⼀般k取1.5
l Z-score,适⽤于1维或者低维,假定数据服从⾼斯分布,对数据做归⼀化,判断异常点⽅法⼀般设置为2.5/3/3.5
l DBSCAN,基于DBSCAN聚类⽅法,适⽤于1维多维,基于数据密度的离群值的检验⽅法,主要将数据点分为核⼼点,边界点(在核⼼点ℇ内但
l 不是核⼼点),除此之外的都是噪声点
l Isolation Forest,⼀维或多维特征空间中⼤数据集的⾮参数⽅法,基于孤⽴数进⾏判断数据点是否是异常点,孤⽴数越⼩越可能是异常点