异常值也称离群值,具体地说,判断标准依据实际情况,根据业务知识及实际需要而定.
要是一般地说,可以用公式计算:
upperadjacentvalue=75thpercentile+(75thpercentile–25thpercentile)*1.5
loweradjacentvalue=25thpercentile–(75thpercentile–25thpercentile)*1.5
翻译过来:
上界=75%分位数+(75%分位数-25%分位数)*1.5
下界=25%分位数-(75%分位数-25%分位数)*1.5
比上界大的,和比下界小的都是异常值.