农企新闻网

数据解析异常是怎么回事

发布者:王俊
导读异常值也称离群值,具体地说,判断标准依据实际情况,根据业务知识及实际需要而定.要是一般地说,可以用公式计算:upperadjacentvalue=75thpercentile+(75thpercentile–25thpercentile)

异常值也称离群值,具体地说,判断标准依据实际情况,根据业务知识及实际需要而定.

要是一般地说,可以用公式计算:

upperadjacentvalue=75thpercentile+(75thpercentile–25thpercentile)*1.5

loweradjacentvalue=25thpercentile–(75thpercentile–25thpercentile)*1.5

翻译过来:

上界=75%分位数+(75%分位数-25%分位数)*1.5

下界=25%分位数-(75%分位数-25%分位数)*1.5

比上界大的,和比下界小的都是异常值.