下面选项中有关异常值检测说法错误的是()
使用3σ方法需要保证历史异常值较少
可以使用pandas库的describe()方法来简单统计
使用3σ方法必须保证数据为正态分布
DBSCAN聚类算法可以用来异常值检测
该原理一般在工程科学中比较常用。3sigma原理可以简单描述为:若数据服从正态分布,则异常值被定义为一组结果值中与平均值的偏差超过三倍标准差的值。即在正态分布的假设下,距离平均值三倍 \sigma(标准差)之外的值出现的概率很小,因此可认为是异常值。
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题