首页 试题广场 > 试题详情
问答题

【2016大数据面试题】异常值是指什么?请列举1种识别连续型变量异常值的方法?

回复可见正确答案
下一题 上一题
Ke星伙伴们的回答/ 62个回答 添加答案
  • sdff555555 1楼

    1
    发表时间:2017-02-18 10:54:40 评论 6

  • 时间定格点 2楼

    1
    发表时间:2017-03-05 20:23:07 评论 3

  • 吾爱巴萨 3楼

    123

    发表时间:2017-02-24 12:07:40 评论 2

  • 笠清 4楼

    1

    发表时间:2017-02-25 12:24:03 评论 2

  • sf52181 5楼

     异常就是程序调用某些方法 类 可能出现的错误 而是程序无法正常运行 一般用throws 关键字来处理

    发表时间:2017-03-07 23:14:32 评论 2

  • 兰陵王来也 6楼

    A
    发表时间:2017-03-08 09:14:27 评论 2

  • u4u4 7楼

    1
    发表时间:2017-03-11 02:22:57 评论 2

  • 高兴8030 8楼

    .....
    发表时间:2017-02-20 12:50:09 评论 1

  • 星梦缘8647 9楼

    发发
    发表时间:2017-02-27 07:19:03 评论 1

  • 星梦缘8647 10楼

    刚刚刚刚
    发表时间:2017-02-27 07:19:22 评论 1

  • 超20189 11楼

    abbcd
    发表时间:2017-02-27 15:57:28 评论 1

  • 松果小污 12楼


    Grubbs' Test方法流程:
    1.假设样本来自于正态分布总体;
    2.提出假设:原假设:数据集中无异常值;
                备择假设:数据集中至少有一个异常值;  3.Grubbs’ Test双尾检测统计量为G = (■(max@i=1,2…N)|Yi-Y ̅ |)/s,Yba为样本均值,s为样本标准差 4.显著性水平为α的情况下,当G >( N-1)/N √((t_(α/2N)^2 (N-2))/(N-2+t_(α/2N)^2 (N-2))) 时,可拒绝原假设,接受备择假设。即有数据集中有异常值。 其中t_(α/2N)^2 (N-2)表示自由度为N-2,显著性水平为(α/2N)的t分布值的平方。
    	
    	同时,箱线图也可用来识别异常值。高出高四分位数1.5个IQR的值或者低出低四分位数1.5个IQR的值是异常值(奇异值)。

    发表时间:2017-03-03 09:37:18 评论 1

  • XUYIEN 13楼

    当程序接收到客户输入的值时,超出任何运算范围,则为异常值吧?!


    发表时间:2017-03-05 17:56:43 评论 1

  • gfgfhd 14楼

    1

    发表时间:2017-03-06 09:15:34 评论 1

  • guolinli4623 15楼

    求答案
    发表时间:2017-03-10 10:20:53 评论 1

贡献榜
相关试题
关闭
关闭
QQ
交流群
邀请
好友
App
下载
意见
反馈
返回
顶部