极端值
· 2010-03-12 08:45 · 32746 次点击
extremevalue
一般而言,極端值又可分為單變量的極端值(univariateoutlier)與多變量的極端值(multivariateoutlier)兩種。單變量的極端值,指的是某一個觀察值與其他觀察值的數值呈現很大的差異。至於多變量的極端值,指的是在超過一個變數的情況下,某一筆觀察值的組合與其他觀察值的組合呈現很大的差異。例如人的身高是一個變數,人的年齡是另外一個變數,假設已知某一人身高167公分,這高度本身可能並不算是特別高,但如果得知該身高是測量自一位6歲的孩童,則綜合這兩個資訊,卻幾乎可以肯定該高度在同年齡者當中應該是一個與眾不同的觀察值組合;換句話說,它是一個(多變量的)極端值。