memriksa data Outlier menggunakan Standarisasi

Outlier merupakan suatu nilai dari pada sekumpulan data yang lain atau berbeda dibandingkan biasanya serta tidak menggambarkan karakteristik data tersebut. Dalam statistik, outlier merupakan titik pengamatan yang jauh dari pengamatan lain. Sebuah outlier mungkin karena variabilitas dalam pengukuran atau mungkin menunjukkan kesalahan eksperimental. yang terakhir kadang-kadang dikeluarkan dari kumpulan data. Outlier dapat terjadi secara kebetulan dalam distribusi apapun, tetapi mereka sering menunjukkan salah satu dari kesalahan pengukuran atau bahwa populasi memiliki distribusi berat ekor.

Standarisasi Data deteksi data dengan standarisasi pada prinsipnya mengubah niali data menjadi bentuk Z, dengan :
untuk lebih jelasnya langsung saja pada Studi kasus :kasus berikut akan menjelaskan pengujian apakah sebuah data atau variabel mengandung data Otlier, serta bagaimana cara penanganan data Otlier tersebut. datanya seperti berikut :


langkah-langkah analisis :
  1. Buka program SPSS. 
  2. Plih variabel view pada pojok kiri bawah lembar kerja SPSS, kemudian tuliskan nama variabel. Padakasus ini nama variabelnya adalah usia, berat dan income. 
  3. Setelah itu pilih data view kemudian masukan data. 
  4. Dari menu analyze SPSS, pilih descriptive Statistics, lalu pilih descriptive. Tampil dilayar tampilan descriptive.
  5. Kemudian masukan semua variabel ke dalam kotak Variable(s), setelah itu cetang Save standaridized value at variable, kemudian klik OK. 
  6. Output SPSS.

   Interpertasi :

pada output diatas, perhatikan kolom mean (nilai rata-rata) dan standardeviasi untuk setiap variabel.rata-rata usia sebesar 33.06, rata-rata berat sebesar 58.86, dan rata-rata income sebesar 6.6933. standar deviasi untuk usia sebesar 5.27, standar deviasi berat sebesar 7.59, dan standar deviasi income sebesar 123.72.

hasil nilai standarisasi


Sebuah data dikatakan outlier, apabila nilai Z yang didapat lebih besar dari angka +2,5 atau lebih kecil dari angka -2,5 (-2,5 ≤ Z ≤ +2,5). jika mengacu pada batasan 2.5 maka :
  • Pada variabel usia, tidak ada data yang mempunyai nilai Z melebihi +2.5 atau kurang dari -2.5, maka tidak terdapat data otlier.
  • Pada variabel berat, tidak ada data yang mempunyai nilai Z melebihi +2.5 atau kurang dari -2.5, maka tidak terdapat data otlier.
  • Pada variabel income, pada kasus 8, terlihat angka z adalah 2.68. Hal ini berarti income koko adalah data otlier karena diatas +2,5. Yang jika dilihat pada income sebesar 1000 maka nilai income tersebut  dianggap berbeda dari income rata-rata konsumen yang hanya Rp 669.330. tanda + berarti income diatas rata-rata, dan tanda - berarti income dibawah rata-rata. 


Sumber : bahan kuliah

Related Posts: