Rumus pencilan menyediakan alat grafis untuk menghitung data yang terletak di luar himpunan distribusi tertentu yang mungkin berada di sisi dalam atau luar tergantung pada variabel.
Apa itu Formula Pencilan?
Pencilan adalah titik data dari sampel tertentu atau pengamatan tertentu atau dalam distribusi yang berada di luar pola keseluruhan. Aturan yang umum digunakan yang mengatakan bahwa titik data akan dianggap sebagai pencilan jika memiliki lebih dari 1,5 IQR di bawah kuartil pertama atau di atas kuartil ketiga.
Dengan kata lain, pencilan rendah akan berada di bawah Q1-1.5 IQR dan pencilan tinggi harus berada di Q3 + 1.5IQR
Seseorang perlu menghitung median, kuartil, termasuk IQR, Q1, dan Q3.
Rumus pencilan direpresentasikan sebagai berikut,
Formula untuk Q1 = ¼ (n + 1) th jangka Formula untuk Q3 = ¾ (n + 1) th jangka Formula untuk Q2 = Q3 - Q1

Perhitungan Langkah demi Langkah dari Pencilan
Langkah-langkah di bawah ini perlu diikuti untuk menghitung Outlier.
- Langkah 1: Pertama hitung kuartilnya yaitu, Q1, Q2 dan interkuartil
- Langkah 2: Sekarang hitung nilai Q2 * 1.5
- Langkah 3: Sekarang Kurangi nilai Q1 dari nilai yang dihitung di Langkah2
- Langkah 4: Di sini Tambahkan Q3 dengan nilai yang dihitung pada langkah2
- Langkah 5: Buat rentang nilai yang dihitung di Step3 dan Step4
- Langkah 6: Atur data dalam urutan menaik
- Langkah 7: Periksa apakah ada nilai yang berada di bawah atau lebih tinggi dari rentang yang dibuat di Step5.
Contoh
Pertimbangkan kumpulan data dari angka-angka berikut: 10, 2, 4, 7, 8, 5, 11, 3, 12. Anda diminta untuk menghitung semua Pencilan.
Larutan:
Pertama, kita perlu mengatur data dalam urutan menaik untuk menemukan median, yang akan menjadi Q2 bagi kita.
2, 3, 4, 5, 7, 8, 10, 11, 12

Sekarang karena jumlah pengamatan ganjil, yaitu 9, median akan berada pada posisi ke- 5 , yaitu 7, dan yang sama akan menjadi Q2 untuk contoh ini.
Oleh karena itu, perhitungan Q1 adalah sebagai berikut -
Q1 = ¼ (9 + 1)
= ¼ (10)
Q1 akan -

Q1 = 2.5 istilah
Ini berarti bahwa Q1 adalah rata-rata dari 2 nd dan 3 rd posisi pengamatan, yang merupakan 3 & 4 di sini, dan rata-rata dari yaitu sama (3 + 4) / 2 = 3,5
Oleh karena itu, perhitungan Q3 adalah sebagai berikut -

Q3 = ¾ (9 + 1)
= ¾ (10)
Q3 akan -

Q3 = 7,5 istilah
Ini berarti bahwa Q3 adalah rata-rata 7 th dan 8 th posisi pengamatan, yaitu 10 & 11 di sini, dan rata-rata dari yaitu sama (10 + 11) / 2 = 10,5
Sekarang, pencilan rendah berada di bawah Q1-1.5IQR, dan pencilan tinggi akan berada di Q3 + 1.5IQR
Jadi, nilainya adalah 3,5 - (1,5 * 7) = -7 dan kisaran yang lebih tinggi adalah 10,5 + (1,5 * 7) = 110,25.
Karena tidak ada observasi yang berada di atas atau di bawah 110.25 dan -7, kami tidak memiliki pencilan dalam sampel ini.
Contoh Formula Outlier di Excel (dengan Template Excel)
Kelas pembinaan kreatif sedang mempertimbangkan untuk memberi penghargaan kepada siswa yang berada di 25% teratas. Namun, mereka ingin menghindari pencilan. Data untuk 25 siswa. Gunakan persamaan Pencilan untuk menentukan apakah ada pencilan?
Larutan:
Di bawah ini diberikan data untuk menghitung pencilan.

Jumlah pengamatan di sini adalah 25, dan langkah pertama kita adalah mengonversi data mentah di atas dalam urutan menaik.
Median akan -

Nilai median = ½ (n + 1)
= ½ = ½ (26)
= Istilah ke- 13
Q2 atau median adalah 68.00
Yang merupakan 50% dari populasi.
Q1 akan -

Q1 = ¼ (n + 1) suku ke-th
= ¼ (25 + 1)
= ¼ (26)
= 6,5 th jangka, yang setara dengan 7 th jangka
Q1 adalah 56,00, yang merupakan 25% terbawah
Q3 akan -

Akhirnya, Q3 = ¾ (n + 1) suku ke-th
= ¾ (26)
= 19,50 istilah
Berikut kebutuhan rata-rata yang akan diambil, yang dari 19 th dan 20 th istilah yang 77 dan 77 dan rata-rata yang sama (77 + 77) / 2 = 77.00
Q3 adalah 77, yang merupakan 25% teratas
Jarak pendek
Sekarang, pencilan rendah berada di bawah Q1-1.5IQR, dan pencilan tinggi akan berada di Q3 + 1.5IQR

Jangkauan Tinggi -

Jadi, nilainya adalah 56 - (1,5 * 68) = -46 dan kisaran yang lebih tinggi adalah 77 + (1,5 * 68) = 179.
Tidak ada pencilan.
Relevansi dan Penggunaan
Rumus pencilan sangat penting untuk diketahui karena mungkin saja ada data yang akan miring oleh nilai tersebut. Ambil contoh pengamatan 2, 4, 6, 101, dan sekarang jika seseorang mengambil rata-rata dari nilai-nilai ini, itu akan menjadi 28,25, tetapi 75% dari pengamatan berada di bawah 7, dan karenanya akan menjadi keputusan yang salah mengenai pengamatan sampel ini.
Dapat diperhatikan di sini bahwa 101 tampak jelas sebagai garis besar, dan jika ini dihilangkan, maka rata-rata akan menjadi 4, yang menyatakan tentang nilai atau pengamatan bahwa mereka berada dalam kisaran 4. Oleh karena itu, sangat penting untuk melakukan ini perhitungan untuk menghindari penyalahgunaan informasi terkemuka dari data. Ini banyak digunakan oleh ahli statistik di seluruh dunia setiap kali mereka melakukan penelitian.