Distribusi Normal dalam Statistik - Definisi, Contoh, Interpretasi

Apa Distribusi Normal dalam Statistik?

Distribusi Normal adalah kurva distribusi frekuensi berbentuk lonceng yang membantu menggambarkan semua kemungkinan nilai yang dapat diambil variabel acak dalam rentang tertentu dengan sebagian besar area distribusi berada di tengah dan sedikit di ekor, di ekstrem. Distribusi ini memiliki dua parameter utama: mean (µ) dan deviasi standar (σ) yang memainkan peran kunci dalam penghitungan pengembalian aset dan strategi manajemen risiko.

Bagaimana Menafsirkan Distribusi Normal

Gambar di atas menunjukkan bahwa distribusi normal statistik adalah kurva berbentuk lonceng. Kisaran kemungkinan hasil dari distribusi ini adalah bilangan real utuh yang berada di antara -∞ hingga + ∞. Ekor kurva lonceng memanjang di kedua sisi grafik (+/-) tanpa batas.

  • Sekitar 68% dari semua observasi termasuk dalam +/- satu standar deviasi (σ)
  • Kira-kira 95% dari semua pengamatan termasuk dalam +/- dua standar deviasi (σ)
  • Sekitar 99% dari semua pengamatan termasuk dalam +/- tiga standar deviasi (σ)

Ini memiliki kemiringan nol (simetri distribusi). Jika distribusi data asimetris, maka distribusinya tidak merata jika kumpulan data memiliki kemiringan lebih besar dari nol atau kemiringan positif. Kemudian, ekor kanan dari distribusi lebih panjang dari pada kiri, dan untuk kemiringan negatif (kurang dari nol) ekor kiri akan lebih panjang daripada ekor kanan.

Ini memiliki kurtosis 3 (mengukur puncak suatu distribusi), yang menunjukkan distribusi tidak terlalu memuncak atau ekor terlalu tipis. Jika kurtosis lebih dari tiga maka distribusi lebih memuncak dengan ekor lebih gemuk, dan jika kurtosis kurang dari tiga, maka memiliki ekor tipis, dan titik puncak lebih rendah dari distribusi normal.

Karakteristik

  • Mereka mewakili keluarga distribusi di mana mean & deviasi menentukan bentuk distribusi.
  • Mean, median, dan mode distribusi ini semuanya sama.
  • Separuh nilai berada di kiri tengah dan separuh lainnya di kanan.
  • Nilai total di bawah kurva standar akan selalu satu.
  • Kemungkinan besar, distribusi berada di tengah, dan nilai yang lebih sedikit terletak di ujung ekor.

Transformasi (Z)

Fungsi kepadatan probabilitas (PDF) dari variabel acak (X) berikut distribusi diberikan oleh:

dimana -∞ <x <∞; -∞ <µ 0

Dimana,

  • F (x) = Fungsi probabilitas normal
  • x = Variabel acak
  • µ = Rata-rata distribusi
  • σ = Simpangan baku distribusi
  • π = 3,14159
  • e = 2,71828

Formula Transformasi

Dimana,

  • X = Variabel acak

Contoh Distribusi Normal dalam Statistik

Mari kita bahas contoh berikut.

Contoh 1

Misalkan sebuah perusahaan memiliki 10.000 karyawan dan struktur gaji ganda sesuai peran pekerjaan tempat karyawan bekerja. Gaji umumnya didistribusikan dengan rata-rata populasi µ = $ 60,000, dan deviasi standar populasi σ = $ 15000. Berapa probabilitas bahwa karyawan yang dipilih secara acak memiliki gaji kurang dari $ 45000 per tahun.

Larutan

Seperti yang ditunjukkan pada gambar di atas, untuk menjawab pertanyaan ini, kita perlu mencari luas area di bawah kurva normal dari 45 ke ekor sisi kiri. Juga, kita perlu menggunakan nilai Z-tabel untuk mendapatkan jawaban yang benar.

Pertama, kita perlu mengubah mean dan deviasi standar yang diberikan menjadi distribusi normal standar dengan mean (µ) = 0 dan deviasi standar (σ) = 1 menggunakan rumus transformasi.

Setelah konversi, kita perlu mencari tabel Z untuk mengetahui nilai yang sesuai, yang akan memberi kita jawaban yang benar.

Diberikan,

  • Rata-rata (µ) = $ 60.000
  • Simpangan baku (σ) = $ 15000
  • Variabel Acak (x) = $ 45000

Transformasi (z) = (45000 - 60000/15000)

Transformasi (z) = -1

Sekarang nilai yang ekuivalen dengan -1 pada tabel-Z adalah 0,1587, yang merepresentasikan area di bawah kurva dari 45 ke kiri. Ini menunjukkan bahwa ketika kami memilih seorang karyawan secara acak, probabilitas menghasilkan kurang dari $ 45000 setahun adalah 15,87%.

Contoh # 2

Sekarang dengan menggunakan skenario yang sama seperti di atas, cari tahu probabilitas bahwa karyawan yang dipilih secara acak menghasilkan lebih dari $ 80.000 setahun menggunakan distribusi normal.

Larutan

Jadi dalam pertanyaan ini, kita perlu mencari area yang diarsir dari 80 ke ekor kanan menggunakan rumus yang sama.

Diberikan,

  • Rata-rata (µ) = $ 60.000
  • Simpangan baku (σ) = $ 15000
  • Variabel Acak (X) = $ 80.000

Transformasi (z) = (80000 - 60000/15000)

Transformasi (z) = 1,33

Sesuai dengan tabel-Z, nilai ekuivalen 1,33 adalah 0,9082 atau 90,82%, yang menunjukkan bahwa kemungkinan memilih secara acak karyawan yang berpenghasilan kurang dari $ 80,000 per tahun adalah 90,82%.

Tetapi sesuai pertanyaan, kita perlu menentukan probabilitas karyawan acak menghasilkan lebih dari $ 80.000 setahun, jadi kita perlu mengurangi nilai dari 100.

  • Variabel Acak (X) = 100% - 90,82%
  • Variabel Acak (X) = 9,18%

Jadi kemungkinan bahwa karyawan mendapatkan lebih dari $ 80.000 per tahun adalah 9,18%.

Kegunaan

  • Grafik teknikal pasar saham seringkali berupa kurva lonceng, yang memungkinkan analis dan investor membuat kesimpulan statistik tentang ekspektasi pengembalian dan risiko saham.
  • Ini digunakan di dunia nyata, seperti untuk menentukan waktu terbaik yang paling mungkin diambil oleh perusahaan pizza untuk mengirim pizza dan banyak aplikasi nyata lainnya.
  • Digunakan untuk membandingkan ketinggian dari kumpulan populasi tertentu di mana kebanyakan orang akan memiliki ukuran rata-rata dengan sangat sedikit orang yang memiliki tinggi badan di atas rata-rata atau di bawah rata-rata.
  • Mereka digunakan dalam menentukan prestasi akademik rata-rata siswa, yang membantu untuk membandingkan peringkat siswa.

Kesimpulan

Distribusi normal menemukan aplikasi dalam ilmu data dan analitik data. Teknologi canggih seperti Artificial Intelligence dan pembelajaran mesin yang digunakan bersama dengan distribusi ini dapat memberikan kualitas data yang lebih baik, yang akan membantu individu dan perusahaan dalam pengambilan keputusan yang efektif.

Artikel yang menarik...