Apa R Squared (R2) dalam Regresi?
R-squared (R 2 ) adalah ukuran statistik penting yang merupakan model regresi yang mewakili proporsi perbedaan atau varians dalam hal statistik untuk variabel dependen yang dapat dijelaskan oleh variabel independen atau variabel. Singkatnya, ini menentukan seberapa baik data akan sesuai dengan model regresi.
Formula R Kuadrat
Untuk menghitung R kuadrat, Anda perlu menentukan koefisien Korelasi, lalu Anda perlu mengkuadratkan hasilnya.
R Rumus Kuadrat = r 2
Dimana r koefisien korelasi dapat dihitung seperti di bawah ini:
r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))
Dimana,
- r = Koefisien Korelasi
- n = angka dalam dataset yang diberikan
- x = variabel pertama dalam konteks
- y = variabel kedua
Penjelasan
Jika terdapat hubungan atau korelasi yang mungkin bersifat linier atau non-linier antara kedua variabel tersebut, maka hal tersebut menunjukkan jika terdapat perubahan nilai variabel independen, maka variabel dependen lainnya kemungkinan akan berubah nilainya, katakanlah secara linier atau non-linier.
Bagian pembilang dari rumus melakukan tes apakah mereka bergerak bersama dan menghilangkan gerakan individu dan kekuatan relatif keduanya yang bergerak bersama, dan bagian penyebut dari rumus mengukur pembilang dengan mengambil akar kuadrat dari hasil kali selisih variabel dari variabel kuadrat mereka. Dan ketika Anda mengkuadratkan hasil ini, kita mendapatkan R kuadrat, yang tidak lain adalah koefisien determinasi.
Contoh
Contoh 1
Pertimbangkan dua variabel berikut x dan y, Anda diminta untuk menghitung R Kuadrat dalam Regresi.

Larutan:
Dengan menggunakan rumus yang disebutkan di atas, pertama-tama kita perlu menghitung koefisien korelasi.

Kami memiliki semua nilai dalam tabel di atas dengan n = 4.
Sekarang mari kita masukkan nilai dalam rumus untuk sampai pada gambar.

r = (4 * 26.046.25) - (265.18 * 326.89) / √ ((4 * 21.274.94) - (326.89) 2 ) * ((4 * 31.901.89) - (326.89) 2 )
r = 17.501,06 / 17.512,88
Koefisien Korelasi akan menjadi-

r = 0,99932480
Jadi, perhitungannya adalah sebagai berikut,

r 2 = (0,99932480) 2
Formula Kuadrat R dalam Regresi

r 2 = 0,998650052
Contoh # 2
India, sebagai negara berkembang, ingin melakukan analisis independen apakah perubahan harga minyak mentah mempengaruhi nilai rupee-nya. Berikut ini adalah sejarah harga minyak mentah Brent dan valuasi Rupee terhadap dolar yang berlaku rata-rata untuk tahun-tahun tersebut di bawah ini.

RBI, bank sentral India, telah mendekati Anda untuk memberikan presentasi tentang hal yang sama pada pertemuan berikutnya. Tentukan apakah pergerakan minyak mentah mempengaruhi pergerakan Rupee per dolar?
Larutan:
Dengan menggunakan rumus korelasi di atas, kita dapat menghitung koefisien korelasi terlebih dahulu. Memperlakukan harga minyak mentah rata-rata sebagai satu variabel, misalnya x, dan memperlakukan Rupee per dolar sebagai variabel lain sebagai y.

Kami memiliki semua nilai dalam tabel di atas dengan n = 6.
Sekarang mari kita masukkan nilai dalam rumus untuk sampai pada gambar.

r = (6 * 23592.83) - (356.70 * 398.59) / √ ((6 * 22829.36) - (356.70) 2 ) * ((6 * 26529.38) - (398.59) 2 )
r = -620,06 / 1,715,95
Koefisien Korelasi akan menjadi-
r = -0,3614
Jadi, perhitungannya adalah sebagai berikut,

r 2 = (-0,3614) 2
Formula Kuadrat R dalam Regresi

r 2 = 0,1306
Analisis: Tampaknya ada hubungan kecil antara perubahan harga minyak mentah dan perubahan harga rupee India. Seiring kenaikan harga minyak mentah, perubahan dalam rupee India juga berpengaruh. Tetapi karena R kuadrat hanya 13%, maka perubahan harga minyak mentah sangat sedikit menjelaskan tentang perubahan rupee India, dan rupee India juga tunduk pada perubahan variabel lain, yang perlu diperhitungkan.
Contoh # 3
Laboratorium XYZ sedang melakukan penelitian tentang tinggi dan berat badan dan tertarik untuk mengetahui apakah ada hubungan antara variabel-variabel ini. Setelah mengumpulkan sampel 5.000 orang untuk setiap kategori dan mendapatkan rata-rata berat badan dan tinggi badan rata-rata dalam kelompok tertentu.
Di bawah ini adalah detail yang mereka kumpulkan.

Anda diminta untuk menghitung R Squared dan menyimpulkan jika model ini menjelaskan varians dalam tinggi mempengaruhi varians berat.
Larutan:
Dengan menggunakan rumus korelasi di atas, kita dapat menghitung koefisien korelasi terlebih dahulu. Memperlakukan tinggi badan sebagai satu variabel, misalnya x, dan memperlakukan berat badan sebagai variabel lain sebagai y.

Kami memiliki semua nilai dalam tabel di atas dengan n = 6.
Sekarang mari kita masukkan nilai dalam rumus untuk sampai pada gambar.

r = (7 * 74.058.67) - (1031 * 496.44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793.59) - (496.44) 2 )
r = 6,581,05 / 7,075,77
Koefisien Korelasi akan menjadi-
Koefisien Korelasi (r) = 0,9301
Jadi, perhitungannya adalah sebagai berikut,

r 2 = 0,8651
Analisis: Korelasi positif, dan tampaknya ada hubungan antara tinggi dan berat badan. Saat tinggi badan bertambah, berat orang tersebut juga tampak meningkat. Sedangkan R2 menunjukkan bahwa 86% dari perubahan atribut tinggi untuk perubahan berat badan, dan 14% tidak dapat dijelaskan.
Relevansi dan Penggunaan
Relevansi R kuadrat dalam Regresi adalah kemampuannya untuk menemukan kemungkinan kejadian di masa depan yang terjadi dalam hasil atau hasil yang diprediksi. Jika lebih banyak sampel ditambahkan ke model, maka koefisien akan menunjukkan kemungkinan atau kemungkinan titik baru atau set data baru jatuh pada garis tersebut. Sekalipun kedua variabel memiliki hubungan yang kuat, penentuan tersebut tidak membuktikan kausalitas.
Beberapa ruang di mana R squared banyak digunakan adalah untuk melacak kinerja reksa dana, untuk melacak risiko di hedge fund, untuk menentukan seberapa baik pergerakan saham dengan pasar, di mana R2 akan menunjukkan seberapa banyak pergerakan di saham dapat dijelaskan oleh pergerakan di pasar.