Analisis regresi linear adalah salah satu metode statistik yang digunakan untuk menemukan hubungan antara dua variabel. Dalam analisis regresi linear, variabel yang satu disebut variabel independen, sedangkan variabel yang lain disebut variabel dependen. Analisis regresi linear digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai variabel independen.
Contoh Kasus
Sebagai contoh, seorang peneliti ingin mengetahui apakah ada hubungan antara jumlah jam belajar dengan nilai ujian. Peneliti meminta 50 siswa untuk mengisi kuesioner mengenai jumlah jam belajar dan nilai ujian mereka. Berikut adalah data yang diperoleh:
Jumlah Jam Belajar (X) | Nilai Ujian (Y) |
---|---|
2 | 70 |
3 | 80 |
4 | 85 |
5 | 90 |
6 | 95 |
7 | 100 |
8 | 105 |
9 | 110 |
10 | 115 |
Dari data di atas, kita dapat membuat diagram scatterplot untuk melihat hubungan antara jumlah jam belajar dengan nilai ujian:
Menghitung Analisis Regresi Linear
Untuk menghitung analisis regresi linear, kita memerlukan rumus:
Y = a + bX
di mana:
- Y adalah variabel dependen (nilai ujian)
- X adalah variabel independen (jumlah jam belajar)
- a adalah intercept atau konstanta
- b adalah slope atau kemiringan garis regresi
Untuk menghitung a dan b, kita dapat menggunakan rumus:
b = Σ((X – X̄)(Y – Ȳ)) / Σ(X – X̄)²
a = Ȳ – bX̄
di mana:
- X̄ adalah rata-rata dari variabel independen
- Ȳ adalah rata-rata dari variabel dependen
Dalam kasus ini, kita memiliki:
- ΣX = 54
- ΣY = 765
- X̄ = ΣX / n = 54 / 9 = 6
- Ȳ = ΣY / n = 765 / 9 = 85
Untuk menghitung b, kita perlu menghitung:
- (X – X̄)(Y – Ȳ) untuk setiap pasangan data
- (X – X̄)² untuk setiap pasangan data
Berikut adalah tabel yang menunjukkan perhitungan tersebut:
X | Y | X – X̄ | Y – Ȳ | (X – X̄)(Y – Ȳ) | (X – X̄)² |
---|---|---|---|---|---|
2 | 70 | -4 | -15 | 60 | 16 |
3 | 80 | -3 | -5 | 15 | 9 |
4 | 85 | -2 | 0 | 0 | 4 |
5 | 90 | -1 | 5 | -5 | 1 |
6 | 95 | 0 | 10 | 0 | 0 |
7 | 100 | 1 | 15 | 15 | 1 |
8 | 105 | 2 | 20 | 40 | 4 |
9 | 110 | 3 | 25 | 75 | 9 |
10 | 115 | 4 | 30 | 120 | 16 |
Σ | 765 | 0 | 0 | 260 | 60 |
Jadi, untuk menghitung b, kita dapat menggunakan rumus:
b = Σ((X – X̄)(Y – Ȳ)) / Σ(X – X̄)² = 260 / 60 = 4.33
Untuk menghitung a, kita dapat menggunakan rumus:
a = Ȳ – bX̄ = 85 – 4.33 * 6 = 58.98
Jadi, persamaan regresi linear untuk kasus ini adalah:
Y = 58.98 + 4.33X
Artinya, jika seorang siswa belajar selama 7 jam, maka prediksi nilai ujiannya adalah:
Y = 58.98 + 4.33 * 7 = 88.59
Jadi, prediksi nilai ujian seorang siswa yang belajar selama 7 jam adalah 88.59.
Kesimpulan
Dalam analisis regresi linear, kita dapat menemukan hubungan antara dua variabel dan memprediksi nilai variabel dependen berdasarkan nilai variabel independen. Untuk menghitung analisis regresi linear, kita menggunakan rumus Y = a + bX, di mana a adalah intercept atau konstanta, b adalah slope atau kemiringan garis regresi, X adalah variabel independen, dan Y adalah variabel dependen. Untuk menghitung a dan b, kita menggunakan rumus b = Σ((X – X̄)(Y – Ȳ)) / Σ(X – X̄)² dan a = Ȳ – bX̄. Dalam contoh kasus di atas, kita menggunakan analisis regresi linear untuk menemukan hubungan antara jumlah jam belajar dengan nilai ujian. Hasil analisis menunjukkan bahwa ada hubungan positif antara jumlah jam belajar dengan nilai ujian. Semakin banyak jam belajar, semakin tinggi nilai ujian. Persamaan regresi linear untuk kasus ini adalah Y = 58.98 + 4.33X, di mana Y adalah prediksi nilai ujian dan X adalah jumlah jam belajar.