Tapi bagaimana dengan analisis regresi? Berbeda dengan analisis ragam, analisis regresi dilakukan untuk mengetahui bentuk hubungan antara dua peubah, yaitu antara peubah bebas X dengan peubah tidak bebas Y. Dengan kata lain, analisis regresi merupukan analisis untuk menentukan bentuk hubungan fungsional Y=f(X). Terhadap data percobaan, analisis regresi dapat dilakukan antara taraf perlakuan kuantitatif dengan suatu peubah pengamatan. Misalnya, analisis regresi dapat dilakukan untuk menentukan bentuk hubungan antara taraf perlakuan dosis pemupukan nitrogen (taraf perlakuan kuantitatif, yaitu dosis) dengan produksi gabah kering. Dalam hal ini, analisis regresi dapat dilakukan langsung dengan menggunakan teknik pemilihan peubah bebas tertentu atau dilakukan dengan menggunakan peubah bebas dengan pangkat tertinggi yang diperoleh melalui uji polinomial ortogonal. Tetapi analisis regresi dapat dilakukan bukan hanya terhadap data percobaan, melainkan juga dapat digunakan terhadap data survei.
Hubungan antara satu peubah tidak bebas dengan satu atau beberapa peubah bebas dapat bersifat linier atau non-linier. Hubungan dikatakan bersifat linier jika memenuhi syarat:
di mana Y merupakan fungsi penjumlahan sejumlah p bagian dan setiap bagian merupakan hasilkali parameter dengan peubah. Dalam hal ini, suatu hubungan dikatakan linier bukan karena bila digambarkan menghasilkan plot berupa garis lurus, melainkan semata-mata berdasarkan kedudukan peubah Y terhadap peubah X. Pada tulisan ini saya tidak akan mencakup analisis regresi non-linier, melainkan hanya analisis regresi linier, yang terdiri atas analisis regresi linier sederhana (simple regression analysis) dan analisis regresi linier berganda (multiple regression analysis). Analisis regresi linier sederhana mencakup hanya satu peubah bebas, sedangkan analisis regresi linier berganda melibatkan beberapa peubah tidak bebas sekaligus.
Sama seperti analisis ragam, analisis regresi linier menggunakan model linier umum Yi = b0 + b1Xi + ei,
di mana Yi menyatatakan nilai peubah tidak bebas ke-i, b0 menyatakan
nilai Y tanpa bergantung pada X, b1 menyatakan koefisien kebergantungan Y
pada X, Xi menyatakan nilai peubah X ke-i, dan ei menyatakan galat yang
berkaitan dengan nilai Y dan nilai X ke-i. Hanya bedanya, dalam
analisis ragam X diperlakukan sebagai peubah dengan nilai nominal
(kelas), sedangkan dalam analisis regresi X diperlakukan sebagai peubah
dengan nilai rasio kontinyu. Hasil analisis regresi linier adalah
persamaan linier yang dibuat dengan berdasarkan atas data. Anda tentu sudah belajar persamaan linier
dalam mata pelajaran matematika di SMA. Beda analisis regresi dengan persamaan
linier dalam matematika adalah bahwa dalam persamaan linier,
persamaannya sudah ada. Dari persamaan tersebut kemudian dapat dibuat
data dengan mengisikan nilai-nilai tertentu terhadap X sehingga
diperoleh sejumlah nilai Y. Dalam analisis regresi, yang dilakukan adalah sebaliknya, membuat persamaan dari data peubah bebas X dan data peubah tidak bebas Y hasil pengamatan.
Dari
uraian di atas, dapat dipahami bahwa analisis regresi merupakan teknik
analisis statistik untuk menentukan persamaan hubungan antara satu atau beberapa peubah bebas dengan satu peubah tidak bebas. Misalkan
tersedia data peubah bebas X keparahan penyakit dan peubah bebas Y hasil yang bila
digambarkan dalam bentuk plot tampak sebagai titik-titik merah pada
Gambar 1:
Memperhatikan
sebaran titik-titik merah pada gambar tersebut, Anda dapat
mengetahui bahwa semakin meningkat nilai peubah bebas X (keparahan penyakit), semakin menurun nilai peubah tidak bebas Y (hasil). Tapi bagaimana menggambarkan
hubungan antara X dengan Y tersebut ke dalam bentuk persamaan? Terdapat
berbagai kemungkinan persamaan, yang pada Gambar 2 digambarkan
hanya tiga, yaitu persamaan-persamaan yang membentuk garis P1, garis P2,
dan garis P3. Dalam kaitan dengan ini, analisis regresi dilakukan untuk
mementukan, yang mana di antara ketiga garis tersebut, yang dapat
mewakili data hubungan antara perubah bebas X dengan peubah tidak bebas Y
secara paling tepat. Karena garis persamaan regresi ditentukan oleh
nilai b0 dan b1 dalam persamaan Y = b0 + b1X, analisis regresi berarti
analisis untuk menentukan nilai b0 dan nilai b1 yang paling tepat untuk
data yang tersedia. Dalam istilah statistik, cara penentuan nilai b0 dan
nilai b1 yang paling tepat tersebut disebut teknik kuadrat terkecil (least square).
Sama seperti mengerjakan analisis ragam zaman dulu, mengerjakan
analisis regresi jaman dulu juga dilakukan secara manual dengan bantuan
kalkulator. Pada era teknologi informasi berbasis komputer sekarang ini,
tentu saja analisis secara manual seperti itu sudah sangat ketinggalan
zaman. Anda dapat melakukannya dengan menggunakan berbagai
program aplikasi analisis regresi, baik yang berbayar maupun yang
gratis. Sebagai contoh, saya akan melakukan analisis regresi antara severitas (keparahan) penyakit sebagai peubah bebas dengan hasil tanaman sebagai peubah tidak bebas. Berdasarkan teori, semakin tinggi keparahan penyakit maka produksi tanaman akan semain rendah. Melalui contoh ini saya akan mengajak Anda untuk
menjawab pertanyaan, seberapa besar produksi tanaman akan menurun bila
severitas (keparahan) meningkat dengan laju peningkatan tertentu? Untuk
menjawab pertanyaan tersebut, tentu saja Anda terlebih dahulu
harus menentukan persamaan hubungan antara produksi tanaman dengan
keparahan penyakit. Persamaan hubungan itulah yang akan kita tentukan
dengan menggunakan teknik analisis regresi.
Untuk mengerjakan contoh analisis regresi tersebut, saya akan menggunakan program aplikasi tabel lajur Microsoft Excel. Mengapa saya menggunakan Microsoft Excel? Karena jika Anda mempunyai komputer maka pada komputer tersebut pasti sudah terpasang Microsoft Excel (meskipun sangat mungkin, apa boleh buat, program bajakan). Sebelum memulai, silahkan terlebih dahulu Anda mengaktifkan Add-Ins Analysis Toolpak dengan cara mengklik logo Office dan kemudian mengklik Excel Options, memilih Add-Ins, memilih Analysis ToolPak, dan mengklik OK, sehingga pada toolbar terdapat menu Data dengan pilihan Data Analysis. Selanjutnya, silahkan Anda unduh data untuk melakukan analisis. Setelah data dibuka dan pada layar tampil lembar data_reg, Anda dapat melakukan analisis regresi linier sederhana dengan mengklik menu Data dan kemudian Analysis lalu mengklik pilihan Data Analysis. Pada kotak menu yang tampil, silahkan pilih Regression Analysis sehingga tampil kotak menu pilihan Regression Analysis untuk diisi. Hasil analisis regresi linier sederhana (derajat satu) saya sajikan pada lembar reglin_der1, sedangkan hasil analisis regresi linier derajat dua saya sajikan pada lembar reglin_der2. Plot hubungan linier derajat satu dan derajat dua dapat saja sajikan masing-masing pada Gambar 3 dan Gambar 4.
Untuk menentukan apakah suatu persamaan yang diperoleh melalui analisis regresi merupakan persamaan yang paling tepat, perlu dilakukan evaluasi terhadap hasil analisis regresi. Evaluasi dilakukan dengan kriteria:
Berdasarkan ketiga kriteria di atas, silahkan lakukan evaluasi sendiri, mana persamaan yang lebih tepat, persamaan linier derajat satu sebagaimana dapat diperiksa pada lembar reglin_der1 atau persamaan linier derajat dua sebagaimana dapat diperiksa pada lembar reglin_der2.
Selain melakukan analisis regresi dengan menggunakan Microsoft Excel, sya juga melakukan analisis regresi terhadap data yang sama dengan menggunakan program aplikasi statistika berbayar SAS/STAT. Hasil analisis regresi liner derajat satu dan regresi liner derajat dua yang saya lakukan dengan menggunakan program aplikasi statistika berbayar SAS saya sajikan masing-masing pada gambar 5 dan Gmanbar 6. Silahkan bandingkan dengan hasil yang diperoleh dengan menggunakan Excel.
Saya merekomendasikan Anda juga belajar melakukan analisis regresi dengan menggunakan program aplikasi R karena R merupakan program aplikasi statistika akses terbuka (gratis). Untuk mempelajari program aplikasi tersebut, silahkan terlebih dahulu unduh dan pasang pada komputer masing-masing. Setelah program terpasang, silahkan pelajari cara menggunakan R secara umum dan cara menggunakan R untuk melakukan analisis regresi pada situs Quick R. Mungkin Anda akan mengeluh, sudah berbahasa Inggris sulit pula (belum lagi ada yang mengatakan bahwa sebagai mahasiswa dia sangat sibuk, entah sibuk apa kalau bukan belajar). Kalau sudah begitu, maaf, saya tidak bisa membantu. Silahkan lakukan kesibukan lain dan lupakan belajar, toh tanpa belajar banyak juga yang bisa menjadi sarjana, dengan nilai skripsi A pula.
Gambar 1. Plot hubungan antara keparahan penyakit dengan hasil |
Gambar 2. Tiga garis, yaitu P1, P2, dan P3, yang mungkin dapat menyatakan hubungan keparahan penyakit dengan hasil |
Untuk mengerjakan contoh analisis regresi tersebut, saya akan menggunakan program aplikasi tabel lajur Microsoft Excel. Mengapa saya menggunakan Microsoft Excel? Karena jika Anda mempunyai komputer maka pada komputer tersebut pasti sudah terpasang Microsoft Excel (meskipun sangat mungkin, apa boleh buat, program bajakan). Sebelum memulai, silahkan terlebih dahulu Anda mengaktifkan Add-Ins Analysis Toolpak dengan cara mengklik logo Office dan kemudian mengklik Excel Options, memilih Add-Ins, memilih Analysis ToolPak, dan mengklik OK, sehingga pada toolbar terdapat menu Data dengan pilihan Data Analysis. Selanjutnya, silahkan Anda unduh data untuk melakukan analisis. Setelah data dibuka dan pada layar tampil lembar data_reg, Anda dapat melakukan analisis regresi linier sederhana dengan mengklik menu Data dan kemudian Analysis lalu mengklik pilihan Data Analysis. Pada kotak menu yang tampil, silahkan pilih Regression Analysis sehingga tampil kotak menu pilihan Regression Analysis untuk diisi. Hasil analisis regresi linier sederhana (derajat satu) saya sajikan pada lembar reglin_der1, sedangkan hasil analisis regresi linier derajat dua saya sajikan pada lembar reglin_der2. Plot hubungan linier derajat satu dan derajat dua dapat saja sajikan masing-masing pada Gambar 3 dan Gambar 4.
Gambar 3. Plot hubungan linier derajar satu antara keparahan penyakit dengan hasil tanaman (kiri) dan plot sisaan (kanan) |
Gambar 4. Plot hubungan linier derajar dua antara keparahan penyakit dengan hasil tanaman (kiri) dan plot sisaan (kanan) |
Untuk menentukan apakah suatu persamaan yang diperoleh melalui analisis regresi merupakan persamaan yang paling tepat, perlu dilakukan evaluasi terhadap hasil analisis regresi. Evaluasi dilakukan dengan kriteria:
- Nilai signifikansi model dan nilai signifikansi parameter model (b0, b1): harus lebih kecil dari 0,05, semakin kecil semakin baik,
- Nilai R-square: semakin besar semakin baik; dan
- Plot sisaan (residuals): semakin acak semakin baik, tidak boleh membentuk pola tertentu.
Berdasarkan ketiga kriteria di atas, silahkan lakukan evaluasi sendiri, mana persamaan yang lebih tepat, persamaan linier derajat satu sebagaimana dapat diperiksa pada lembar reglin_der1 atau persamaan linier derajat dua sebagaimana dapat diperiksa pada lembar reglin_der2.
Selain melakukan analisis regresi dengan menggunakan Microsoft Excel, sya juga melakukan analisis regresi terhadap data yang sama dengan menggunakan program aplikasi statistika berbayar SAS/STAT. Hasil analisis regresi liner derajat satu dan regresi liner derajat dua yang saya lakukan dengan menggunakan program aplikasi statistika berbayar SAS saya sajikan masing-masing pada gambar 5 dan Gmanbar 6. Silahkan bandingkan dengan hasil yang diperoleh dengan menggunakan Excel.
Gambar 5. Hasil analisis regresi linier derajat satu antara keparahan penyakit dan hasil tanaman dengan menggunakan program aplikasi analisis statistika SAS/STAT |
Gambar 6. Hasil analisis regresi linier derajat dua antara keparahan penyakit dan hasil tanaman dengan menggunakan program aplikasi analisis statistika SAS/STAT |
Saya merekomendasikan Anda juga belajar melakukan analisis regresi dengan menggunakan program aplikasi R karena R merupakan program aplikasi statistika akses terbuka (gratis). Untuk mempelajari program aplikasi tersebut, silahkan terlebih dahulu unduh dan pasang pada komputer masing-masing. Setelah program terpasang, silahkan pelajari cara menggunakan R secara umum dan cara menggunakan R untuk melakukan analisis regresi pada situs Quick R. Mungkin Anda akan mengeluh, sudah berbahasa Inggris sulit pula (belum lagi ada yang mengatakan bahwa sebagai mahasiswa dia sangat sibuk, entah sibuk apa kalau bukan belajar). Kalau sudah begitu, maaf, saya tidak bisa membantu. Silahkan lakukan kesibukan lain dan lupakan belajar, toh tanpa belajar banyak juga yang bisa menjadi sarjana, dengan nilai skripsi A pula.
Hak cipta: I Wayan Mudita
Revisi terakhir: 6 Maret 2019
Hak cipta tulisan ini dilindungi berdasarkan Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.
Untuk
memahami tulisan singkat ini secara lebih tuntas, silahkan klik setiap
tautan yang tersedia. Bila Anda masih mempunyai pertanyaan, silahkan
sampaikan melalui kotak komentar di bawah ini.