Wednesday, June 6, 2018

Apa itu Regresi?


Halo semuanya jumpa lagi di blog yorkshire piramid. kali ini saya akan membagikan konsep regresi, apasih regresi itu? yuk simak penjelasannya di bawah ini.

Konsep Regresi

Sir Francis Galton (1822–1911), memperkenalkan model peramalan, penaksiran, atau pendugaan, terkait dengan penelitiannya terhadap tinngi badan manusia. Model tersebut dikenal sebagai regresi. penelitian tersebut membandingkan antara tinggi anak laki-laki dan tinggi badan ayahnya. Hasil penelitannya menunjukkan bahwa anak laki-laki dari ayah yang badannya sangat tinggi cenderung lebih pendek daripada ayahnya, sedangkan anak laki-laki dari ayah yang sangat pendek cenderung lebih tinggi dari ayahnya (Ronal E. Walpole). Galton menunjukkan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed) mendekati nilai tengah populasi. Analisis regresi digunakan untuk menentukan bentuk hubungan antar variabel. Tujuan utama dalam penggunaan analisis ini adalah untuk meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan variabel lain yang diketahui melalui persamaan garis regresinya (Iqbal Hasan).
1.1.Fungsi regresi
Dalam ilmu statistika ada dua macam hubungan antara dua variabel yang relatif sering digunakan yakni bentuk hubungan dan keeratan. Bentuk hubungan bisa diketahui melalui analisis regresi, sedangkan keeratan hubungan dapat diketahui dengan analisis korelasi. Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel independen mempengaruhi variabel dependen dalam suatu fenomena yang komplek. Jika X1, X2, ...., Xn, adalah variabel-variabel independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X dan Y, dimana variasi dari X akan diiringi pula oleh variasi dari Y. Jika dibuat secara matematis hubungan itu dapat dijabarkan sebagai berikut:
Y = f(X1, X2, ....., Xn, e),
dimana:  
Y adalah variabel dependen (tak bebas)
X adalah variabel independen (bebas)
e adalah variabel residu (disturbace term)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang lazim dilaksanakan (Moh. Nazir) yakni :
(1)  Mengadakan estimasi terhadap parameter berdasarkan data empiris.
(2) Menguji berapa besar variasi variabel dependen dapat diterangkan oleh variasi independen.
(3)  Menguji apakah estimasi parameter tersebut signifikan atau tidak.
(4)  Melihat apakah tanda magnitud dari estimasi parameter cocok dengan teori.
Hubungan antar variabel dapat berupa hubungan linier ataupun hubungan tidak linier. Misalnya, berat badan orang dewasa sampai pada tahap tertentu bergantung pada tinggi badan, keliling lingkaran bergantung pada diameternya, dan tekanan gas bergantung pada suhu dan volumenya. Atau dalam ilmu pemasaran, nilai penjualan akan bergantung pada biaya promosi. Hubungan-hubungan itu bila dinyatakan dalam bentuk matematis akan memberikan persamaan-persamaan tertentu. Untuk dua variabel, hubungan liniernya dapat dinyatakan dalam bentuk persamaan linier, yakni: Y = a + bX. Hubungan antara dua variabel pada persamaan linier jika digambarkan secara (scatter diagram), semua nilai Y dan X akan berada pada suatu garis lurus. Dan dalam ilmu ekonomi, garis itu dinamakan garis regresi. (Iqbal Hasan). Dalam menentukan nilai a dan b digunakan prinsip jumlah kuadrat kesalahan terkecil (Ordinary Least Square). Yang mana untuk memprediksi hubungan antar variabel digunakan analisis regresi.
1.2.Jenis Data

Didalam menentukan hubungan linier antara dua variabel atau lebih, maka diperlukan data yang dapat mendukung dalam menentukan arah hubungan dan pengambilan keputusan. Data adalah bahan mentah yang di dapat dan perlu diolah lebih lanjut, sehingga akan menghasilkan informasi atau keterangan yang mudah dimengerti. Data perlu dikelompokkan dahulu sebelum digunakan dalam proses analisis.

  1. Data Menurut Sumber Pengambilan.
1.      Data Primer
Data yang diperoleh secara langsung dilapangan oleh peneliti yang bersangkutan.
2.      Data Sekunder
Data yang diperoleh dari sumber-sumber yang telah ada yang diambil oleh peneliti.

  1. Data Menurut Waktu Pengumpulan
1.      Data Berkala (time series)
Data yang terkumpul dari waktu ke waktu (banyak waktu) untuk memberikan suatu keadaan tertentu, pada satu objek.
2.      Data Kerat Lintang (cross section)
Data yang terkumpul pada satu waktu tertentu untuk memberikan gambaran pekembangan suatu keadaan pada banyak objek.
3.      Data Panel (kombinasi time series dan cross section)
Data yang terkumpul dari waktu ke waktu (banyak waktu) untuk memberikan suatu keadaan tertentu pada banyak objek.

  1. Data Menurut Sifat
1.      Data Kualitatif
Data yang tidak berbentuk bilangan atau angka
2.      Data Kuantitatif
Data yang berbentuk bilangan atau angka.

  1. Data Menurut Tingkat Pengukurannya
1.      Data Metrik
Data yang bisa dilakukan proses matematika. Macam data metrik adalah
a)      Data Interval
Data yang berasal dari kategori yang diurutkan berdasarkan suatu atribut tertentu, dimana jarak dari tiap kategori adalah sama, artinya jarak data yang satu dengan yang lain mempunyai bobot yang sama.
b)      Data Rasio
Data yang pengukurannya mempunyai nilai nol mutlak dan mempunyai jarak yang sama, artinya data rasio menghimpun semua ciri-ciri data dari data nominal, interval, dan ordinal.
2.      Data Non Metrik
Data yang tidak bisa dilakukan proses matematika, macam data non metrik adalah
a)      Data Ordinal
Data yang berasal dari ranking, yang mana data diurutkan dari jenjang paling rendah ke jenjang paling tinggi dan dari jarak yang tidak sama.
b)      Data Nominal
Data yang berasal dari pengelompokan kejadian berdasarkan kategori tertentu yang perbedaannya hanyalah menunjukkan perbedaan kualitatif. Artinya fungsi bilangan hanya sebagai simbol untuk membedakan sebuah karakteristik data tersebut.
Berikut ini akan dijelaskan secara rinci jenis data yang digunakan dalam persamaan regresi. Secara umum bentuk persamaan regresi dan jenis data yang digunakan ditunjukkan pada persamaan. 1.1 :

Y = a + b1 X1 + b2 X2 + b3 X3 + .......... + bn Xn                                 (pers. 1.1)         
Metrik                                                  Metrik & Non Metrik

Untuk variabel tergantung Y harus mempunyai jenis data metrik sedangkan untuk variabel bebas bisa terdiri data metrik atau non metrik (Hair et al, 2006). Jenis data metrik terdiri dari data rasio dan interval sedangkan data non metrik terdiri dari data ordinal dan nominal. Ciri-ciri masing-masing jenis data tersebut ditunjukkan pada tabel 1.1.
Tabel 1.1 : Ciri-ciri jenis data
Ciri
Jenis
Awalan
Jarak
Urutan
Klasifikasi
Rasio
V
V
V
X
Interval
X
V
V
X
Ordinal
X
X
V
V
Nominal
X
X
X
V
Keterangan :
Awalan = Mutlak dimulai 1
Jarak = Bisa dioperasikan secara matematis ( +  -  *  / )
Urutan = 4 > 3 > 2 > 1
Klasifikasi = Pengelompokan
V = Ada                     
X = Tidak ada

Sebagai ilustrasi, sebuah penelitian yang berjudul ”Pengaruh Jenis Kelamin, Pendidikan, Motivasi, Warna Baju dan Umur terhadap Pendapatan SPG di Royal Plaza”, maka akan dikumpulkan data melalui kuesioner, dan hasilnya akan ditabulasi seperti ditunjukkan pada tabel 1.2.
Untuk keperluan pengolahan statistik maka seluruh data hasil kuesioner harus berupa angka, apabila data tidak berupa angka harus dikonversi menjadi angka, contoh : Jenis Kelamin (Laki-laki dikonversi menjadi angka 1 dan  Perempuan dikonversi menjadi angka 2) dan sebagainya.
Tabel 1.2 : Tabulasi data responden SPG di Royal Plaza
Nama SPG
Sex
Pendidikan
Motivasi
Warna Baju
Umur
Pendapatan
Ronni
1
3
5
3
23
2.000.000
Silvi
2
2
4
2
26
1.750.000
Retno
2
4
2
4
30
1.000.000
Bambang
1
1
2
2
15
750.000
Joko
1
2
4
3
32
1.500.000
Rini
2
3
5
4
24
2.500.000
Novi
2
3
3
1
20
2.750.000
Siti
2
4
2
1
35
1.250.000
Rudi
1
2
1
3
19
3.000.000
Santi
2
1
1
4
27
2.250.000
Keterangan :
1. Sex  (1: Laki-laki & 2: Perempuan)
2. Pendidikan (1: SD, 2: SMP, 3: SMA, 4: PT / Perguruan Tinggi )
3. Motivasi (1: Sangat Rendah, 2: Rendah, 3: Cukup, 4: Tinggi, 5: Sangat Tinggi)
4. Warna Baju (1: Merah, 2: Kuning, 3: Hijau, 4: Pink)
5. Umur (tahun)
6. Pendapatan (rupiah)

Untuk mendeteksi jenis data untuk masing-masing variabel maka dibuat identifikasi untuk ciri-ciri data yang melekat pada variabel tersebut.
1.   Variabel Sex
a.    Ciri Awalan: tidak ada, karena kita boleh membuat peraturan sendiri, misalnya 2: Laki-laki, 3: Perempuan walaupun tidak lazim tapi diperbolehkan
b.    Ciri Jarak : tidak ada, karena 1 (laki-laki) + 1 (laki-laki) tidak sama dengan 2 (perempuan) dan tidak bisa dilakukan operasi matematik lainnya.
c.    Ciri Urutan : tidak ada, karena 2 (perempuan) tidak lebih besar dari 1 (laki-laki).
d.    Ciri Klasifikasi : ada, terdiri dari 2 kelompok yaitu 1 (laki-laki) dan 2 (perempuan)
Kesimpulan :
Variabel Sex termasuk jenis data NOMINAL karena tidak ada awalan, tidak ada jarak, tidak ada urutan dan ada klasifikasi.
2.      Variabel Pendidikan
a.         Ciri Awalan: tidak ada, karena kita boleh membuat peraturan sendiri, misalnya 3: SD, 4: SMP, 5: SMA, 6: PT walaupun tidak lazim tapi diperbolehkan
b.        Ciri Jarak : tidak ada, karena 2 (SMP) * 2 (SMP) tidak sama dengan 4 (PT) dan tidak bisa dilakukan operasi matematik lainnya.
c.         Ciri Urutan : ada, karena 4 (PT) > 3 (SMA) > 2 (SMP) > 1 (SD)
d.        Ciri Klasifikasi : ada, terdiri dari 4 kelompok yaitu 1 (SD), 2 (SMP), 3 (SMA) dan 4 (PT)

Kesimpulan :
Variabel Pendidikan termasuk jenis data ORDINAL karena tidak ada awalan, tidak ada jarak, ada urutan dan ada klasifikasi.
3.   Variabel Motivasi
a.         Ciri Awalan: tidak ada, karena kita boleh membuat peraturan sendiri, misalnya 3: Sangat Rendah, 4: Rendah, 5: Cukup, 6: Tinggi dan 7: Sangat Tinggi walaupun tidak lazim tapi diperbolehkan
b.        Ciri Jarak : tidak ada, karena 3 (Sangat Rendah) + 4 (Rendah) tidak sama dengan 7 (Sangat Tinggi) dan tidak bisa dilakukan operasi matematik lainnya.
c.         Ciri Urutan : ada, karena 5 (sangat tinggi) > 4 (tinggi) > 3 (cukup) > 2 (rendah) > 1 (sangat rendah)
d.        Ciri Klasifikasi : ada, karena terdiri dari 5 kelompok yaitu 1 (sangat rendah), 2 (rendah), 3 (cukup), 4 (tinggi) dan 5 (sangat tinggi).
Kesimpulan :
Variabel Motivasi termasuk jenis data ORDINAL karena tidak ada awalan, tidak ada jarak, ada urutan dan ada klasifikasi.
4.      Variabel Warna Baju
a.    Ciri Awalan: tidak ada, karena kita boleh membuat peraturan sendiri, misalnya 2: Merah, 3: Kuning, 4: Hijau dan 5: Pink walaupun tidak lazim tapi diperbolehkan
b.    Ciri Jarak : tidak ada, karena 2 (Kuning) + 2 (Kuning) tidak sama dengan 4 (Pink) dan tidak bisa dilakukan operasi matematik lainnya.
c.    Ciri Urutan : tidak ada, karena 4 (Pink) tidak lebih besar atau lebih baik dari 3 (Hijau) dan seterusnya
d.    Ciri Klasifikasi : ada, terdiri dari 4 kelompok yaitu 1 (Merah), 2 (Kuning), 3 (Hijau) dan 4 (Pink)
Kesimpulan :
Variabel Warna Baju termasuk jenis data ORDINAL karena tidak ada awalan, tidak ada jarak, ada urutan dan ada klasifikasi.
5.   Variabel Umur
a.     Ciri Awalan: ada, karena mutlak dimulai 1, kita tidak bisa mengatakan bahwa seseorang berumur 32 tahun adalah 20 tahun, karena perhitungannya dimulai dari 12.
b.     Ciri Jarak : ada, karena kita bisa mengatakan bahwa umur Bambang (15) + umur Novi (20) sama dengan umur Siti (35) demikian juga berlaku operasi matematik lainnya.
c.     Ciri Urutan : ada, karena 40 > 35 > 32 > 30 ..... dan seterusnya.
d.     Ciri Klasifikasi : tidak ada, karena nilainya adalah unik jadi tidak ada pengelompokan
Kesimpulan :
Variabel Umur termasuk jenis data RASIO karena ada awalan, ada jarak, ada urutan dan tidak ada klasifikasi.


6.      Variabel Pendapatan
a.    Ciri Awalan: ada, karena mutlak dimulai 1, kita tidak bisa mengatakan bahwa seseorang mempunyai gaji 3.000.000 adalah 2.000.000 karena perhitungannya dimulai dari 1.000.000.
b.    Ciri Jarak : ada, karena kita bisa mengatakan bahwa pendapatan Silvi (1.750.00) + pendapatan Bambang (750.000) = pendapatan Rudi (2.500.000).
c.    Ciri Urutan : ada, karena 3.000.000 > 2.750.000 > 2.500.000 .... dan seterusnya.
d.    Ciri Klasifikasi : tidak ada, karena nilainya adalah unik jadi tidak ada pengelompokan
Kesimpulan :
Variabel Pendapatan termasuk jenis data RASIO karena ada awalan, ada jarak, ada urutan dan tidak ada klasifikasi.
Untuk data metrik yang terdiri dari Rasio dan Interval, maka jenis data Rasio yang sering banyak digunakan sedangkan jenis data Interval jarang digunakan. Perbedaan dengan data Rasio adalah Rasio mempunyai awalan dan Interval tidak mempunyai awalan. Contoh yang sering digunakan untuk data Interval adalah suhu, karena untuk Celcius dimulai dari 1, Farenheit dimulai dari 39 dan Kelvin dimulai 212. Didalam perangkat lunak SPSS jenis data Rasio dan Interval ini dinyatakan sebagai jenis data ”SCALE”. Untuk data non-metrik yang terdiri dari Ordinal dan Nominal keduanya digunakan secara luas karena kedua jenis data tersebut memang banyak ditemui dilapangan. Didalam perangkat lunak SPSS data Ordinal dan Nominal ini dinyatakan secara terpisah yaitu ”ORDINAL” dan ”NOMINAL” tidak sebagaimana jenis data Rasio dan Interval yang dijadikan satu sebagai jenis data yaitu ”SCALE”.
Sekian informasi yang dapat saya bagikan untuk kalian semua, semoga bermanfaat dan jangan lupa untuk follow. Terima kasih, salam satu buku cuit cuit cuit. Yorkshire Piramid.

No comments:

Post a Comment

Bagaimana pendapatmu tentang tulisan ini?

Populer

Begini caranya menyelamatkan diri ketika Tsunami

Pengertian Tsunami dan proses terjadinya Tsunami sendiri terdiri atas dua suku kata yakni “tsu” yang berarti pelabuhan dan “nami” yang...