Halo semuanya jumpa lagi di blog yorkshire
piramid. kali ini saya akan membagikan konsep regresi, apasih regresi itu? yuk
simak penjelasannya di bawah ini.
Konsep Regresi
Sir Francis Galton
(1822–1911), memperkenalkan model peramalan, penaksiran, atau pendugaan, terkait dengan penelitiannya terhadap
tinngi badan manusia. Model tersebut dikenal sebagai regresi. penelitian tersebut membandingkan antara tinggi
anak laki-laki dan tinggi badan ayahnya. Hasil penelitannya
menunjukkan bahwa anak laki-laki dari ayah yang badannya sangat tinggi
cenderung lebih pendek daripada ayahnya, sedangkan anak laki-laki dari ayah yang sangat pendek cenderung lebih
tinggi dari ayahnya (Ronal E. Walpole). Galton menunjukkan bahwa tinggi badan anak laki-laki dari
ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed)
mendekati nilai tengah populasi. Analisis
regresi digunakan untuk menentukan bentuk hubungan antar variabel. Tujuan utama
dalam penggunaan analisis ini adalah untuk meramalkan atau menduga nilai dari satu
variabel dalam hubungannya dengan variabel lain yang diketahui melalui
persamaan garis regresinya (Iqbal Hasan).
1.1.Fungsi regresi
Dalam ilmu statistika ada dua macam
hubungan antara dua variabel yang relatif sering digunakan yakni bentuk hubungan
dan keeratan. Bentuk hubungan
bisa diketahui melalui analisis regresi, sedangkan keeratan hubungan dapat
diketahui dengan analisis korelasi. Analisis regresi dipergunakan untuk
menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri
pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui
bagaimana variasi dari beberapa variabel independen mempengaruhi variabel
dependen dalam suatu fenomena yang komplek. Jika X1, X2, ...., Xn, adalah
variabel-variabel independen dan Y adalah variabel dependen, maka terdapat
hubungan fungsional antara X dan Y, dimana variasi dari X akan diiringi pula
oleh variasi dari Y. Jika dibuat secara matematis hubungan itu dapat dijabarkan
sebagai berikut:
Y = f(X1, X2, ....., Xn, e),
dimana:
Y adalah variabel dependen (tak
bebas)
X adalah variabel independen (bebas)
e adalah variabel residu (disturbace
term)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan
yang lazim dilaksanakan (Moh. Nazir) yakni :
(1) Mengadakan estimasi terhadap parameter
berdasarkan data empiris.
(2) Menguji berapa besar variasi
variabel dependen dapat diterangkan oleh variasi independen.
(3) Menguji apakah estimasi parameter tersebut
signifikan atau tidak.
(4) Melihat apakah tanda magnitud dari estimasi
parameter cocok dengan teori.
Hubungan antar variabel dapat berupa hubungan
linier ataupun hubungan tidak linier. Misalnya, berat badan orang dewasa sampai
pada tahap tertentu bergantung pada tinggi badan, keliling lingkaran bergantung
pada diameternya, dan tekanan gas bergantung pada suhu dan volumenya. Atau
dalam ilmu pemasaran, nilai penjualan akan bergantung pada biaya promosi.
Hubungan-hubungan itu bila dinyatakan dalam bentuk matematis akan memberikan
persamaan-persamaan tertentu. Untuk dua variabel, hubungan liniernya dapat
dinyatakan dalam bentuk persamaan linier, yakni: Y = a + bX. Hubungan antara
dua variabel pada persamaan linier jika digambarkan secara (scatter diagram),
semua nilai Y dan X akan berada pada suatu garis lurus. Dan dalam ilmu ekonomi,
garis itu dinamakan garis regresi. (Iqbal Hasan). Dalam menentukan nilai a dan
b digunakan prinsip jumlah kuadrat kesalahan terkecil (Ordinary Least Square). Yang mana untuk memprediksi hubungan antar
variabel digunakan analisis regresi.
1.2.Jenis Data
Didalam menentukan hubungan linier antara dua
variabel atau lebih, maka diperlukan data yang dapat mendukung dalam menentukan
arah hubungan dan pengambilan keputusan. Data adalah bahan
mentah yang di dapat dan perlu diolah lebih lanjut, sehingga akan menghasilkan
informasi atau keterangan yang mudah dimengerti. Data perlu dikelompokkan
dahulu sebelum digunakan dalam proses analisis.
- Data Menurut Sumber Pengambilan.
1. Data Primer
Data yang diperoleh secara
langsung dilapangan oleh peneliti yang bersangkutan.
2. Data Sekunder
Data yang diperoleh dari
sumber-sumber yang telah ada yang diambil oleh peneliti.
- Data Menurut Waktu Pengumpulan
1. Data Berkala (time series)
Data yang terkumpul dari waktu
ke waktu (banyak waktu) untuk memberikan suatu keadaan tertentu, pada satu objek.
2. Data Kerat Lintang (cross section)
Data yang terkumpul pada satu waktu tertentu untuk memberikan gambaran pekembangan suatu keadaan pada banyak
objek.
3. Data Panel (kombinasi time series dan cross section)
Data yang terkumpul dari waktu
ke waktu (banyak waktu) untuk memberikan suatu keadaan tertentu pada banyak objek.
- Data Menurut Sifat
1. Data Kualitatif
Data yang tidak berbentuk
bilangan atau angka
2. Data Kuantitatif
Data yang berbentuk bilangan
atau angka.
- Data Menurut Tingkat Pengukurannya
1. Data Metrik
Data yang bisa dilakukan
proses matematika. Macam data metrik adalah
a) Data Interval
Data yang berasal dari
kategori yang diurutkan berdasarkan suatu atribut tertentu, dimana jarak dari
tiap kategori adalah sama, artinya jarak data yang satu dengan yang lain
mempunyai bobot yang sama.
b) Data Rasio
Data yang pengukurannya
mempunyai nilai nol mutlak dan mempunyai jarak yang sama, artinya data rasio
menghimpun semua ciri-ciri data dari data nominal, interval, dan ordinal.
2. Data Non Metrik
Data yang tidak bisa dilakukan
proses matematika, macam data non metrik adalah
a) Data Ordinal
Data yang berasal dari
ranking, yang mana data diurutkan dari jenjang paling rendah ke jenjang paling
tinggi dan dari jarak yang tidak sama.
b) Data Nominal
Data yang berasal dari
pengelompokan kejadian berdasarkan kategori tertentu yang perbedaannya hanyalah
menunjukkan perbedaan kualitatif. Artinya fungsi bilangan hanya sebagai simbol
untuk membedakan sebuah karakteristik data tersebut.
Berikut ini akan dijelaskan secara rinci jenis
data yang digunakan dalam persamaan regresi. Secara umum bentuk persamaan
regresi dan jenis data yang digunakan ditunjukkan pada
persamaan. 1.1 :
Y =
a + b1 X1 + b2 X2 + b3 X3
+ .......... + bn Xn (pers.
1.1)
Metrik Metrik
& Non Metrik
Untuk variabel tergantung Y harus mempunyai jenis data metrik
sedangkan untuk variabel bebas bisa terdiri data metrik atau non metrik (Hair
et al, 2006). Jenis
data metrik terdiri dari data rasio dan interval sedangkan data non metrik
terdiri dari data ordinal dan nominal. Ciri-ciri
masing-masing jenis data tersebut ditunjukkan pada tabel 1.1.
Tabel 1.1 : Ciri-ciri
jenis data
Ciri
Jenis
|
Awalan
|
Jarak
|
Urutan
|
Klasifikasi
|
Rasio
|
V
|
V
|
V
|
X
|
Interval
|
X
|
V
|
V
|
X
|
Ordinal
|
X
|
X
|
V
|
V
|
Nominal
|
X
|
X
|
X
|
V
|
Keterangan :
Awalan = Mutlak dimulai 1
Jarak = Bisa dioperasikan secara matematis (
+ -
* / )
Urutan = 4 > 3 > 2 > 1
Klasifikasi = Pengelompokan
V = Ada
X = Tidak ada
Sebagai ilustrasi, sebuah penelitian yang berjudul
”Pengaruh Jenis Kelamin, Pendidikan, Motivasi, Warna Baju dan Umur terhadap
Pendapatan SPG di Royal Plaza”, maka akan dikumpulkan data melalui kuesioner,
dan hasilnya akan ditabulasi seperti ditunjukkan pada tabel 1.2.
Untuk keperluan pengolahan statistik maka seluruh
data hasil kuesioner harus berupa angka, apabila data tidak berupa angka harus
dikonversi menjadi angka, contoh : Jenis Kelamin (Laki-laki dikonversi menjadi angka
1 dan Perempuan dikonversi menjadi angka
2) dan sebagainya.
Tabel 1.2 : Tabulasi data responden SPG di Royal Plaza
Nama SPG
|
Sex
|
Pendidikan
|
Motivasi
|
Warna Baju
|
Umur
|
Pendapatan
|
Ronni
|
1
|
3
|
5
|
3
|
23
|
2.000.000
|
Silvi
|
2
|
2
|
4
|
2
|
26
|
1.750.000
|
Retno
|
2
|
4
|
2
|
4
|
30
|
1.000.000
|
Bambang
|
1
|
1
|
2
|
2
|
15
|
750.000
|
Joko
|
1
|
2
|
4
|
3
|
32
|
1.500.000
|
Rini
|
2
|
3
|
5
|
4
|
24
|
2.500.000
|
2
|
3
|
3
|
1
|
20
|
2.750.000
|
|
Siti
|
2
|
4
|
2
|
1
|
35
|
1.250.000
|
Rudi
|
1
|
2
|
1
|
3
|
19
|
3.000.000
|
Santi
|
2
|
1
|
1
|
4
|
27
|
2.250.000
|
Keterangan :
1. Sex (1:
Laki-laki & 2: Perempuan)
2. Pendidikan (1: SD, 2: SMP, 3: SMA, 4: PT /
Perguruan Tinggi )
3. Motivasi (1: Sangat Rendah, 2: Rendah, 3:
Cukup, 4: Tinggi, 5: Sangat Tinggi)
4. Warna Baju (1: Merah, 2: Kuning, 3: Hijau, 4:
Pink)
5. Umur (tahun)
6. Pendapatan (rupiah)
Untuk mendeteksi jenis data untuk masing-masing
variabel maka dibuat identifikasi untuk ciri-ciri data yang melekat pada
variabel tersebut.
1. Variabel Sex
a. Ciri Awalan: tidak ada, karena kita boleh
membuat peraturan sendiri, misalnya 2: Laki-laki, 3: Perempuan walaupun tidak
lazim tapi diperbolehkan
b. Ciri Jarak : tidak ada, karena 1
(laki-laki) + 1 (laki-laki) tidak sama dengan 2 (perempuan) dan tidak bisa
dilakukan operasi matematik lainnya.
c. Ciri Urutan : tidak ada, karena 2
(perempuan) tidak lebih besar dari 1 (laki-laki).
d. Ciri Klasifikasi : ada, terdiri dari 2
kelompok yaitu 1 (laki-laki) dan 2 (perempuan)
Kesimpulan :
Variabel Sex termasuk jenis
data NOMINAL karena tidak ada awalan, tidak ada jarak, tidak ada urutan dan ada
klasifikasi.
2. Variabel Pendidikan
a.
Ciri
Awalan: tidak ada, karena kita boleh membuat peraturan sendiri, misalnya 3: SD,
4: SMP, 5: SMA, 6: PT walaupun tidak lazim tapi diperbolehkan
b.
Ciri
Jarak : tidak ada, karena 2 (SMP) * 2 (SMP) tidak sama dengan 4 (PT) dan tidak
bisa dilakukan operasi matematik lainnya.
c.
Ciri
Urutan : ada, karena 4 (PT) > 3 (SMA) > 2 (SMP) > 1 (SD)
d.
Ciri
Klasifikasi : ada, terdiri dari 4 kelompok yaitu 1 (SD), 2 (SMP), 3 (SMA) dan 4
(PT)
Kesimpulan :
Variabel Pendidikan termasuk jenis data ORDINAL karena tidak
ada awalan, tidak ada jarak, ada urutan dan ada klasifikasi.
3. Variabel Motivasi
a.
Ciri
Awalan: tidak ada, karena kita boleh membuat peraturan sendiri, misalnya 3:
Sangat Rendah, 4: Rendah, 5: Cukup, 6: Tinggi dan 7: Sangat Tinggi walaupun
tidak lazim tapi diperbolehkan
b.
Ciri
Jarak : tidak ada, karena 3 (Sangat Rendah) + 4 (Rendah) tidak sama dengan 7 (Sangat
Tinggi) dan tidak bisa dilakukan operasi matematik lainnya.
c.
Ciri Urutan
: ada, karena 5 (sangat tinggi) > 4 (tinggi) > 3 (cukup) > 2 (rendah)
> 1 (sangat rendah)
d.
Ciri
Klasifikasi : ada, karena terdiri dari 5 kelompok yaitu 1 (sangat rendah), 2
(rendah), 3 (cukup), 4 (tinggi) dan 5 (sangat tinggi).
Kesimpulan :
Variabel Motivasi termasuk
jenis data ORDINAL karena tidak ada awalan, tidak ada jarak, ada urutan dan ada
klasifikasi.
4. Variabel Warna Baju
a. Ciri Awalan: tidak ada, karena kita boleh
membuat peraturan sendiri, misalnya 2: Merah, 3: Kuning, 4: Hijau dan 5: Pink
walaupun tidak lazim tapi diperbolehkan
b. Ciri Jarak : tidak ada, karena 2 (Kuning)
+ 2 (Kuning) tidak sama dengan 4 (Pink) dan tidak bisa dilakukan operasi
matematik lainnya.
c. Ciri Urutan : tidak ada, karena 4 (Pink)
tidak lebih besar atau lebih baik dari 3 (Hijau) dan seterusnya
d. Ciri Klasifikasi : ada, terdiri dari 4
kelompok yaitu 1 (Merah), 2 (Kuning), 3 (Hijau) dan 4 (Pink)
Kesimpulan :
Variabel Warna Baju termasuk
jenis data ORDINAL karena tidak ada awalan, tidak ada jarak, ada urutan dan ada
klasifikasi.
5. Variabel Umur
a. Ciri Awalan: ada, karena mutlak dimulai 1,
kita tidak bisa mengatakan bahwa seseorang berumur 32 tahun adalah 20 tahun,
karena perhitungannya dimulai dari 12.
b. Ciri Jarak : ada, karena kita bisa
mengatakan bahwa umur Bambang (15) + umur Novi (20) sama dengan umur Siti (35)
demikian juga berlaku operasi matematik lainnya.
c. Ciri Urutan : ada, karena 40 > 35 >
32 > 30 ..... dan seterusnya.
d. Ciri Klasifikasi : tidak ada, karena
nilainya adalah unik jadi tidak ada pengelompokan
Kesimpulan :
Variabel Umur termasuk jenis
data RASIO karena ada awalan, ada jarak, ada urutan dan tidak ada klasifikasi.
6. Variabel Pendapatan
a. Ciri Awalan: ada, karena mutlak dimulai 1,
kita tidak bisa mengatakan bahwa seseorang mempunyai gaji 3.000.000 adalah
2.000.000 karena perhitungannya dimulai dari 1.000.000.
b. Ciri Jarak : ada, karena kita bisa
mengatakan bahwa pendapatan Silvi (1.750.00) + pendapatan Bambang (750.000) =
pendapatan Rudi (2.500.000).
c. Ciri Urutan : ada, karena 3.000.000 >
2.750.000 > 2.500.000 .... dan seterusnya.
d. Ciri Klasifikasi : tidak ada, karena
nilainya adalah unik jadi tidak ada pengelompokan
Kesimpulan :
Variabel Pendapatan termasuk jenis data RASIO
karena ada awalan, ada jarak, ada urutan dan tidak ada klasifikasi.
Untuk data metrik yang terdiri dari Rasio dan
Interval, maka jenis data Rasio yang sering banyak digunakan sedangkan jenis
data Interval jarang digunakan. Perbedaan dengan data Rasio adalah Rasio
mempunyai awalan dan Interval tidak mempunyai awalan. Contoh yang sering
digunakan untuk data Interval adalah suhu, karena untuk Celcius dimulai dari 1,
Farenheit dimulai dari 39 dan Kelvin dimulai 212. Didalam perangkat lunak SPSS
jenis data Rasio dan Interval ini dinyatakan sebagai jenis data ”SCALE”. Untuk
data non-metrik yang terdiri dari Ordinal dan Nominal keduanya digunakan secara
luas karena kedua jenis data tersebut memang banyak ditemui dilapangan. Didalam
perangkat lunak SPSS data Ordinal dan Nominal ini dinyatakan secara terpisah
yaitu ”ORDINAL” dan ”NOMINAL” tidak sebagaimana jenis data Rasio dan Interval
yang dijadikan satu sebagai jenis data yaitu ”SCALE”.
Sekian informasi yang dapat saya bagikan untuk kalian
semua, semoga bermanfaat dan jangan lupa untuk follow. Terima kasih, salam satu
buku cuit cuit cuit. Yorkshire Piramid.
No comments:
Post a Comment
Bagaimana pendapatmu tentang tulisan ini?