SAMPLING
DAN ESTIMASI
A. Pengertian
Sampling
Sampling adalah Proses memilih sebagian (sampel)
dari kelompok besar (populasi), untuk menjadi dasar memperkirakan (estimasi)
situasi atau outcome yang ada di populasi tersebut. Bagian yang diamati disebut sampel, sedangkan kumpulan
objek penelitian disebut populasi. Objek penelitian dapat berupa orang,
umpi, organisasi, kelompok, lembaga, buku, kata-kata, surat kabar dan
lain-lain. Dalam penelitian, objek penelitian ini disebut satuan
analisis (units of analysis) atau unsur-unsur populasi.
Sampling yang baik: penghematan biaya dan waktu menjaga keakuratan
hasil-hasilnya. Secara khusus teknik sampling berguna dalam :
Ø Estimasi
parameter populasi (seperti mean populasi, varians populasi dan
lain-lain.) yang tidak diketahui berdasarkan pengetahuan tentang statistik sampel
(seperti mean sampel, varians sampel, dan lain-lain.) yang berkaitan.
Ø Menentukan
apakah perbedaan yang teramati pada dua sampel adalah benar-benar signifikan
(berarti) atau karena variasi yang kebetulan sifatnya.
Karakteristik sampel disebut statistik
yaitu bertujuan untuk menduga secara cermat parameter dari statistik. Metode
pendugaan inilah yang dikenal sebagai teori sampling. Ini
berarti sampel harus mencerminkan semua unsur dalam populasi secara
proporsional. Sampel seperti itu dikatakan sampel tak bias (unibased sample)
atau sampel yang representatif. Sebaliknya sampel bias adalah sampel yang tidak
memberikan kesempatan yang sama pada semua unsur populasi untuk dipilih. Sampel
mungkin menunjukkan karakteristik yang menyimpang dari karakteristik populasi.
Penyimpangan dari karakteristik populasi disebut galat sampling (sampling
error). Jadi, galat sampling adalah perbedaan antara hasil yang diperoleh
dari sampel dengan hasil yang didapat dari sensus (Neter, Wasserman, Whitmore,
1979: 195). Statistik dapat membantu
menentukan sampling error hanya bila menggunakan sampel tak bias.
Sampel
tak bias adalah sampel yang ditarik berdasarkan probabilitas (probability
sampling). Dalam sampel probabilitas, setiap unsur populasi mempunyai nilai
kemungkinan tertentu untuk dipilih. Karena sampel ini mengasumsikan
kerandoman (randomness), maka sampel probabilitas lazim juga
disebut sebagai sampel random. Bila kita mengambil sampel tertentu
berdasarkan pertimbangan-pertimbangan tertentu, kita memperoleh sampel
pertimbangan (judgemental sampling), disebut juga sampel
non-probabilitas. Untuk kedua jenis sampling ini, ada beberapa alternatif
teknik penelitian sampel. Teknik penarikan sampel sering disebut rencana
sampling atau rancangan sampling (sampling design).
B. METODE SAMPLING
Metode sampling yaitu cara pengumpulan
data yang hanya mengambil sebagianpopulasi. Ada tiga macam metode sampling,
yaitu :
1. Sampling tunggal, sampel yang diperlukan hanya satu
sampel dari sebuahpopulasi dan besarnya sampel harus memadai sehingga dapat
mewakilipopulasinya (representatif).
2. Sampling ganda, yaitu dari sebuah populasi dapat
diambil satu, satu sampelkedua, jika yang pertama dianggap belum cukup mewakili
dalam pengambilankeputusan. Kemudian digabungkan
untuk dijadikan sebagai bahan analisis.
3. Sampling multiple (lebih dari dua), yaitu untuk
memenuhi asumsi bahwapengambilan keputusan
masih dirasa belum cukup hanya dari dua sampel saja.Alasan-alasan dipilihnya metode sampling, yaitu :
a. Objek penelitian yang homogen
b. Objek penelitian yang mudah
rusak
c. Penghematan
biaya dan waktu.
d. Masalah ketelitian.
e. Ukuran populasi
C.
Rancangan
Sampling
Ada empat rancangan sampling dalam
kategori sampel probabilitas: (1) sampling random sederhana, (2) sampling
sistematis, (3) sampling berstrata, dan (4) sampling Master. Kita akan
membicarakan hal-hal praktis dari setiap rancangan ini. Sampling random
sederhana adalah yang paling banyak dipakai. Untuk menarik sampel
seperti ini, kita dapat menuliskan semua unsur populasi dalam secarik kertas,
kemudian mengundinya sampai kita memperoleh jumlah yang dikehendaki.
Unsur-unsur yang jatuh itulah yang menjadi sampel. Cara ini tidak praktis bila
populasinya besar. Karena itu, umumnya peneliti menggunakan cara kedua:
menggunakan tabel random (lihat Lampiran 3). Apa pun metode yang digunakan,
sampling random sederhana harus memiliki kerangka sampling (sampling
frame). Kerangka sampling adalah daftar lengkap semua unsur populasi. Jadi,
bila populasi kita penduduk Desa Bojongsalam, maka kita harus memiliki daftar
penduduk Desa Bojongsalam yang lengkap, kita harus menomori setiap orang dari 1
sampai N. Berdasarkan kerangka sampling, ditarik sejumlah orang, yang nanti
menjadi sampel.
Sampling sistematis juga
menggunakan kerangka sampling. Hanya di sini, unsure yang pertamalah yang
dipilih secara random. Unsur-unsur lainnya ditarik dengan mengambil jarak
tertentu. Misalnya, populasi berjumiah 1000. Kita hanya memerlukan 40 unsur.
Perbandingan ukuran populasi dengan ukuran sampel, yakni 40/1000 = 25, disebut sampling
rasio. Untuk contoh kita, misalkan unsur yang pertama kita pilih nomor 10.
Nomor-nomor berikutnya yang menjadi sampel ialah 35, 60, 85, 110, ..., 960,
985. Sampling berstrata, seperti ditunjukkan namanya, melibatkan
pembagian populasi ke dalam kelas, kategori, atau kelompok yang disebut strata.
Karakteristik strata boleh jadi kota, daerah, suku bangsa, jenis kelamin,
status, usia, dan sebagainya.
Ada dua jenis sampel strata: proporsional
dan disproporsional. Dalam sampel strata
proporsional,
dari setiap strata diambil sampel yang sebanding dengan besar setiap strata.
Angka yang menunjukkan berapa persen dari setiap strata diambil disebut pecahan
sampling (sampling fraction). Pada sampel strata, pecahan sampling untuk
setiap strata sama. Cara ini akan mengalami kesukaran bila ada sebagian strata
yang jumlahnya terlalu kecil atau sebagian lagi terlalu besar. Bila ada 10.000
orang mahasiswa dan 10 orang dosen, lalu dari setiap strata kita ambil 10%,
kita memperoleh sampel yang terdiri dari 1.000 orang mahasiswa dan I orang
down. Dalam hal seperti itu disarankan metode sampling strata disproporsional.
Di sini, dari setiap strata diambil jumlah sampel yang sama. Nanti dalam
analisis data, dan data untuk setiap strata dikalikan dengan bobot strata
tersebut.
Sampling klaster (cluster
sampling) dilakukan bila kita tidak mempunyai kerangka sampling. Misalnya,
kita ingin meneliti anak-anak SD Kotamadya Bandung. Tidak mungkin kita
menghimpun semua anak SD dalam daftar. Selain mungkin daftar itu akan terlalu
panjang, data tentang itu sukar diperoleh. Bila daftar nama anak SD sukar kita
buat, kelompok anak berdasarkan nama sekolahnya mudah kita buat. Kelompok anak
itu disebut klaster. Master dapat berupa sekolah, kelas, kecamatan, desa, RW,
RT, dan sebagainya. Bila klaster itu bersifat geografis, sampling klaster dapat
dilakukan satu tahap (single stage). Misalnya, kita ingin meneliti penduduk
Desa Bojongsalam. Desa ini terdiri dari 12 RK. Dari daftar RK, kita pilih
secara random 3 RK. Semua umpi pada 3 RK itu kita jadikan sampel. Bila pada
setiap RK kita memilih hanya 4 RT saja secara random, kita melakukan sampel
klaster banyak tahap (multistage).
Rancangan sampling nonprobabilitas,
seperti disebutkan di atas, tidak menggunakan prinsip kerandoman. Yang termasuk
ke sini antara lain: (1) sampling kebetulan (accidental sampling), yaitu
mengambil sampel siapa saja yang ada atau kebetulan ditemui, (2) sampling kuota
(quota sampling), yaitu menetapkan jumlah tertentu untuk setiap strata
lalu meneliti siapa saja yang ada sampai jumlah itu terpenuhi, (3) sampling
purposif, yaitu memilih orang-orang tertentu karena dianggap - berdasarkan
penilaian tertentu - mewakili statistik, tingkat signifikansi, dan prosedur
pengujian hipotesis, tidak berlaku bagi rancangan sampling nonprobabilitas.
D. Sampling
acak (random sampling)
Suatu kesimpulan yang diambil berdasarkan sampel harus:
Ø valid
Ø dapat dipercaya
Sampel dipilih sedemikian hingga mewakili populasi sampling
acak (setiap anggota populasi memiliki kesempatan yang sama untuk terpilih
sebagai sampel). Suatu teknik untuk mendapatkan sampel acak adalah
dengan memanfaatkan bilangan acak (random numbers).
Populasi
terhingga dan tak terhingga
Ø Populasi
terhingga (finite population) adalah populasi yang jumlah seluruh anggotanya
tetap dan dapat didaftar.
Ø Populasi
tak terhingga (infinite population) memiliki anggota yang banyaknya tak
terhingga.
Sampling
dengan dan tanpa pergantian
Ø Sampling
dimana setiap anggota sebuah populasi bisa terpilih lebih dari sekali (terpilih
kembali setelah terpilih sebelumnya) disebut sampling dengan pergantian.
Ø Jika
anggota populasi tidak bisa terpilih lebih dari sekali (yang telah terpilih
tidak bisa dipilih lagi) disebut sampling tanpa pergantian.
Ø Untuk
sebuah populasi yang tak terhingga, sehimpunan variable acak X1, X2, X3, …,
Xn-1, Xn, yang dapat mengambil berapa saja nilai yang mungkin akan membentuk
sebuah sampel acak dari populasi jika :
Ø Xi
saling bebas secara statistic
Ø Masing-masing
Xi mengikuti fungsi distribusi probabilitas yang mengatur populasi
Ø Untuk
suatu populasi terhingga sejumlah N, jika sampling dilakukan tanpa pergantian,
sehimpunan variabel acak X1, X2, X3,…, Xn-1, Xn, yang dapat mengambil berapa
saja nilai yang mungkin akan membentuk sebuah sampel acak dari populasi jika :
Ø sampling
dilakukan dengan cara sedemikian hingga seluruh kombinasi NCn sampel yang
mungkin, memiliki probabilitas yang sama untuk bisa terpilih.
E. Distribusi sampling
Seluruh kemungkinan sampel berukuran n yang
dapat dibentuk dari suatu populasi:
untuk
masing-masing sampel dapat dihitung sebuah statistic sampel seperti mean,
deviasi standard, dll., yang nilainya tentu akan berbeda-beda à bisa diperoleh
suatu distribusi dari nilai statistik sampel-sampel tersebut. Distribusi ini
dinamakan distribusi sampling.
Ø distribusi
sampling dari mean sampel (sampling distribution of the mean)
Ø distribusi
sampling dari deviasi standard, varians, median, proporsi, dll
Kemudian terhadap masing-masing jenis distribusi
sampling inipun dapat dihitung nilai-nilai mean, deviasi standard (error
standard), dll.
a. Distribusi
sampling dari mean
Distribusi sampling dari mean-mean sampel
adalah distribusi mean-mean aritmetika dari seluruh sampel acak berukuran n
yang mungkin yang dipilih dari sebuah populasi.
Mean
dan deviasi standart distribusi sampling mean
Untuk nilai n yang besar (n > 30), distribusi
sampling mean mendekati suatu distribusi normal terlepas dari bentuk asli
distribusi populasinya. Jika populasinya memiliki distribusi normal,maka
distribusi sampling mean juga terdistribusi secara normal untuk nilai n
berapapun (tidak tergantung ukuran sampel). Deviasi standard dari sebuah
distribusi sampling mean disebut
juga
dengan error standard daripada mean.
Ø Jika
sampling dilakukan tanpa pergantian dari suatu populasi terhinga berukuran N,
maka:
Ø
Jika sampling dilakukan dengan pergantian atau populasinya tak terhingga,
maka:
Contoh soal:
Lima ratus cetakan logam memilki berat rata-rata
5,02 N dan deviasi standard 0,30 N. Probabilitas bahwa suatu sampel acak dengan
ukuran sampel 100 cetakan yang dipilih akan mempunyai berat total antara 4,96
sampai 5,00 N dapat ditentukan sbb. Distribusi sampling mean persoalah
diatas memiliki:
Seratus sampel cetakan memiliki berat total 496
sampai 500 N jika rata-ratanya adalah 4,96 sampai 5,00 N. Jadi dengan
menggunakan table distribusi normal standard skor z adalah:
b. Distribusi
sampling dari proporsi
Distribusi sampling dari proporsi adalah
distribusi proporsi-proporsi dari seluruh sampel acak berukuran n yang
mungkin yang dipilih dari sebuah populasi.
Ø Jika
probabilitas sukses populasi adalah π sementara probabilitas gagalnya adalah
q =1 - p dan
samplingnya tanpa pergantian dari populasi terhinga berukuran N
Ø Jika sampling dilakukan dengan pergantian atau populasinya tak
terhingga, maka:
Untuk nilai n yang besar (n > 30),
distribusi sampling proporsi mendekati suatu distribusi normal. Sedangkan
populasinya mengikuti distribusi binomial. Perlu diperhatikan bahwa proporsi
adalah variabel diskrit sehingga diperlukan faktor koreksi (±1/2n ) dalam
mengubahnya kedalam skor z untuk menentukan probabilitas (kurang/lebih dari)
suatu nilai proporsi tertentu dengan menggunakan tabel distribusi normal.
Contoh
soal:
Divisi pengendalian mutu pabrik perkakas mesin
mencatat bahwa 2 % dari mata bor yang diproduksi mengalami cacat. Jika dalam
pengiriman satu batch produk terdiri dari 400 mata bor, tentukan probabilitas
banyaknya mata bor yang cacat 3 % atau lebih?
Distribusi sampling proporsi,
Koreksi untuk variabel diskrit =1/2n = 1/(2)(400)
==1/800 = 0,00125. Proporsi (3 %) setelah dikoreksi, P = 0,03 - 0,00125
= 0.02875 Skor z untuk P = 0,02875 adalah:
Maka probabilitas mata bor yang cacat dengan
proporsi lebih dari 3 %:
c. Distribusi
sampling dari perbedaan dan penjumlahan
Terdapat dua populasi Untuk setiap sampel berukuran n1
dari populasi pertama dihitung sebuah statistik S1 dan menghasilkan
sebuah distribusi sampling dari statistik S1 yang memiliki mean ms1 dan
deviasi standard ss1.
Dari populasi kedua, untuk setiap sampel berukuran n2 dihitung statistik
S2 yang akan menghasilkan sebuah distribusi sampling dari
statistik S2 yang memiliki mean ms2 dan
deviasi standard ss2.
Ø Distribusi
sampling perbedaan S1 – S2 memiliki:
Distribusi
sampling penjumlahan S1 + S2 memiliki
Contoh
soal:
Lampu bohlam A memiliki daya tahan rata-rata 1400
jam dan deviasi standard 200 jam, sementara lampu B memiliki daya tahan
rata-rata 1200 jam dengan deviasi standard 100 jam. Jika dari masing-masing produk
dipilih 125 bohlam sebagai sampel, maka probabilitas bahwa bohlam A memiliki
daya tahan sekurang-kurangnya 160 jam lebih lama dibandingkan bohlam B dapat
ditentukan sebagai berikut Mean dari distribusi sampling perbedaan daya tahan
bohlam A dan B:
Deviasi standardnya adalah:
Skor z untuk perbedaan mean 160 adalah:
Jadi probabilitas yang akan ditentukan adalah:
F. Pengertian Estimasi
Dugaan
(Estimate) :
nilai spesifik atau kuantitas
daripada sebuah statistic misalnya:
nilai mean sampel, persentase sampel, atau varians sampel. Penduga (Estimator)
: setiap statistik (mean sampel, persentase sampel, varians sampel, dan
lain-lain) yang digunakan untuk menduga sebuah parameter. Penduga tak-bias (unbiased
estimator) : sebuah penduga yang menghasilkan suatu distribusi sampling
yang memiliki mean sama dengan parameter populasi yang akan diduga. Penduga
terbaik (best estimator): penduga yang memenuhi syarat-syarat sebagai
suatu penduga tak-bias dan juga memiliki
varians yang terkecil (minimum). Teori pendugaan (ESTIMASI/PENAKSIRAN) adalah suatu
proses dengan menggunakan statistic sampel untuk menduga parameter populasi. Dalam membuat estimasi harga parameter populasi, seyogyanya variable random
harga statistic sampel tidak bervariasi terlalu jauh dari harga parameter
populasi yang konstan. Misalnya, jika μ merupakan mean populasi dan X merupakan
penduga bagi μ, maka dalam menggunakan X sebagai penduga kita harus berharap
variable random X tidak akan menyimpang terlalu jauh dari μ. Penduga yang baik memiliki
beberapa sifat:
1.
Tidak bias/ Unbiased
2.
Efisien
3.
Konsisten
a. Cara menduga harga parameter
Harga parameter dapat diestimasikan/
diduga dengan dua cara, yakni:
1.
Point estimation (Pendugaan Titik)
Adalah suatu nilai (suatu titik) yang digunakan untuk menduga suatu parameter
populasi.
¡ penduga titik untuk m
¡ penduga titik untuk s2
¡ penduga titik untuk P
dengan:
2.
Interval estimation (PendugaanInterval).
Adalah suatu interval yang menyatakan selang dimana suatu parameter
populasi mungkin berada. Dalam prakteknya,
pendugaan tunggal yang terdiri atas satu angka tidak memberikan gambaran mengenai
berapa jarak/ selisih nilai penduga tersebut terhadap nilai sebenarnya. Hal ini
didasarkan atas pertimbangan bahwa suatu nilai dugaan tidak mungkin dapat dipercaya
100%. Pendugaan interval menunjukkan pada interval berapa suatu parameter populasi
akan berada yang dibatasi oleh dua nilai, yang disebut nilai batas bawah dan nilai
batas atas.
Misal:
rata–rata modal akan terletak dalam interval antara 95juta – 105 juta. Kita
mengharapkan bahwa nilai rata–rata sebenarnya akan terletak didalam interval
tersebut. Interval yang demikian disebut interval keyakinan atau selang keyakinan.
Untuk membuat pendugaan interval, harus ditentukan terlebih dahulu besarnya koefisien
keyakinan atau tingkat keyakinan, yang diberi symbol 1-α. Besarnya nilai 1-α,
misalnya adalah 90%, 95%, 99%, atau yang lainnya. Perhatikan kurva normal
berikut: (luaskurva= 1 atau100%).
1-α: koefisien keyakinan/ tingkat keyakinan
α : taraf signifikan atau besarnya kesalahan yang ditolerir dalam membuat keputusan
P(-zα/2<Z<zα/2)
= 1 –α dimana Z = (X-μ)/(σ/√n)
Terdapat
2 rumus pendugaan interval rata –rata μ, yaitu:
1.
Rumus
ini berlaku untuk sampel besar (n≥30)
a.
Dari
populasi yang tak terbatas atau dari populasi terbatas akan tetapi penarikan sampel
dilakukan dengan pengembalian.
Interval
kepercayaan (1 - a)
untuk menduga rata-rata m,
bila s
diketahui
![]() |
Bila s tidak diketahui, maka dapat
digunakan penduga dari s yaitu S.
Contoh:
Mean dan simpangan baku dari
IPK sekelompok 36 orang mahasiswa adalah 2.6 dan 0.3. Tentukan selang kepercayaan
95% dan 99% untuk nilai mean-nya.
Jawab: Titik estimasi adalah x = 2.6. Karena cuplikan berukuran besar,
simpangan baku σ dapat didekati dengan s = 0.3. Nilai z yang memberikan luas daerah
dibawah kurva sebesar 0.025 disebelah kanan, atau 0.975 disebelah kiri, adalah z
0.025= 1.96 (dariTabel). Oleh karena itu, selang kepercayaan 95% adalah
2.6 - (1.96)(0.3/√36) < μ< 2.6 + (1.96)(0.3/√36)
atau:
2.50 < μ< 2.70
Dengan cara yang sama, selang kepercayaan 99% memerlukan z0.005=
2.575 dan selang kepercayaan ini adalah:
2.6 -(2.575)(0.3/√36) < μ< 2.6 + (2.575)(0.3/√36)
atau: 2.47 < μ< 2.73
Terlihat selang ini lebih lebar dari sebelumnya.
b. Pendugaan perameter proporsi P:
Interval kepercayaan (1 - a) untuk menduga proporsi P adalah:
c. Pendugaan parameter beda
dua rata-rata (m1 - m2)
Interval kepercayaan (1 - a) untuk menduga beda dua rata-rata m1 - m2 :
2. Rumus ini berlaku untuk Sampel Kecil ( n < 30 )
a. Pendugaan parameter rata-rata m :Interval kepercayaan (1 - a) untuk menduga rata-rata m. dengan sampel kecil, bila s tidak diketahui adalah:
Contoh:
Diketahui data dengan ukuran 25, mempunyai rata-rata 50 dan standard
deviasi 8. Berapa interval kepercayaan untuk menyatakan populasi bila ditentukan
derajat kepercayaan 90%?
b. Pendugaan parameter beda
dua rata-rata (m1 - m2)
Ø Misalkan diketahui dua populasi masing-masing
mempunyai rata-rata m1 dan m2 , dan distribusinya mendekati normal.
Ø Misalkan variansi dua populasi
itu sama yaitu s12 = s22 = s2 tetapi tidak diketahui berapa besarnya.
Simpangan baku gabungan adalah
Ø bila variansi dua populasi itu
tidak sama besarnya yaitu s12 ¹ s22 dan kedua variansi tidak
diketahui nilainya, maka interval kepercayaan (1-a) untuk beda
dua rata-rata (m1 - m2) dari dua populsai tersebut adalah :
dengan derajat kebebasan :
c.
Pendugaan parameter beda dua rata-rata (m1 - m2) jika kedua sampel tidak
bebas :
Misalnya
bila pengamatan dalam kedua sampel diambil secara berpasangan sehingga kedua
sampel saling terkait, maka interval kepercayaan (1-a) untuk beda dua
rata-rata (m1 - m2 =
md)
dari dua populasi tersebut adalah :
Dimana derajat
kebebasan u = n - 1
Comments
Post a Comment