Mitos Rumus Slovin

Ada yang pernah dengar rumus Slovin?

Iya.. rumus ini sering sekali digunakan untuk menentukan besaran sampel. Saya sering heran kalau ada peneliti yang masih menggunakan rumus ini untuk menentukan/merencanakan besaran sampelnya. Saya akan coba menguraikan mengapa formula ini lebih tepat disebut mitos, sehingga rumus ini layak dimasukkan museum dan dianggap sebagai “the biggest myth” dalam penelitian survei. Rumusnya begini bunyinya…

n=N/1+(Ne2)

dimana n=ukuran sampel, N=ukuran populasi, e=sampling/margin of error

Keganjilan 1:
Kok bisa sampling/margin of error diinput dalam formula padahal parameter sampel masih unknown/belum diketahui?

Sampling error merupakan parameter yang sering digunakan untuk mengestimasi rentang kepercayaan (confidence interval) dan kalau peneliti menetapkan α=5% maka untuk menghitung sampling error berarti = standard error*1.96 (1.96 merupakan nilai Z dalam kurva normal dengan confidence level 95%).

Lha standard error sendiri diperoleh kalau sudah ada informasi tentang standar deviasi (SD) (atau proporsi/persentase). Dan tentu saja, SD (atau proporsi) baru bisa dihitung kalau datanya sudah ada. Lucu tho, bagaimana mungkin SD (proporsi) sampel belum diketahui, tapi peneliti sudah bisa nebak MoE-nya.

Mengapa SD ini penting dalam penentuan ukuran sampel? Bayangkan kalau dalam sebuah populasi tidak ada variasi (var=0, SD=0), maka menggunakan 1 sampel aja udah bisa merepresentasikan keseluruhan populasi. Contoh mudahnya… misalnya kalau dalam suatu populasi usia individunya semuanya sama 36 tahun, maka satu orang responden aja sudah bisa mewakili seluruh populasi. Kalo variasi dalam populasi besar, maka peneliti akan butuh jumlah sampel yang lebih besar agar representatif mewakili populasi.

Lalu saya coba simulasikan… seandainya saya menentukan besaran sampel menggunakan formula Slovin, apakah nanti tebakan MoE yang diinput ke rumus Slovin akan sama dengan MoE yang dikalkulasi dari simulasi data.

Semisal saya pingin tahu tingkat elektabilitas Prabowo dan Jokowi di kalangan mahasiswa Psikologi Unair yang jumlah total mahasiswanya 1000 mahasiswa. Maka kalau pakai rumus Slovin dengan MoE=5%…

#hitung sample size dg rumus Slovin dan diketahui N=1000 dan anggap aja MoE=5%
n <- 1000/(1+(1000*((0.05²)))); n

## [1] 285.7143

Dari rumus Slovin diatas, untuk mengestimasi elektabilitas pada populasi mahasiswa Fakultas Psikologi (N=1000) dengan MoE 5%, maka saya butuh setidaknya 286 orang sebagai sampel. Nah sekarang saya bikin simulasi data dengan sampel 286 orang dengan pemilih Prabowo 51% dan pemilih Jokowi sebanyak 49%.

##bikin simulasi data pada N=1000 dan n=286 (berdasarkan rumus Slovin) untuk mengestimasi pendukung Prabowo & Jokowi pada sampel dan populasi##

library(MASS) #package untuk estimasi ci & std error
set.seed(765/76)
psiVoters <- sample(c(“prabowo”,”jokowi”), 286, replace=TRUE, prob = c(0.51, 0.49))

#hitung SE
SE <- sqrt(0.51*(1–0.51)/286); SE

## [1] 0.02955971

#hitung MoE
MoE <- (SE*qnorm(.975))*100; MoE

## [1] 5.793596

#hitung ci
jokowi <- 49 + c(MoE, -MoE); jokowi

## [1] 54.7936 43.2064

prabowo <- 51 + c(MoE, -MoE); prabowo

## [1] 56.7936 45.2064

Nah, dari simulasi data diatas diketahui bahwa dengan n=286 orang, maka MoE (dengan α=5%) adalah kurang lebih 5.79%. Padahal tadi kita estimasikan (yang dimasukkan ke rumus Slovin) adalah 5%… nah, beda tho?

Oya, ada satu catatan tambahan ya…

Rumus Slovin hanya masuk akal kalau digunakan untuk penelitian yang tujuannya menghitung proporsi/persentase, bukan untuk penelitian korelasional apalagi untuk model testing 🙂

Kok gitu?

Lha MoE yang dimasukkan dalam rumus kan bentuknya persentase. Kalo mau estimasi korelasi/besaran efek misalnya, jauh lebih masuk akal yang dimasukkan adalah standard error yang satuannya mengikuti parameter yang diestimasi. Masalahnya, ora jelas yang dimaksud dalam rumus Slovin itu apaan, tapi banyak yang mengira ini merujuk pada MoE. Bahkan ada yang mengira ini adalah α. Tuambah ngawur.

Keganjilan 2:
MoE dan α, sama kah?

Jawabannya: Tidak. MoE adalah estimasi kesalahan sampling. Dalam kata lain, MoE adalah kalkulasi yang mencerminkan seberapa presisi parameter dalam sampel kita (bisa proporsi/persentase, bisa mean) dalam mengestimasi parameter yang sesungguhnya di populasi.

Parameter di populasi ini tidak diketahui (ya iyalah) oleh karena itu, our best guess adalah dengan mengestimasi rentangnya, yaitu disebut juga sebagai rentang kepercayaan (confidence interval).

Sedangkan α, yang sering dikira sebagai type 1 error (padahal bukan), adalah probabilitas peneliti menolak H0 yang sesungguhnya benar. Saya yakin banyak yang ketuker-tuker.. α dikira sama dengan MoE atau bahkan sama dengan nilai p (p-value)😅

Yang saya heran… ternyata ada yang menganjurkan untuk memasukkan nilai 0.05 sebagai estimasi error dalam rumus Slovin, karena mengasumsikan α=5%. Ini rasionalisasi yang jelas-jelas ga ada dasarnya.

Keganjilan 3:
Bagaimana dengan nasib type 2 error?

Dalam pendekatan null hypothesis significant testing (NHST) yang amat populer dan digunakan secara luas, kita seharusnya mempertimbangkan tidak hanya type 1 error (α) tapi juga type 2 error (β). Konsep dasarnya, statistical power akan meningkat apabila ukuran sampel yang digunakan semakin besar.

Statistical power (1-β): probabilitas peneliti mendeteksi adanya efek, dengan asumsi H1 (ada efek) yang benar.

Padahal, rumus Slovin hanya mempertimbangkan α, tetapi tidak mempertimbangkan statistical power. Padahal ukuran sampel berdampak langsung pada statistical power, sedangkan kalau statistical power sebuah studi ditemukan rendah, ya berarti kesimpulan yang dihasilkan dalam studi tersebut semakin ga akurat.

Untuk mengestimasi ukuran sampel dengan menggunakan power analysis, kita juga membutuhkan informasi berapa besaran efek (effect size) yang ingin kita deteksi, atau kalau dalam buku2 teks disebutkan sebagai least detectable effect size. Besaran efek yang ingin dideteksi ini dapat ditentukan dari penelitian2 sebelumnya, namun peneliti juga bisa aja menentukan/mengestimasi berdasarkan justifikasi tertentu.

Untuk menentukan ukuran sampel dengan pendekatan power analysis, ada beberapa software yang dapat digunakan seperti G*Power, NCSS, eTap atau PASS. Yang paling populer, user friendly dan saya juga rekomendasikan untuk digunakan adalah G*Power.

Alternatif sample size planning yang lain adalah menggunakan algoritma Monte Carlo simulation (digunakan untuk menentukan ukuran sampel di penelitian yang menguji indirect effect dalam mediation analysis) atau accuracy in parameter estimation (digunakan ketika peneliti ingin memperkecil rentang CI parameter-parameter di model statistiknya).

Keganjilan 4:
Siapa sih sebenarnya Slovin ini?

Saya jujur aja heran.. kenapa sih peneliti yang menggunakan rumus Slovin ga penasaran untuk mencari, Slovin ini sebenarnya siapa dan buku teks apa yang mencantumkan rasionalisasi formula ini.

Menariknya, ketika saya coba cari literatur tentang Slovin ini, kebanyakan berasal dari Indonesia dan ga ada satupun yang menyertakan kutipan buku teks yang jelas sebagai sumber.

Ternyata yang bingung ga cuma saya aja. Rupanya mitos rumus Slovin juga merebak di Filipina. Saya menemukan thread di ResearchGate yang isinya menarik.

Thread 1: Do researchers in your country also use Slovin formula?
Thread 2: Who is Slovin?

Kesimpulannya: Slovin ini tidak jelas siapa. Tidak ada buku teks/artikel terbitan berkala ilmiah yang mendokumentasikan bagaimana rumus ini diturunkan. Sehingga, cerita tentang rumus Slovin sebenarnya tidak jauh beda dengan Legenda Suro dan Boyo.

Oleh karenanya… para hamba Allah yang mengimani Slovin, hendaknya segera bertaubat dengan memperbarui bacaan buku metodologinya 🙂

Leave a Comment Here

This site uses Akismet to reduce spam. Learn how your comment data is processed.