Sumber: https://www.xlstat.com/


Apa itu Propensity Score Matching?



Setelah Rosenbaum dan Rubin (1983) menulis artikel tentang propensity score analysis, analisis skor kecenderungan telah berkembang secara eksponensial selama beberapa dekade. Sebelum membahas tentang PSM, ada baiknya terlebih dahulu mengetahui tentang maksud dari skor kecenderungan atau propensity score tersebut. Secara sederhana, skor kecenderungan adalah probabilitas (dari 0 hingga 1) dari suatu kasus yang berada dalam kelompok tertentu berdasarkan sekumpulan kovariat yang diberikan. Umumnya dihitung menggunakan regresi logistik dengan kelompok (treatment/control) sebagai dependen, kovariat sebagai variabel independen atau yang lebih dikenal sebagai variabel X.

Skor kecenderungan adalah skor penyeimbang: Perbedaan antara kelompok-kelompok pada kovariat terkondensasi menjadi skor tunggal sehingga jika nilai skor kecenderungan dari dua kelompok tersebut seimbang maka secara otomatis nilai seluruh kovariat juga seimbang.

Kelompok treatment adalah kelompok yang mendapat perlakukan tertentu sesuai dengan tujuan penelitian. Sedangkan kelompok kontrol adalah kelompok yang tidak mendapatkan perlakuan.



Kenapa menggunakan Propensity Score Matching?

Terdapat berbagai macam metode dalam analisis dampak terhadap pemberian suatu perlakukan. Seperti randomized experiment methods, Heckman two-step technique, propensity score matching, double difference (DD), instrumental variable (IV), regression discontinuity (RD) dan pipeline methods (Rosenbaum and Rubin, 1983; Khandker et al., 2010). Metode yang umumnya digunakan adalah metode eksperimen.

Salah satu standar penelitian eksperimen adalah adanya randomisasi, yaitu meletakkan subjek penelitian dalam kelompok perlakuan atau kelompok kontrol berdasarkan pengacakan. Metode eksperimen akan secara random mengalokasikan treatment kepada subjek penelitian secara individu maupun kelompok. Pengacakan akan mengeliminasi bias (penyimpangan) seleksi dengan cara menyeimbangkan baik faktor yang diketahui dan yang tidak. Keuntungan utama dari pendekatan ini terdapat pada kesederhanaan dalam menginterpretasikan hasil analisis. Namun tidak dapat dipungkiri bahwa metode eksperimen tidak jarang membutuhkan biaya yang besar dan waktu yang cukup lama (Bai, 2011).

Selain itu di lapangan terkadang kondisi ini tidak mungkin dilakuan. Misalnya ketika ingin menganalisis dampak dari adanya program asuransi usahatani padi (AUTP) terhadap pendapatan petani, peneliti tidak bisa menentukan petani mana yang diharuskan mengikuti AUTP dan mana yang tidak. Pemilihan sampel penelitian dilakukan berdasarkan seleksi mandiri (self selection). Terkadang self selection akan menghasilkan temuan yang bias. Karena peneliti tidak bisa mengendalikan variabel-variabel diluar perlakuan yang mempengaruhi efek perlakuan. Disinilah peran analisis PSM dalam mengatasi keterbatasan tersebut. PSM dapat mereduksi bias pada penelitian degan cara menyeimbangkan distribusi dan karakter yang diobservasi (kovariat) natara kelompok treatment dan control.


Bagaimana cara kerja Propensity Score Matching?

Terdapat empat langkah utama dalam analisis PSM yaitu:
  1. Estimasi skor kecenderungan (propensity score). Dapat diestimasi meggunakan berbagai macam metode, seperti: analisis diskriminan, regresi logistic, dan random forest. Secara umum tidak dapat ditentukan mana metode yang paling terbaik, namun metode yang paling populer adalah regresi logistic.
  2. Memilih algoritma pemadanan.
  3. Evaluasi kualitas hasil pemadanan.
  4. Analisis hasil setelah pemadanan atau metode terkait.

(Lebih detail dapat dibaca pada buku yang ditulis oleh Wei pan dan Haian Ban. Tutorial analisis PSM akan di share pada postingan selanjutnya)


Batasan Analisis Propensity Score Matching

Selain segala kelebihan PSM yang telah disebutkan, terdapat keterbatasan dari analisis ini yaitu (Mario D Hair):
  1. Hanya dapat mencakup dua grup (treatment dan control). Jika terdapat lebih dari dua grup maka harus dilakukan analisis secara berpasangan.
  2. Skor kecenderungan hanya berfungsi sebagai prediktor.
  3. Sor kecendrungan tidak bisa dihasilkan jika terdapat data yang hilang.
  4. Tidak berhubungan dengan seluruh aspek dari model regresi logistik yang dihasilkan, melainkan hanya melihat probabilitasnya. 


Untuk menghindari hal yang tidak diinginkan, Rosenbaum dan Rubim merekomendasikan untuk terlebih dahulu memeriksa apakah skor kecenderungan yang dihasilkan telah seimbang. Detail dari proses pemeriksaan tersebut dapat dibaca pada paper mereka yang rilis tahun 1983 (dan akan dibahas pada tutorial PSM di postingan selanjutnya). Hal ini merupakan prosedur sederhana, namun penting untuk diperhatikan.


Referensi:

Bai H (2011a) A comparison of propensity score matching methods for reducing selection bias. Int J Res Method Educ 34(1):81–107

Khandker, S., Koolwal, G. & Samad, H., (2010). Handbook in Impact Evaluation: Quantitative Methods and Practices. Washington D.C.: The World Bank.

Mario D Hair (http://www.spssusers.co.uk/Events/2015/HAIR2015.pdf)

Rosenbaum, P. R., dan D. B. Rubin. 1983. Central Role of the Propensity Score in Observational Studies for Causal Effects. Biometrika. 70(1):41-55.