
Pengantar Model Bayesian Sederhana
Model Bayesian menggunakan teorema Bayes guna memperbarui keyakinan tentang parameter
yang ada pada data
, dimana terdiri dari tiga komponen utama, yaitu:
- Prior: Distribusi awal parameter (misalnya, Beta untuk probabilitas)
- Likelihood: Probabilitas data berdasarkan parameter
- Posterior: Distribusi parameter yang diperbarui setelah melihat data
Jenis Distribusi Probabilitas dalam Model Bayesian
1. Distribusi Normal
Distribusi normal dikenal juga sebagai distribusi Gaussian, dimana digunakan untuk memodelkan data kontinu yang cenderung terdistribusi secara simetris di sekitar rata-rata.
Notasi:

Contoh: Mengestimasi rata rata tinggi siswa di sekolah berdasarkan sampel kecil.
2. Distribusi Binomial
Distribusi binomial digunakan untuk menghitung jumlah keberhasilan dalam sejumlah percobaan tertentu, dimana setiap percobaan memiliki dua kemunngkinan hasil (sukses atau gagal).
Notasi:

Contoh: Berapa banyak pelanggan yang membeli produk 100 pengunjung website?
3. Distribusi Beta
Distribusi beta digunakan untuk memodelkan probabilitas atau proporsi yang terletak antara 0 dan 1, dimana distribusi ini berguna dalam menggambarkan variabel yang bersifat proporsional.
Notasi:

Contoh: Memperkirakan peluang klik pada iklan digital (CTR)
4. Distribusi Gamma
Distribusi gamma digunakan untuk memodelkan waktu antarkejadian atau untuk data positif kontinu lainnya, dimana sering kali digunakan dalam analisis waktu dan reliabilitas.
Notasi:

Contoh: Berapa lama rata rata pelanggan menunggu pesanan mereka di restoran?
Konsep Konjugasi Prior-Posterior
Salah satu konsep penting dalam Bayesian adalah konjugasi prior-posterior, yaitu ketika bentuk distribusi prior tetap sama dengan posterior setelah proses pembaruan. Hal ini membuat perhitungan menjadi lebih sederhana.
Tabel Distribusi Konjugat

Langkah- Langkah Menggunakan Model Bayesian
- Tentukan model probabilitas yang sesuai dengan jenis data Anda (misalnya, Binomial untuk jumlah keberhasilan).
- Pilih distribusi prior berdasarkan pengetahuan awal Anda atau gunakan prior non-informatif jika tidak ada informasi awal.
- Hitung distribusi posterior menggunakan Teorema Bayes.
- Validasi model dengan membandingkan hasil estimasi dengan data nyata atau menggunakan simulasi.
- Gunakan hasil posterior untuk pengambilan keputusan atau prediksi
Contoh Kasus Nyata
Misalkan Anda memiliki sebuah website yang menampilkan iklan, dan Anda ingin memperkirakan peluang klik pada iklan tersebut. Berdasarkan data sebelumnya, Anda percaya bahwa peluang klik (CTR) berada di sekitar 30%. Anda ingin menggunakan pendekatan Bayesian untuk memperbarui estimasi ini berdasarkan data baru.
Data Awal
- Prior: Kita mulai dengan distribusi Beta sebagai prior. Misalkan kita menggunakan prior Beta(2, 5), yang menunjukkan keyakinan awal bahwa CTR sekitar 28,6% (2 keberhasilan dari 7 percobaan).
- Data Baru: Dari 100 pengunjung website, terdapat 15 yang mengklik iklan.
Langkah Manual
1. Tentukan Prior:

2. Hitung Likelihood:
Data baru menunjukkan bahwa dari 100 pengunjung, 15 orang mengklik iklan. Maka likelihood-nya adalah:

3. Hitung Posterior:
Posterior juga mengikuti distribusi Beta karena prior dan likelihood-nya konjugat:

Di mana
- k = 15 (Jumlah Keberhasilan)
- n = 100 (Jumlah total percobaan)
Maka,

4. Estimasi CTR:
Rata-rata dari distribusi posterior Beta(17, 90) adalah:

Jadi, estimasi CTR setelah melihat data baru adalah sekitar 15,9%.
Implementasi di R studio
Berikut adalah kode untuk menghitung estimasi CTR menggunakan R:

Ouput

Grafik distribusi posterior yang dihasilkan menunjukkan bagaimana peluang klik iklan (CTR) diperbarui setelah melihat data baru. Kurva pada grafik mewakili distribusi posterior, dengan puncaknya menunjukkan nilai CTR yang paling mungkin, yaitu sekitar 15,9%. Garis vertikal merah menandai rata-rata CTR, memberikan estimasi terbaik berdasarkan data. Bentuk kurva yang cenderung sempit menunjukkan bahwa model cukup yakin dengan estimasi ini. Semakin tinggi dan tajam kurva di sekitar rata-rata, semakin kecil ketidakpastian dalam estimasi. Grafik ini membantu memahami bagaimana data baru memengaruhi keyakinan awal kita, memberikan wawasan yang lebih baik untuk pengambilan keputusan berbasis data.
Referensi
Puspitawati, R., & Santoso, H. B. (2019). Estimasi Parameter Survival dan Aplikasinya dalam Analisis Data Kesehatan. Jurnal Statistika dan Aplikasinya, 15(2), 123-135.
Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., & Rubin, D. B. (2013). Bayesian Data Analysis (3rd ed.). Chapman and Hall/CRC.
Populix. (2023). Konsep Utama Bayesian: Penerapan dalam Analisis Bisnis dan Marketing. Diakses dari populix.co.id.
StatLect. (2025). Parametric Bayesian Models. Diakses dari statlect.com.
Kantinit, R. (2023). Implementasi Naive Bayes dalam Klasifikasi Data. Jurnal Informatika, 10(1), 45-60.
Nanovest. (2024). Aplikasi Finansial Bayes: Mengoptimalkan Investasi dengan Pendekatan Bayesian. Diakses dari nanovest.com.
Yani, F., & Prabowo, A. (2020). Inferensi Variansi Normal dalam Statistik Bayesian. Jurnal Matematika dan Statistika, 8(3), 201-210.
McElreath, R. (2020). Statistical Rethinking: A Bayesian Course with Examples in R and Stan (2nd ed.). CRC Press.