Bayesian Networks & Probabilistic Graphical Models

Apa itu Bayesian Networks?

Bayesian Networks (BN) adalah model probabilistik grafis yang merepresentasikan sekumpulan variabel acak dan hubungan ketergantungannya menggunakan graf berarah tanpa siklus (Directed Acyclic Graph/DAG).

Setiap simpul (node) pada jaringan mewakili variabel acak, dan setiap sisi (edge) mewakili hubungan sebab-akibat atau dependensi bersyarat antarvariabel.

Ciri utama Bayesian Networks:

  • Menggabungkan teori graf dan probabilitas Bayes.
  • Mampu memodelkan ketidakpastian dalam sistem kompleks.
  • Dapat digunakan untuk prediksi, diagnosis, dan pengambilan keputusan berbasis data.

Struktur dan Komponen dalam Probabilistic Graphical Models (PGM)

Probabilistic Graphical Models (PGM) merupakan kerangka yang menggabungkan teori graf dan teori probabilitas untuk merepresentasikan hubungan ketergantungan antar variabel acak.
Model ini sangat berguna untuk memahami hubungan sebab-akibat, inferensi probabilistik, dan prediksi pada sistem yang kompleks (misalnya diagnosis medis, visi komputer, atau kecerdasan buatan).

Struktur dalam PGM direpresentasikan melalui graf, yang terdiri dari simpul (nodes) dan sisi (edges).

  • Nodes (simpul) mewakili variabel acak.
  • Edges (sisi) menunjukkan ketergantungan atau hubungan probabilistik antar variabel.

Ada dua jenis struktur utama dalam PGM:

a. Directed Graphical Model (Bayesian Network)

  • Menggunakan graf berarah tanpa siklus (Directed Acyclic Graph / DAG).
  • Setiap node memiliki parent yang mempengaruhi probabilitas node tersebut.
  • Menunjukkan hubungan sebab-akibat (causal relationship).

Contoh:
Jika , maka probabilitas B bergantung pada A:

Contoh Kasus:

Cuaca (A) memengaruhi Keputusan membawa payung (B). Jika cuaca hujan, maka peluang membawa payung meningkat.

b. Undirected Graphical Model (Markov Random Field / Markov Network)

  • Menggunakan graf tak berarah (Undirected Graph).
  • Tidak menunjukkan arah sebab-akibat, tetapi menunjukkan ketergantungan bersama (mutual dependency) antar variabel.
  • Probabilitas gabungan direpresentasikan dengan fungsi potensial (potential function).

Contoh:

dengan

= konstanta normalisasi

= fungsi potensial pada klika C

Contoh Kasus:

Dalam citra digital, setiap piksel bergantung pada tetangganya tanpa arah sebab-akibat tertentu.

Adapun komponen utama dalam PGM, yaitu:

a. Nodes (Simpul)

Mewakili variabel acak, bisa berupa variabel observasi maupun laten.

Contoh: variabel “Suhu”, “Cuaca”, atau “Payung”.

b. Edges (Sisi)

Menunjukkan hubungan probabilistik antara dua node.

  • Pada Bayesian Network, arah panah menunjukkan “siapa memengaruhi siapa”.
  • Pada Markov Network, sisi menunjukkan adanya hubungan ketergantungan langsung.

c. Conditional Probability Distribution (CPD)

Menjelaskan bagaimana nilai suatu node bergantung pada parent-nya.
Pada Bayesian Network:

Contohnya:

d. Joint Probability Distribution (Distribusi Probabilitas Gabungan)

Seluruh jaringan PGM merepresentasikan distribusi gabungan dari semua variabel.
Untuk Bayesian Network:

e. Inference (Inferensi)

Proses menghitung probabilitas dari satu variabel (atau lebih) berdasarkan pengamatan terhadap variabel lain.

Contohnya: Menghitung

f. Learning (Pembelajaran)

Menentukan parameter (seperti CPD) dan/atau struktur graf berdasarkan data.
Ada dua pendekatan utama:

  • Parameter Learning: mencari nilai parameter distribusi probabilitas.
  • Structure Learning: mencari bentuk graf (hubungan antarvariabel).

Contoh Aplikasi: Diagnosis Medis Berbasis Bayesian Networks

Bayesian Networks banyak digunakan dalam sistem pakar medis untuk mendeteksi penyakit berdasarkan gejala pasien.

Contoh:

Kita ingin mengetahui probabilitas seorang pasien mengidap TBC berdasarkan gejala batuk dan hasil tes positif.

Struktur jaringan:

TBC → Batuk

TBC → Tes_Pos

Probabilitas dasar (misal):

Dengan teorema Bayes, kita dapat menghitung:

yang menunjukkan kemungkinan pasien benar-benar TBC setelah diketahui hasil observasi (batuk dan tes positif). Berikut grafik dari penjelasan Bayesian Network serta Marcov Network:

Bayesian Network

Bayesian Network adalah model graf berarah tanpa siklus (Directed Acyclic Graph / DAG) yang merepresentasikan hubungan sebab-akibat antar variabel acak.

Setiap node (simpul) mewakili variabel acak, dan setiap panah (edge) menunjukkan arah pengaruh (dependensi bersyarat).

Makna tiap elemen dari gambar:

  • Node “Penyakit” → variabel penyebab (parent). Ini menggambarkan kondisi awal yang memengaruhi variabel lain.
  • Node “Gejala1” dan “Gejala2” → variabel akibat (child). Muncul karena dipengaruhi oleh “Penyakit”.
  • Panah (→) → menunjukkan hubungan sebab-akibat: “Penyakit” → “Gejala” artinya probabilitas munculnya gejala bergantung pada apakah seseorang mengidap penyakit itu.

Markov Network

Markov Network adalah model graf tak berarah (Undirected Graph) yang merepresentasikan ketergantungan bersama (mutual dependency) antar variabel acak.

Tidak ada arah sebab-akibat; hubungan hanya menunjukkan bahwa variabel-variabel tersebut berinteraksi secara langsung.

Makna tiap elemen dari gambar:

  • Node A, B, C, D → variabel acak yang saling berhubungan.
  • Garis penghubung (—) → menunjukkan bahwa dua variabel saling bergantung langsung, tapi tidak ada arah pengaruh.
  • Tidak ada “parent” atau “child”; semua node bisa saling memengaruhi.

Simulasi Jaringan Bayesian dalam R Studio

Berikut contoh implementasi Bayesian Network sederhana di R dengan menggunakan package bnlearn dan gRain.

# Instal dan panggil paket

install.packages(“bnlearn”)

install.packages(“gRain”)

library(bnlearn)

library(gRain)

# 1. Definisikan struktur jaringan

# Misalnya: Penyakit → Gejala1, Penyakit → Gejala2

dag <- model2network(“[Penyakit][Gejala1|Penyakit][Gejala2|Penyakit]”)

# 2. Tentukan Conditional Probability Tables (CPT)

cpt.Penyakit <- matrix(c(0.9, 0.1), ncol=2, dimnames=list(NULL, c(“Tidak”, “Ya”)))

cpt.Gejala1 <- matrix(c(0.8, 0.2, 0.1, 0.9),

                      ncol=2, dimnames=list(Penyakit=c(“Tidak”, “Ya”), Gejala1=c(“Tidak”, “Ya”)))

cpt.Gejala2 <- matrix(c(0.9, 0.1, 0.3, 0.7),

                      ncol=2, dimnames=list(Penyakit=c(“Tidak”, “Ya”), Gejala2=c(“Tidak”, “Ya”)))

# 3. Gabungkan CPT menjadi model Bayesian

bn <- custom.fit(dag, dist=list(Penyakit=cpt.Penyakit, Gejala1=cpt.Gejala1, Gejala2=cpt.Gejala2))

# 4. Ubah menjadi model grain untuk inference

gr <- as.grain(bn)

# 5. Hitung probabilitas marginal

querygrain(gr, nodes=”Penyakit”)

# 6. Hitung probabilitas bersyarat jika Gejala1=Ya dan Gejala2=Ya

evidence <- setEvidence(gr, nodes=c(“Gejala1″,”Gejala2”), states=c(“Ya”,”Ya”)) querygrain(evidence, nodes=”Penyakit”)

Hasil simulasi menunjukkan peluang seseorang mengidap penyakit tertentu ketika gejala tertentu muncul, yang dapat dijadikan dasar keputusan diagnostik dalam sistem pakar medis.

Kesimpulan

Bayesian Networks merupakan model yang menggabungkan teori graf dan probabilitas Bayes untuk merepresentasikan hubungan sebab-akibat antar variabel acak secara sistematis, sehingga mampu memodelkan ketidakpastian dalam proses pengambilan keputusan berbasis data (Aini et al., 2020). Model ini termasuk dalam kerangka besar Probabilistic Graphical Models (PGM), yang juga mencakup Markov Networks sebagai bentuk representasi tak berarah dengan struktur ketergantungan yang berbeda (Nasution & Rahmadana, 2021).

Keunggulan utama dari Bayesian Networks dan PGM terletak pada kemampuannya dalam melakukan inferensi probabilistik dan prediksi kondisi yang sulit diamati secara langsung. Pendekatan ini terbukti efektif dalam berbagai bidang seperti diagnosis medis, prediksi risiko, serta pengembangan sistem kecerdasan buatan, karena dapat menggabungkan data empiris dengan pengetahuan pakar (Sari et al., 2019).

Dalam penerapan praktisnya, R Studio menyediakan alat bantu komputasi seperti paket bnlearn dan gRain yang memungkinkan pengguna untuk membangun, mengestimasi parameter, serta melakukan inferensi pada jaringan Bayesian secara efisien (Wulandari & Suhartono, 2020). Dengan kemampuan tersebut, Bayesian Networks dan PGM menjadi salah satu metode penting dalam analisis statistik modern dan pengembangan sistem berbasis kecerdasan buatan di Indonesia (Hartati & Hidayat, 2018).

Referensi

Aini, N., Fitriani, D., & Putra, R. (2020). Penerapan Bayesian Network untuk Sistem Pendukung Keputusan Diagnosa Penyakit. Jurnal Teknologi Informasi dan Ilmu Komputer.

Hartati, S., & Hidayat, A. (2018). Implementasi Bayesian Network untuk Sistem Pakar Diagnosis Penyakit Tuberkulosis. Jurnal Ilmiah Komputer dan Informatika (KOMPUTA).

Heckerman, D. (1995). A tutorial on learning with Bayesian networks. Microsoft Research Technical Report MSR-TR-95-06.

Murphy, K. P. (2012). Machine learning: A probabilistic perspective. MIT Press.

Nasution, R. D., & Rahmadana, M. F. (2021). Penerapan Probabilistic Graphical Models dalam Prediksi Risiko Keuangan. Jurnal Statistika dan Aplikasi.

Sari, W. D., Hidayat, T., & Lestari, R. (2019). Model Probabilistik Bayesian untuk Analisis Ketidakpastian dalam Sistem Cerdas. Jurnal Sains dan Teknologi Informasi.

Wulandari, N., & Suhartono, D. (2020). Simulasi dan Inferensi Bayesian Networks menggunakan R. Jurnal Sains Komputer dan Informatika (JSAKTI).

Leave a Reply