Tendensi Sentral
Central Tendency (Tendensi Sentral) merupakan nilai yang menunjukkan titik tengah dari suatu dataset untuk mengetahui dimana posisi banyak nilai data berkumpul di dalam distribusi. Nilai Mean, Median, dan Modus adalah ukuran Central Tendency yang paling umum digunakan.
1. Arithmetic Mean
Arithmetic Mean (Rata-rata hitung) merupakan ukuran yang banyak digunakan untuk mengukur lokasi data. Hitungan ini membutuhkan data minimal tingkat interval.
# Misalkan diketahui vector berikut
x <- c(3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23)
# cetak mean
print(mean(x))
Output:
[1] 21.5
Geometric Mean adalah nilai rata-rata yang diperoleh dengan mengalikan semua data dalam suatu kelompok sampel. Kemudian di akar pangkatkan dengan banyaknya data sampel tersebut. Karena mengikuti proses akar pangkat, maka apabila terdapat unsur data yang bernilai negatif, rata-rata ukur tidak bisa dilakukan.
# Misalkan diketahui vector berikut
x <- c(1, 5, 9, 19, 25)
# Cetak Geometric Mean
print(prod(x)^(1 / length(x)))
Output:
[1] 7.344821
Harmonic Mean (Rata-rata harmonik) adalah rata-rata yang dihitung dengan cara mengubah semua data menjadi pecahan, dimana nilai data dijadikan sebagai penyebut dan pembilangnya adalah satu, kemudian semua pecahan tersebut dijumlahkan dan selanjutnya dijadikan sebagai pembagi jumlah data.
# Misalkan diketahui vector berikut
x <- c(1, 5, 8, 10)
# Print Harmonic Mean
print(1 / mean(1 / x))
Output:
[1] 2.807018
4. Median
Median adalah bilangan sentral dari suatu kumpulan dalam ukuran pemusatan data. Dimana, atur titik data dari yang terkecil hingga terbesar dan temukan nomor pusatnya. Maka, itulah mediannya. Akan tetapi jika ada 2 angka di tengah, median adalah rata-rata dari 2 angka tersebut.
# Misalkan diketahui vector berikut
x <- c(3, 7, 5, 13, 20, 23, 39,
23, 40, 23, 14, 12, 56, 23)
# Cetak Median
median(x)
Output:
[1] 21.5
5. Mode/Modus
Mode/Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik ataupun data kategoris.
# 1: Single-mode value
# Misalkan diketahui vector berikut
x <- c(3, 7, 5, 13, 20, 23, 39,
23, 40, 23, 14, 12, 56,
23, 29, 56, 37, 45, 1, 25, 8)
# Tabel Frekuensi
y <- table(x)
# Cetak Tabel Frekuensi
print(y)
# Mode of x
m <- names(y)[which(y == max(y))]
# Cetak mode (Modus)
print(m)
Output:
x
1 3 5 7 8 12 13 14 20 23 25 29 37 39 40 45 56
1 1 1 1 1 1 1 1 1 4 1 1 1 1 1 1 2
[1] "23"
# 2: Multiple Mode values
# Misalkan diketahui vector berikut
x <- c(3, 7, 5, 13, 20, 23, 39, 23, 40,
23, 14, 12, 56, 23, 29, 56, 37,
45, 1, 25, 8, 56, 56)
# Tabel Frekuensi
y <- table(x)
# Cetak Tabel Frekuensi
print(y)
# Mode of x
m <- names(y)[which(y == max(y))]
# Cetak mode (Modus)
print(m)
Output:
x
1 3 5 7 8 12 13 14 20 23 25 29 37 39 40 45 56
1 1 1 1 1 1 1 1 1 4 1 1 1 1 1 1 4
[1] "23" "56"