Variance

Variance

Menghitung varians dalam R adalah kesederhanaan itu sendiri. Anda menggunakan var() fungsi, tetapi varians apa yang diberikannya kepada Anda? Yang denganNdalam penyebut atau satu denganN-1? Waktunya untuk mencari tahu:

heights <- c(50, 47, 52, 46, 45)
> var(heights)
[1] 8.5

Ini menghitung varians yang diperkirakan (dengan N-1 dalam penyebut). Menghitung
varian pertama dengan N penyebut, Anda harus mengalikan angka ini dengan
(N-1)/N. Menggunakan leght() untuk menghitung N, itu

var(heights)*(length(heights)-1)/length(heights)
[1] 6.8

Jika Anda akan sering bekerja dengan varians semacam ini, tentukan a
fungsi var.p() :

var.p = function(x){var(x)*(length(x)-1)/length(x)}

Dan berikut cara menggunakannya:

var.p(heights)
[1] 6.8

Normal Distribution

Dalam pengumpulan data acak dari sumber independen, umumnya diamati bahwa distribusi datanya normal. Artinya, pada plot grafik dengan nilai variabel pada sumbu horizontal dan hitungan nilai pada sumbu vertikal kita mendapatkan kurva bentuk lonceng. Pusat kurva mewakili rata-rata dari kumpulan data. Dalam grafik, lima puluh persen nilai terletak di sebelah kiri rata-rata dan lima puluh persen lainnya terletak di sebelah kanan grafik. Ini disebut sebagai distribusi normal dalam statistik.

R memiliki empat fungsi bawaan untuk membangkitkan distribusi normal. Mereka dijelaskan di bawah ini.

1. dnorm(x, mean, sd)
2. pnorm(x, mean, sd)
3. qnorm(p, mean, sd)
4. rnorm(n, mean, sd)

Berikut adalah deskripsi parameter yang digunakan pada fungsi di atas

  • x adalah vektor bilangan.
  • p adalah vektor peluang.
  • n adalah jumlah pengamatan (ukuran sampel).
  • mean adalah nilai rata-rata dari data sampel. Nilai defaultnya adalah nol.
  • sd adalah standar deviasi. Nilai defaultnya adalah 1.

1. dnorm()

Fungsi ini memberikan tinggi dari distribusi probabilitas pada setiap titik untuk mean dan standar
deviasi yang diberikan.

# Buat urutan angka antara -10 dan 10 bertambah 0,1.
x <- seq(-10, 10, by = .1)

# Pilih mean sebagai 2,5 dan standar deviasi sebagai 0,5.
y <- dnorm(x, mean = 2.5, sd = 0.5)

# Beri nama file grafik.
png(file = "dnorm.png")
plot(x,y)

# Simpan file.
dev.off()

Ketika kita mengeksekusi kode di atas, itu menghasilkan hasil berikut


2. pnorm()

Fungsi ini memberikan peluang suatu bilangan acak yang terdistribusi normal menjadi lebih kecil dari nilai bilangan yang diberikan. Ini juga disebut “Fungsi Distribusi Kumulatif”.

# Buat urutan angka antara -10 dan 10 bertambah sebesar 0,2.
x <- seq(-10,10,by = .2)

# Pilih mean sebagai 2,5 dan standar deviasi sebagai 2.
y <- pnorm(x, mean = 2.5, sd = 2)

# Beri nama file grafik.
png(file = "pnorm.png")

# Gambarkan grafiknya.
plot(x,y)

# Simpan file
dev.off()

Ketika kita mengeksekusi kode di atas, itu menghasilkan hasil berikut

3. qnorm()

Fungsi ini mengambil nilai probabilitas dan memberikan bilangan yang nilai kumulatifnya
sesuai dengan nilai probabilitas.

# Buat urutan nilai probabilitas yang bertambah sebesar 0,02.
x <- seq(0, 1, by = 0.02)

# Pilih mean sebagai 2 dan simpangan baku sebagai 3.
y <- qnorm(x, mean = 2, sd = 1)

# Beri nama file grafik.
png(file = "qnorm.png")

# Gambarkan grafiknya.
plot(x,y) 

# Simpan file.
dev.off()

Ketika kita mengeksekusi kode di atas, itu menghasilkan hasil berikut

4. rnorm()

Fungsi ini digunakan untuk membangkitkan bilangan acak yang distribusinya normal. Dibutuhkan ukuran sampel sebagai input dan menghasilkan banyak angka acak. Kami menggambar histogram untuk menunjukkan distribusi angka yang dihasilkan.

# Buat sampel 50 angka yang berdistribusi normal.
y <- rnorm(50)

# Beri nama file grafik.
png(file = "rnorm.png")

# Plot histogram untuk sampel ini.
hist(y, main = "Normal DIstribution")

# Simpan file.
dev.off()

Ketika kita mengeksekusi kode di atas, itu menghasilkan hasil berikut

Leave a Reply