İstatistikte Normal Dağılım - Tanım, Örnek, Yorumlama

İstatistikte Normal Dağılım Nedir?

Normal Dağılım, rastgele bir değişkenin belirli bir aralıkta alabileceği tüm olası değerleri tanımlamaya yardımcı olan çan şeklindeki bir frekans dağılım eğrisidir; dağılım alanının çoğu ortada ve çok azı kuyruklarda, uçlarda. Bu dağılımın iki temel parametresi vardır: varlık getirisi hesaplamasında ve risk yönetimi stratejisinde anahtar rol oynayan ortalama (µ) ve standart sapma (σ).

Normal Dağılım Nasıl Yorumlanır

Yukarıdaki şekil, istatistiksel normal dağılımın çan şeklinde bir eğri olduğunu göstermektedir. Bu dağılımın olası sonuçlarının aralığı, -∞ ile + ∞ arasında uzanan tam sayılardır. Çan eğrisinin kuyrukları, grafiğin her iki yanında (+/-) sınırsız olarak uzanır.

  • Tüm gözlemlerin yaklaşık% 68'i +/- bir standart sapma (σ) dahilindedir.
  • Tüm gözlemlerin yaklaşık% 95'i +/- iki standart sapma (σ) dahilindedir.
  • Tüm gözlemlerin yaklaşık% 99'u +/- üç standart sapma (σ) dahilindedir.

Sıfır çarpıklığa sahiptir (bir dağılımın simetrisi). Verinin dağılımı asimetrik ise, veri kümesi sıfırdan büyük çarpıklığa veya pozitif çarpıklığa sahipse dağılım eşit değildir. Daha sonra, dağılımın sağ kuyruğu soldan daha uzundur ve negatif çarpıklık için (sıfırdan küçük) sol kuyruk sağ kuyruktan daha uzun olacaktır.

Dağılımın ne çok tepeli ne de çok ince olduğunu gösteren 3 basıklık vardır (bir dağılımın tepe noktasını ölçer). Basıklık üçten fazla ise, dağılım daha kalın kuyruklarla pik yapıyorsa ve basıklık üçten azsa ince kuyrukludur ve tepe noktası normal dağılıma göre daha düşüktür.

Özellikler

  • Ortalama ve sapmanın dağılımın şeklini belirlediği bir dağılım ailesini temsil ederler.
  • Bu dağılımın ortalaması, medyanı ve modu eşittir.
  • Değerlerin yarısı merkezin solunda, diğer yarısı ise sağdadır.
  • Standart eğrinin altındaki toplam değer her zaman bir olacaktır.
  • Büyük olasılıkla, dağılım merkezdedir ve kuyruk ucunda daha az değer bulunur.

Dönüşüm (Z)

Dağılımın ardından rastgele bir değişkenin (X) Olasılık yoğunluk fonksiyonu (PDF) şu şekilde verilir:

nerede -∞ <x <∞; -∞ <µ 0

Nerede,

  • F (x) = Normal olasılık Fonksiyonu
  • x = Rastgele değişken
  • µ = Dağılımın ortalaması
  • σ = Dağılımın standart sapması
  • π = 3,14159
  • e = 2.71828

Dönüşüm Formülü

Nerede,

  • X = Rastgele değişken

İstatistikte Normal Dağılım Örnekleri

Aşağıdaki örnekleri tartışalım.

Örnek 1

Bir şirketin 10000 çalışanı olduğunu ve çalışanın çalıştığı iş rolüne göre birden çok maaş yapısına sahip olduğunu varsayalım. Maaşlar genellikle nüfus ortalaması µ = 60.000 $ ve nüfus standart sapması σ = 15.000 $ olarak dağıtılır. Rastgele seçilen çalışanın yıllık maaşı 45000 dolardan az olma olasılığı nedir?

Çözüm

Yukarıdaki şekilde gösterildiği gibi, bu soruyu cevaplamak için normal eğrinin altındaki alanı 45'ten sol kuyruğa kadar bulmamız gerekiyor. Ayrıca, doğru cevabı almak için Z-tablo değerini kullanmamız gerekir.

İlk olarak, verilen ortalama ve standart sapmayı, dönüştürme formülünü kullanarak ortalama (µ) = 0 ve standart sapma (σ) = 1 olan standart bir normal dağılıma dönüştürmemiz gerekir.

Dönüşümden sonra, karşılık gelen değeri bulmak için Z tablosuna bakmamız gerekir, bu da bize doğru cevabı verecektir.

Verilen,

  • Ortalama (µ) = 60.000 ABD Doları
  • Standart sapma (σ) = 15.000 $
  • Rastgele Değişken (x) = 45.000 ABD Doları

Dönüşüm (z) = (45000 - 60000/15000)

Dönüşüm (z) = -1

Şimdi, Z tablosunda -1'e eşdeğer olan değer 0.1587'dir ve bu, 45'ten sola doğru eğrinin altındaki alanı temsil eder. Bir çalışanı rastgele seçtiğimizde, yılda 45.000 $ 'dan az kazanma olasılığının% 15.87 olduğunu belirtti.

Örnek 2

Şimdi yukarıdaki senaryoyu sürdürerek, rastgele seçilen çalışanın normal dağılımı kullanarak yılda 80.000 $ 'dan fazla kazanma olasılığını bulun.

Çözüm

Yani bu soruda, aynı formülü kullanarak 80'den sağ kuyruğa kadar gölgeli alanı bulmamız gerekiyor.

Verilen,

  • Ortalama (µ) = 60.000 ABD Doları
  • Standart sapma (σ) = 15.000 $
  • Rastgele Değişken (X) = 80.000 $

Dönüşüm (z) = (80000 - 60000/15000)

Dönüşüm (z) = 1.33

Z tablosuna göre, 1,33'ün eşdeğer değeri 0,9082 veya% 90,82'dir ve bu, yıllık 80,000 $ 'dan az kazanan çalışanları rastgele seçme olasılığının% 90,82 olduğunu göstermektedir.

Ancak soruya göre, rastgele çalışanların yılda 80.000 dolardan fazla kazanma olasılığını belirlememiz gerekiyor, bu yüzden değeri 100'den çıkarmamız gerekiyor.

  • Rastgele Değişken (X) =% 100 -% 90,82
  • Rastgele Değişken (X) =% 9,18

Yani çalışanların yılda 80.000 $ 'dan fazla kazanma olasılığı% 9.18'dir.

Kullanımlar

  • Borsa teknik tablosu genellikle analistlerin ve yatırımcıların beklenen getiri ve hisse senedi riski hakkında istatistiksel çıkarımlar yapmasına izin veren bir çan eğrisidir.
  • Gerçek dünyada, pizza şirketlerinin pizza ve daha birçok gerçek uygulamayı teslim etmek için harcadığı en olası en iyi zamanı belirlemek gibi kullanılır.
  • Çoğu insanın ortalama bir büyüklüğe sahip olacağı ve çok az insanın ortalamanın üstünde veya ortalamanın altında olduğu belirli bir nüfus kümesinin boylarını karşılaştırmak için kullanılır.
  • Öğrencilerin sıralamasını karşılaştırmaya yardımcı olan öğrencilerin ortalama akademik performansını belirlemede kullanılırlar.

Sonuç

Normal dağıtım, veri bilimi ve veri analitiğindeki uygulamaları bulur. Bu dağıtımla birlikte kullanılan Yapay Zeka ve makine öğrenimi gibi gelişmiş teknolojiler daha iyi veri kalitesi sağlayabilir ve bu da bireylere ve şirketlere etkili karar vermede yardımcı olacaktır.

Ilginç makaleler...