Çarpıklık Anlamı
Çarpıklık, dağılımın her bir tarafa eşit olarak bölündüğü normal dağılımdan ne kadar istatistiksel veri dağılımının asimetrik olduğunu açıklar. Bir dağılım simetrik veya Normal değilse, o zaman çarpıktır, yani ya sol tarafa ya da sağ tarafa eğimli frekans dağılımıdır.
Çarpıklık Türleri
Dağılım simetrik ise, 0 çarpıklığa ve Ortalama = Medyan = Mod'a sahiptir.
Yani temelde iki tür var -

- Pozitif : Dağılım sıklığının çoğu dağılımın sağ tarafında olduğunda ve daha uzun ve daha şişman bir sağ kuyruğa sahip olduğunda dağılım pozitif olarak çarpıktır. Dağılımın Ortalama> medyan> Mod olduğu yer.
- Negatif : Dağılım sıklığının çoğu dağılımın sol tarafında olduğu ve daha uzun ve daha kalın bir sol kuyruğa sahip olduğu zaman dağılım negatif olarak çarpıktır. Dağılımın Ortalama <Medyan <Mod.
Formül
Çarpıklık formülü aşağıdaki gibi temsil edilir -

Veri dağılımının çarpıklığını hesaplamanın birkaç yolu vardır. Bunlardan biri Pearson'un birinci ve ikinci katsayılarıdır.
- Pearson'un ilk katsayıları (Mod Çarpıklığı): Dağılımın Ortalama, Mod ve Standart sapmasına dayanır.
Formül: (Ortalama - Mod) / Standart Sapma.
- Pearson'un ikinci katsayıları (Medyan Çarpıklık): Dağılımın Ortalama, Medyan ve Standart sapmasına dayanır.
Formül: (Ortalama - Medyan) / Standart Sapma.
Yukarıda görebileceğiniz gibi, Pearson'ın ilk çarpıklık katsayısının, onu hesaplamak için tek değişkeni olarak bir moda sahip olduğu ve yalnızca verilerin veri setinde daha fazla tekrar eden bir sayıya sahip olduğu durumlarda kullanışlıdır. kipe ait olan küme, o zaman Pearson'un ikinci çarpıklık katsayısı, kip yerine veri kümesinin medyanını dikkate aldığından, daha güvenilir bir merkezi eğilim ölçüsüdür.
Örneğin:
Veri seti (a): 7,8,9,4,5,6,1,2,2,3.
Veri seti (b): 7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3.
Her iki veri kümesi için de modun 2 olduğu sonucuna varabiliriz. Ancak, veri kümesi (a) için Pearson'un birinci çarpıklık katsayısını kullanmak mantıklı değildir, çünkü 2 sayısı veri kümesinde yalnızca iki kez görünmektedir, ancak kullanılabilir veri seti (b) daha tekrarlı bir moda sahip olduğundan yapmak için.
Aşağıdaki formülü kullanarak çarpıklığı hesaplamanın başka bir yolu:

- = Rastgele değişken.
- X = Dağılım Ortalaması.
- N = Dağılımdaki toplam değişken.
- α = Standart Sapma.

Çarpıklık Örneği
Bu kavramı daha detaylı anlamak için aşağıdaki örneğe bakalım:
XYZ yönetim kolejinde, 30 son sınıf öğrencisi QPR araştırma firmasına işe yerleştirmeyi düşünüyor ve tazminatları öğrencinin akademik performansına ve geçmiş iş deneyimine dayanıyor. PQR araştırma firmasında öğrencinin tazminatının verileri aşağıdadır.
Çözüm
Aşağıdaki verileri kullanın

Dağılım Ortalamasının Hesaplanması

- = (400 ABD doları * 12 + 500 ABD doları * 8 + 700 ABD doları * 5 + 850 ABD doları * 3 + 1000 ABD doları * 2) / 30
- Dağılım Ortalama = 561.67
Standart Sapmanın Hesaplanması

- Standart Sapma = √ ((Sapma karesinin toplamı * Öğrenci sayısı) / N).
- Standart Sapma = 189.16
Çarpıklığın hesaplanması şu şekilde yapılabilir -

- Çarpıklık: (Sapma Küpünün toplamı) / (N-1) * Standart sapmanın Küpü.
- = (106374650.07) / (29 * 6768161.24)
- = 0,54
Bu nedenle, 0,54 değeri bize dağılım verilerinin normal dağılımdan biraz saptığını söyler.
Avantajlar
- Yatırım getirilerinin performansını ölçmek için çarpıklık daha iyidir.
- Yatırımcı, veri setini analiz ederken, yalnızca veri tabanına güvenmek yerine dağıtımın aşırı uçlarını değerlendirdiği için bunu kullanır.
- Normal dağılımdan ne kadar verinin asimetri olduğunu anlamaya yardımcı olduğu için istatistiklerde yaygın olarak kullanılan bir araçtır.
Dezavantajları
- Çarpıklık, negatif sonsuzdan pozitif sonsuzluğa kadar değişir ve bazen bir yatırımcının veri setindeki eğilimi tahmin etmesi zorlaşır.
- Bir analist, genellikle verilerin normal olarak dağıtıldığını varsayan finansal modeli kullanarak bir varlığın gelecekteki performansını tahmin ediyor, ancak verilerin dağılımı çarpıksa, bu model varsayımındaki gerçek sonucu yansıtmayacaktır.
Önem
İstatistikte, dağıtım verilerinin normal olarak dağıtılmadığı durumlarda önemli bir rol oynar. Veri kümesindeki aşırı veri noktaları, veri dağıtımının sola doğru eğrilmesine neden olabilir (yani, veri kümesindeki aşırı veriler daha küçüktür, bu da veri kümesinin negatif olması anlamına gelir.Sonuç
Çarpıklık, basitçe ne kadar veri kümesinin normal dağılımından saptığıdır. Veri setinde daha büyük bir negatif değer, dağılımın negatif olarak çarpık olduğu anlamına gelir ve veri setinde daha büyük pozitif değer, dağılımın pozitif olarak dağıldığı anlamına gelir. Yatırımcının dağıtımdan elde edilen getirileri tahmin etmesine yardımcı olan iyi bir istatistiksel ölçüdür.