Excel'de Ki Kare Testi - Örnekle Chi Square Testi nasıl yapılır

Excel ile Ki-Kare Testi

Excel'deki Ki-Kare testi, rastgele seçilen veriler için iki veya daha fazla değişkeni karşılaştırmak için kullanılan en yaygın kullanılan parametrik olmayan testtir. İki veya daha fazla değişken arasındaki ilişkiyi bulmak için kullanılan bir test türüdür, Ki-Kare P değeri olarak da bilinen istatistiklerde kullanılır, excel'de dahili bir fonksiyonumuz yoktur ancak kullanabiliriz ki-kare testi için matematiksel formül kullanarak Excel'de ki-kare testi yapmak için formüller.

Türler

  1. Uyum iyiliği için Ki-Kare testi
  2. İki değişkenin bağımsızlığı için Ki-Kare testi.

# 1 - Uyum iyiliği için Ki-Kare testi

Bir popülasyona uygun bir örneğin yakınlığını algılamak için kullanılır. Ki-Kare testinin sembolü (2) 'dir. Tüm ( Gözlemlenen sayı - Beklenen sayı) 2 / Beklenen sayının toplamıdır .

  • Nerede k-1 serbestlik derecesi veya DF.
  • Nerede Oi gözlenen frekans, k kategoridir ve Ei beklenen sıklığıdır.

Not: - İstatistiksel bir modelin uyum iyiliği, örnek verilerin bir gözlem setine ne kadar iyi uyduğunun anlaşılması anlamına gelir.

Kullanımlar

  • Kredi alanların yaş gruplarına ve bireysel kredilerine göre kredi değerliliği
  • Satış elemanlarının performansı ile alınan eğitim arasındaki ilişki
  • Tek bir hisse senedinin ve ilaç veya bankacılık gibi bir sektörün hisse senetlerinin getirisi
  • İzleyicilerin kategorisi ve bir TV kampanyasının etkisi.

# 2 - İki değişkenin bağımsızlığı için Ki-Kare testi

Değişkenlerin birbirinden bağımsız olup olmadığını kontrol etmek için kullanılır. (R-1) (c-1) serbestlik derecesi ile

Burada Oi gözlenen frekanstır, r, satır sayısını, c sütun sayısıdır ve Ei beklenen frekans

Not: - Bir değişkenin olasılık dağılımı diğerinden etkilenmiyorsa, iki rastgele değişken bağımsız olarak adlandırılır.

Kullanımlar

Bağımsızlık testi aşağıdaki durumlar için uygundur:

  • Bir kategorik değişken var.
  • İki kategorik değişken vardır ve aralarındaki ilişkiyi belirlemeniz gerekecektir.
  • Çapraz tablolar vardır ve iki kategorik değişken arasındaki ilişkinin bulunması gerekir.
  • Ölçülemeyen değişkenler var (Örneğin, farklı yaş gruplarındaki çalışanlar farklı sağlık planı türlerini seçiyor mu?)

Excel'de Ki-Kare Testi Nasıl Yapılır? (Örnek ile)

Bir restoranın yöneticisi, müşteri memnuniyeti ile masa bekleyenlerin maaşları arasındaki ilişkiyi bulmak ister. Bunda, Chi-Square'i test etmek için hipotez oluşturacağız.

  • Hizmetin mükemmel, iyi veya kötü olup olmadığını soran 100 müşteriden rastgele bir örnek alır.
  • Daha sonra bekleyen insanların maaşlarını düşük, orta ve yüksek olarak sınıflandırır.
  • Anlamlılık seviyesinin 0,05 olduğunu varsayalım. Burada H0 ve H1, hizmet kalitesinin bağımsızlığını ve masa bekleyen kişilerin maaşlarına bağımlılığını ifade etmektedir.
  • H 0 - Hizmet kalitesi, masayı bekleyenlerin maaşlarına bağlı değildir.
  • H 1 - Hizmet kalitesi, masayı bekleyenlerin maaşlarına bağlıdır.
  • Bulguları aşağıdaki tabloda gösterilmektedir:

Bunda 9 veri noktamız var, her biri maaşla ilgili farklı mesaj alan 3 grubumuz var ve sonucu aşağıda verilmiştir.

Şimdi tüm satırların ve sütunların toplamını sayacağız. Bunu formül yani TOPLA yardımıyla yapacağız . Toplam sütununda Mükemmel Toplamı yapmak için = SUM (B4: D4) yazıp enter tuşuna basıyoruz.

Bu bize 26 verecek . Tüm satır ve sütunlarda aynısını yapacağız.

Hesaplamak için Freedom (DF) derecesi, kullandığımız (r-1), (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • 3 hizmet kategorisi ve 3 maaş kategorisi vardır.
  • Orta maaşlı 27 yanıtlayıcımız var (alt sıra, orta)
  • İyi bir hizmet almış 51 yanıtlayıcımız var (son sütun, orta)

Şimdi Beklenen Frekansları hesaplamalıyız : -

Beklenen Frekanslar bir formül kullanılarak hesaplanabilir: -

  • İçin hesaplamak için mükemmel biz toplamını çarparak kullanacak Low üzere toplam bölünmüş Mükemmel N. tarafından

1. satır ve 1. sütun (= B7 * E4 / B9 ) için hesaplamamız gerektiğini varsayalım . Bu, düşük bekleyenlerin maaşları için Mükemmel hizmet oyu vermiş beklenen müşteri sayısını verecektir , yani 8.32 .

  • E 11 = - (32 * 26) / 100 = 8.32 , E 12 = 7.02 , E 13 = 10.66
  • E 21 = 16.32 , E 22 = 13.77 , E 23 = 20.91
  • E 31 = 7.36 , E 32 = 6.21 , E 33 = 9.41

Benzer şekilde, herkes için aynısını yapmalıyız ve formül aşağıdaki diyagramda uygulanmıştır.

Beklenen Frekans tablosunu aşağıda verildiği gibi alıyoruz: -

Not: - Önem düzeyinin 0,05 olduğunu varsayın. Burada H0 ve H1, hizmet kalitesinin bağımsızlığını ve masa bekleyen kişilerin maaşlarına bağımlılığını ifade etmektedir.

Beklenen Frekansı hesapladıktan sonra, bir formül kullanarak ki-kare veri noktalarını hesaplayacağız.

Ki-Kare Noktaları = (Gözlemlenen-Beklenen) 2 / Beklenen

İlk noktayı hesaplamak için = (B4-B14) 2 / B14 yazıyoruz .

Değeri otomatik olarak doldurmak için formülü kopyalayıp diğer hücrelere yapıştıracağız.

Bundan sonra , tablonun yukarısında verilen tüm değerleri toplayarak ki değerini (Hesaplanan değer) hesaplayacağız .

Chi değerini 18.65823 olarak aldık .

Bunun kritik değerini hesaplamak için aşağıda verilen formülü kullanabileceğimiz ki-kare kritik değer tablosunu kullanıyoruz.

Bu formül 2 parametre KİKARE.TERS.SAĞK (olasılık, serbestlik derecesi) içerir.

Olasılık 0,05'tir ve Boş Hipotezinin (H 0 ) kabul edilip edilmeyeceğini belirlememize yardımcı olacak önemli bir değerdir .

Ki-karenin kritik değeri 9.487729037'dir.

Şimdi ki-kare veya (P-değeri) = KİKARETEST (gerçek_aralık, beklenen_aralık) değerini bulacağız.

= KİKARETEST (B4: D6; B14: D16) aralığı .

Gördüğümüz gibi, ki testinin veya P değerinin değeri = 0.00091723'tür.

Tüm değerleri hesapladık. Ki-kare (hesaplanan değer) değeri daha fazla aynı veya değerler sadece önemli olan kritik değerin 9.48, yani kritik değeri (tablo halinde değer) daha yüksek olması gerekir 18.65'e kabul etmek için boş hipotezi (lH 0 ) .

Ama burada Hesaplanan değer > Tablolu değer

X 2 (Hesaplanmış)> X 2 (Tablolanmış)

18.65> 9.48

Bu durumda, Sıfır Hipotezini (H 0 ) reddedeceğiz ve Alternatif (H 1 ) kabul edilecektir.

  • Aynı şeyi tahmin etmek için P-Değerini de kullanabiliriz, yani, eğer P-değeri <= α (anlamlı değer 0.05) ise, Sıfır hipotezi reddedilecektir.
  • Eğer P değeri> a , yok reddetmek sıfır hipotezini .

Burada P-değeri (0.0009172) < α (0.05), H 0 reddedilir , H 1 kabul edilir

Yukarıdaki örnekten, Hizmet kalitesinin bekleyen kişilerin maaşlarına bağlı olduğu sonucuna varıyoruz.

Hatırlanacak şeyler

  • Standart bir normal değişkenin karesini dikkate alır.
  • Farklı kategorilerde gözlemlenen frekansların, belirli bir varsayım kümesi altında beklenen frekanslardan önemli ölçüde farklı olup olmadığını değerlendirir.
  • Varsayılan bir dağılımın verilere ne kadar iyi uyduğunu belirler.
  • Olasılık tablolarını kullanır (pazar araştırmalarında bu tablolara çapraz sekmeler adı verilir).
  • Nominal seviye ölçümlerini destekler.

Ilginç makaleler...