„Chi Square“ testas „Excel“ Kaip atlikti Chi kvadrato testą su pavyzdžiu

Chi-Square testas naudojant „Excel“

„Chi-Square“ testas „Excel“ yra dažniausiai naudojamas neparametrinis testas, naudojamas norint palyginti du ar daugiau atsitiktinai parinktų duomenų kintamuosius. Tai yra bandymo tipas, naudojamas norint sužinoti dviejų ar daugiau kintamųjų ryšį, jis naudojamas statistikoje, kuris taip pat žinomas kaip „Chi-Square P“ reikšmė, „Excel“ neturime integruotos funkcijos, tačiau galime naudoti formulės, skirtos atlikti chi kvadrato testą, naudojant matematinę chi kvadrato testo formulę.

Tipai

  1. „Chi-Square“ tinkamumo testas
  2. „Chi-Square“ dviejų kintamųjų nepriklausomumo testas.

1 - „Chi-Square“ tinkamumo testas

Jis naudojamas norint nustatyti populiacijai tinkamo imties artumą. „Chi-Square“ testo simbolis yra (2). Tai yra visų ( Stebėtų skaičių - Laukiamų skaičių) 2 / Laukiamų skaičių suma.

  • kur k-1 laisvės laipsniai arba DF.
  • Kur Oi yra stebimas dažnis, k yra kategorijos, o Ei - numatomas dažnis.

Pastaba: - Statistinio modelio tinkamumas reiškia supratimą, kaip atrinkti duomenys tinka stebėjimų rinkiniui.

Naudoja

  • Skolininkų kreditingumas pagal jų amžiaus grupes ir asmenines paskolas
  • Ryšys tarp pardavėjų darbo rezultatų ir gautų mokymų
  • Vienų akcijų ir tokio sektoriaus, kaip farmacijos ar bankininkystės, grąža
  • Žiūrovų kategorija ir TV kampanijos poveikis.

# 2 - dviejų kintamųjų nepriklausomumo testas „Chi-Square“

Jis naudojamas norint patikrinti, ar kintamieji yra vienas nuo kito autonomiški, ar ne. Su (r-1) (c-1) laisvės laipsniais

Kur Oi yra stebimas dažnis, r yra eilučių skaičius, c yra stulpelių skaičius, o Ei - numatomas dažnis

Pastaba: - Du atsitiktiniai kintamieji vadinami nepriklausomais, jei vienas neturi įtakos vieno kintamojo tikimybių pasiskirstymui.

Naudoja

Nepriklausomybės testas tinka šioms situacijoms:

  • Yra vienas kategorinis kintamasis.
  • Yra du kategoriniai kintamieji, kuriuos turėsite nustatyti tarp jų.
  • Yra kryžminės lentelės, todėl reikia rasti ryšį tarp dviejų kategorinių kintamųjų.
  • Yra kiekybiškai neįvertinamų kintamųjų (pavyzdžiui, atsakymai į klausimus, pavyzdžiui, ar skirtingų amžiaus grupių darbuotojai renkasi skirtingus sveikatos planų tipus?)

Kaip atlikti „Chi-Square“ testą programoje „Excel“? (su pavyzdžiu)

Čia galite atsisiųsti šį „Chi Square Test Excel“ šabloną - „Chi Square Test Excel“ šabloną

Restorano vadovas nori rasti ryšį tarp klientų pasitenkinimo ir žmonių, laukiančių stalų, atlyginimų. Tuo mes nustatysime hipotezę, kad išbandytume Či aikštę

  • Ji ima atsitiktinę 100 klientų imtį, klausdama, ar paslauga buvo puiki, gera ar prasta.
  • Tada ji laukiančių žmonių atlyginimus skirsto į mažus, vidutinius ir didelius.
  • Tarkime, kad reikšmingumo lygis yra 0,05. Čia H0 ir H1 žymi paslaugų kokybės nepriklausomumą ir priklausomybę nuo laukiančių stalų žmonių atlyginimų.
  • H 0 - paslaugų kokybė nepriklauso nuo stalų laukiančių žmonių atlyginimų.
  • H 1 - paslaugų kokybė priklauso nuo žmonių, laukiančių stalų, atlyginimų
  • Jos išvados pateiktos toliau pateiktoje lentelėje:

Taigi turime 9 duomenų taškus, turime 3 grupes, kurių kiekviena gavo skirtingą pranešimą apie atlyginimą, o rezultatas pateiktas žemiau.

Dabar mes suskaičiuosime visų eilučių ir stulpelių sumą. Tai atliksime naudodami formulę, ty SUM. Norėdami iš viso įrašyti puikų iš viso stulpelio, kurį parašėme = SUM (B4: D4) , tada paspauskite enter.

Tai suteiks mums 26 . Mes atliksime tą patį su visomis eilutėmis ir stulpeliais.

Laisvės laipsniui (DF) apskaičiuoti naudojame (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Yra 3 paslaugų kategorijos ir 3 atlyginimų kategorijos
  • Turime 27 respondentus, turintys vidutinį atlyginimą (apatinė eilutė, vidurinė)
  • Mes turime 51 respondentą su gera paslauga (paskutinis stulpelis, vidurys)

Dabar turime apskaičiuoti numatomus dažnius: -

Laukiamus dažnius galima apskaičiuoti pagal formulę: -

  • Norėdami apskaičiuoti „ Excellent“, naudosime „ Low “ sumą padauginę iš „ Excellent “ sumos, padalytos iš N.

Tarkime, kad turime apskaičiuoti 1-ą eilutę ir 1-ą stulpelį (= B7 * E4 / B9 ) . Tai suteiks numatomą klientų, kurie balsavo už puikų aptarnavimą, laukiančių žmonių atlyginimų skaičius bus mažas, ty 8,32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Panašiai visiems turime daryti tą patį ir formulė taikoma žemiau esančioje diagramoje.

Gauname laukiamo dažnio lentelę, kaip nurodyta toliau: -

Pastaba: - Tarkime, kad reikšmingumo lygis yra 0,05. Čia H0 ir H1 žymi paslaugų kokybės nepriklausomumą ir priklausomybę nuo laukiančių stalų žmonių atlyginimų.

Apskaičiavę laukiamą dažnį, naudodami formulę apskaičiuosime chi kvadrato duomenų taškus

Chi kvadrato taškai = (pastebėta-tikėtasi) ^ 2 / tikėtasi

Norėdami apskaičiuoti pirmąjį tašką, parašome = (B4-B14) ^ 2 / B14. 

Nukopijuosime ir įklijuosime formulę į kitas langelius, kad vertė būtų automatiškai užpildyta.

Po to mes apskaičiuosime chi vertę (apskaičiuota vertė) , pridėdami visas vertes, pateiktas virš lentelės

„Chi“ vertę gavome kaip 18,65823 .

Norėdami apskaičiuoti kritinę vertę, mes naudojame chi kvadrato kritinių verčių lentelę, kurioje galime naudoti toliau pateiktą formulę.

Šioje formulėje yra 2 parametrai CHISQ.INV.RT (tikimybė, laisvės laipsnis).

Tikimybė yra 0,05, tai yra reikšminga reikšmė, kuri padės mums nustatyti, ar priimti Null hipotezę (H 0 ), ar ne.

Kritinė chi kvadrato vertė yra 9,487729037.

Dabar rasime chi kvadrato vertę arba (P reikšmę) = CHITEST (faktinis_diapazonas, numatomas_diapazonas)

Diapazonas nuo = CHITEST (B4: D6, B14: D16) .

Kaip matėme, chi testo arba P vertės reikšmė yra = 0,00091723.

Kaip matėme, kad apskaičiavome visas vertes. Į chi kvadrato (skaičiuojama vertė) vertės yra tik reikšmingas, kai jos vertė yra tokia pati ar daugiau nei kritinę vertę 9.48, ty kritinė reikšmė (lentelėse vertė) turi būti didesnė nei 18.65 priimti nulinė hipotezė (H 0 ) .

Bet čia apskaičiuota vertė > lentelė

X2 (apskaičiuota)> X2 (lentelėje)

18.65> 9.48

Tokiu atveju mes atmesime nulinę hipotezę (H 0 ) ir bus priimta pakaitinė (H 1 ) .

  • Taip pat galime naudoti P reikšmę tam pačiam nuspėti, ty jei P reikšmė <= α (reikšminga reikšmė 0,05), Null hipotezė bus atmesta
  • Jei P reikšmė> α , neatmeskite  nulinės hipotezės .

Čia P reikšmė (0,0009172) < α (0,05), atmeskite H 0 , priimkite H 1

Iš aukščiau pateikto pavyzdžio darome išvadą, kad paslaugų kokybė priklauso nuo laukiančių žmonių atlyginimų.

Ką reikia atsiminti

  • Mano, kad kvadratas yra įprastas normalus variantas.
  • Įvertina, ar skirtingose ​​kategorijose pastebėti dažniai labai skiriasi nuo numatytų prielaidų rinkinių.
  • Nustato, kaip tariamai paskirstymas atitinka duomenis.
  • Naudojamos nenumatytų atvejų lentelės (atliekant rinkos tyrimus šios lentelės vadinamos kryžminiais skirtukais).
  • Palaiko nominalaus lygio matavimus.

$config[zx-auto] not found$config[zx-overlay] not found