Išskirtinė formulė Išsamių rezultatų apskaičiavimas žingsnis po žingsnio (su pavyzdžiu)

Išorinė formulė pateikia grafinį įrankį, skirtą apskaičiuoti duomenis, esančius už nurodyto paskirstymo rinkinio, kuris gali būti vidinis arba išorinis, priklausomai nuo kintamųjų.

Kas yra „Outlier Formula“?

Išskirtinis yra pateiktos imties arba stebėjimo duomenų taškas arba pasiskirstymas, kuris neturi atitikti bendro modelio. Dažnai naudojama taisyklė, sakanti, kad duomenų taškas bus laikomas ribiniu, jei jis turi daugiau nei 1,5 IQR žemiau pirmojo kvartilio arba virš trečiojo kvartilio.

Kitaip tariant, mažos pašalinės reikšmės turi būti žemesnės nei Q1-1,5 IQR, o didelės pašalintos - Q3 + 1,5IQR

Reikia apskaičiuoti medianą, kvartiles, įskaitant IQR, Q1 ir Q3.

Išorinė formulė pateikiama taip,

Q1 = ¼ (n + 1)-osios formulės formulė Q3 -ojo formulė = ¾ (n + 1)-osios formulės Q2 formulė = Q3 - Q1

Žingsnis po žingsnio apskaičiuojamas išvestinis

Norint apskaičiuoti išvestį, reikia atlikti toliau nurodytus veiksmus.

  • 1 žingsnis: Pirmiausia apskaičiuokite kvartiles, ty Q1, Q2 ir interquartile
  • 2 žingsnis: Dabar apskaičiuokite vertę Q2 * 1,5
  • 3 žingsnis: Dabar atimkite Q1 vertę iš 2 žingsnyje apskaičiuotos vertės
  • 4 žingsnis: Čia pridėkite Q3 su 2 žingsnyje apskaičiuota verte
  • 5 žingsnis: sukurkite 3 ir 4 veiksmuose apskaičiuotų verčių diapazoną
  • 6 žingsnis: išdėstykite duomenis didėjimo tvarka
  • 7 veiksmas: patikrinkite, ar yra kokių nors verčių, esančių žemiau ar didesnio už 5 žingsnyje sukurtą diapazoną

Pavyzdys

Apsvarstykite šių skaičių duomenų rinkinį: 10, 2, 4, 7, 8, 5, 11, 3, 12. Jūs turite apskaičiuoti visus pašalinius rodiklius.

Sprendimas:

Pirmiausia turime surikiuoti duomenis didėjimo tvarka, kad rastume medianą, kuri mums bus Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Kadangi stebėjimų skaičius yra nelyginis, kuris yra 9, mediana gulėtų 5-oje pozicijoje, kuri yra 7, ir tas pats bus Q2 šiame pavyzdyje.

Todėl Q1 apskaičiuojamas taip:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 bus - 

Q1 = 2,5 terminas

Tai reiškia, kad Q1 yra 2 ir 3 stebėjimų padėties vidurkis, kuris čia yra 3 ir 4, o jo vidurkis yra (3 + 4) / 2 = 3,5

Todėl Q3 apskaičiuojamas taip:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 bus - 

Q3 = 7,5 terminas

Tai reiškia, kad Q3 yra 7 ir 8 stebėjimų padėties vidurkis, kuris čia yra 10 ir 11, o tos pačios vertės vidurkis yra (10 + 11) / 2 = 10,5

Dabar žemų pašalinių rodiklių vertė turi būti žemesnė už Q1–1,5IQR, o aukštųjų - Q3 + 1,5IQR

Taigi vertės yra 3,5 - (1,5 * 7) = -7, o didesnis diapazonas yra 10,5 + (1,5 * 7) = 110,25.

Kadangi nėra jokių stebėjimų, kurie būtų aukščiau nei žemesni nei 110,25 ir -7, šioje imtyje nėra jokių pašalinių reikšmių.

Išskirtinės formulės „Excel“ pavyzdys (su „Excel“ šablonu)

Šį „Outlier Formula Excel“ šabloną galite atsisiųsti čia - „Outlier Formula Excel“ šablonas

Kūrybinės koučingo pamokos svarsto galimybę apdovanoti studentus, patekusius į 25% geriausiųjų. Duomenys skirti 25 studentams. Naudokite Outlier lygtį norėdami nustatyti, ar yra outlier?

Sprendimas:

Žemiau pateikiami duomenys, skirti apskaičiuoti ribas

Stebėjimų skaičius yra 25, o pirmasis žingsnis būtų aukščiau pateiktų neapdorotų duomenų konvertavimas didėjimo tvarka.

Mediana bus -

Vidutinė vertė = ½ (n + 1)

= ½ = ½ (26)

= 13-oji kadencija

Q2 arba mediana yra 68,00

Tai yra 50% gyventojų.

Q1 bus -

Q1 = ¼ (n + 1)-asis terminas

= ¼ (25 + 1)

= ¼ (26)

= 6,5-oji kadencija, tolygi 7-ajai kadencijai

Q1 yra 56,00, tai yra apatinė 25% dalis

Q3 bus -

Galiausiai Q3 = ¾ (n + 1)-asis terminas

= ¾ (26)

= 19,50 terminas

Čia reikia imti 19 ir 20 terminų vidurkį, kuris yra 77 ir 77, ir to paties vidurkis yra (77 + 77) / 2 = 77,00

 Q3 yra 77, o tai yra 25% viršų

Žemas nuotolis

Dabar žemų pašalinių rodiklių vertė turi būti žemesnė už Q1–1,5IQR, o aukštųjų - Q3 + 1,5IQR

Aukštas nuotolis -

Taigi vertės yra 56 - (1,5 * 68) = -46, o didesnis diapazonas yra 77 + (1,5 * 68) = 179.

Pašalinių nėra.

Aktualumas ir naudojimas

Išskirtinių formulę labai svarbu žinoti, nes gali būti duomenų, kurie iškreiptų tokią vertę. Paimkite 2, 4, 6, 101 stebėjimų pavyzdį ir dabar, jei kas nors ims šių verčių vidurkį, tai bus 28,25, bet 75% stebėjimų yra žemiau 7, taigi būtų neteisingas sprendimas dėl šios imties stebėjimų.

Čia galima pastebėti, kad 101, atrodo, aiškiai apibūdina ir, jei tai bus pašalinta, vidurkis būtų 4, o tai apie vertes ar pastebėjimus sako, kad jie yra 4 diapazone. Todėl labai svarbu atlikti šį skaičiavimą, kad būtų išvengta bet koks piktnaudžiavimas pagrindine duomenų informacija. Jie yra plačiai naudojami statistikų visame pasaulyje, kai jie atlieka tyrimus.


$config[zx-auto] not found$config[zx-overlay] not found