R kvadratas (R ^ 2) - apibrėžimas, formulė, apskaičiuokite R kvadratą

Kas yra R kvadratas (R2) regresijoje?

R kvadratas (R2) yra svarbus statistinis matas, kuris yra regresijos modelis, kuris statistiniu požiūriu rodo priklausomo kintamojo skirtumą ar dispersiją, kurią galima paaiškinti nepriklausomu kintamuoju ar kintamaisiais. Trumpai tariant, tai nustato, ar duomenys tiks regresijos modeliui.

R kvadratinė formulė

Norėdami apskaičiuoti R kvadratą, turite nustatyti koreliacijos koeficientą ir tada rezultatą kvadratuoti.

R kvadratinė formulė = r2

Kur r koreliacijos koeficientą galima apskaičiuoti pagal žemiau pateiktą reikšmę:

Kur,

  • r = koreliacijos koeficientas
  • n = skaičius nurodytame duomenų rinkinyje
  • x = pirmasis kintamasis kontekste
  • y = antrasis kintamasis

Paaiškinimas

Jei tarp šių dviejų kintamųjų yra koks nors ryšys ar koreliacija, kuri gali būti tiesinė ar netiesinė, tada jis nurodo, ar pasikeitė nepriklausomo kintamojo vertė, tada kitas priklausomas kintamasis greičiausiai pasikeis verte, tarkim, tiesiškai ar netiesiogiai. tiesiškai.

Formulės skaitiklio dalis atlieka bandymą, ar jie juda kartu, ir pašalina jų atskirus judesius ir santykinį jėga, judant kartu, o formulės vardiklio dalis skaitiklį skaito, imdama kvadratinę šaknies šaknies skirtumą, gautą iš kintamieji iš jų kintamųjų. Kai kvadratu apskaičiuosite šį rezultatą, gausime R kvadratą, kuris yra ne kas kita, o apsisprendimo koeficientas.

Pavyzdžiai

Šį „R Squared Formula Excel“ šabloną galite atsisiųsti čia - „R Squared Formula Excel“ šabloną

1 pavyzdys

Apsvarstykite šiuos du kintamuosius x ir y, jums reikia apskaičiuoti R kvadratą regresijoje.

Sprendimas:

Naudodamiesi minėta formule, pirmiausia turime apskaičiuoti koreliacijos koeficientą.

Mes turime visas aukščiau pateiktoje lentelėje pateiktas reikšmes, kai n = 4.

Įveskime reikšmes į formulę, kad gautume paveikslą.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ [(4 * 21 274,94) - (326,89) 2] * [(4 * 31 901,89) - (326,89) 2]

r = 17 501,06 / 17 512,88

Koreliacijos koeficientas bus

r = 0,99932480

Taigi, skaičiavimas bus toks,

r2 = (0,99932480) 2

R kvadratinė formulė regresijoje

r2 = 0,998650052

2 pavyzdys

Indija, besivystanti šalis, nori atlikti nepriklausomą analizę, ar žalios naftos kainų pokyčiai paveikė jos rupijos vertę. Toliau pateikiama „Brent“ žaliavinės naftos kainos ir rupijos vertinimo istorija, palyginti su doleriais, kuri vyravo vidutiniškai tais metais žemiau.

Indijos centrinis bankas RBI kreipėsi į jus, kad pateiktumėte pranešimą apie tą patį kitame susitikime. Nustatykite, ar žalios naftos pokyčiai veikia rupijos už dolerį pokyčius?

Sprendimas:

Naudodami aukščiau pateiktą koreliacijos formulę, pirmiausia galime apskaičiuoti koreliacijos koeficientą. Vidutinės žalios naftos kainos vertinimas kaip vienas kintamasis sako x, o rupija už dolerį - kaip kitas kintamasis kaip y

Mes turime visas aukščiau pateiktoje lentelėje pateiktas reikšmes, kai n = 6.

Įveskime reikšmes į formulę, kad gautume paveikslą.

r = (6 * 23592,83) - (356,70 * 398,59) / √ [(6 * 22829,36) - (356,70) 2] * [(6 * 26529,38) - (398,59) 2]

r = -620,06 / 1,715,95

Koreliacijos koeficientas bus

r = -0,3614

Taigi, skaičiavimas bus toks,

r2 = (-0,3614) 2

R kvadratinė formulė regresijoje

r2 = 0,1306

Analizė: Atrodo, kad žalios naftos kainų pokyčiai ir Indijos rupijos kainos pokyčiai yra nedideli. Didėjant žalios naftos kainoms, įtakos turi ir Indijos rupijos pokyčiai. Kadangi R kvadratas yra tik 13%, žalios naftos kainos pokyčiai labai mažiau paaiškina Indijos rupijos pokyčius, o Indijos rupija taip pat keičiasi kitais kintamaisiais, už kuriuos reikia atsižvelgti.

3 pavyzdys

XYZ laboratorija atlieka ūgio ir svorio tyrimus ir nori sužinoti, ar tarp šių kintamųjų yra koks nors ryšys. Surinkęs 5000 žmonių atranką kiekvienai kategorijai ir sugalvojęs vidutinį svorį ir vidutinį ūgį toje grupėje.

Žemiau pateikiama jų surinkta informacija.

Privalote apskaičiuoti R kvadratą ir padaryti išvadą, jei šis modelis paaiškina aukščio skirtumus ir svorio svyravimus.

Sprendimas:

Naudodami aukščiau pateiktą koreliacijos formulę, pirmiausia galime apskaičiuoti koreliacijos koeficientą. Vertinant ūgį kaip vieną kintamąjį sakoma x, o svorį - kaip kitą kintamąjį - y

Mes turime visas aukščiau pateiktoje lentelėje pateiktas reikšmes, kai n = 6.

Įveskime reikšmes į formulę, kad gautume paveikslą.

r = (7 * 74 058,67) - (1031 * 496,44) / √ [(7 * 153595 - (1031) 2] * [(7 * 35793,59) - (496,44) 2]

r = 6581,05 / 7075,77

Koreliacijos koeficientas bus

Koreliacijos koeficientas (r) = 0,930

Taigi, skaičiavimas bus toks,

r2 = 0,865

Analizė: Koreliacija yra teigiama ir atrodo, kad yra tam tikras ryšys tarp ūgio ir svorio, nes ūgis didina žmogaus svorį. Nors R2 teigia, kad 86% ūgio pokyčių siejami su svorio pokyčiais ir 14% yra nepaaiškinami.

Aktualumas ir naudojimas

R kvadrato reikšmė regresijoje yra jos sugebėjimas rasti būsimų įvykių tikimybę pagal numatomus rezultatus arba rezultatus. Jei prie modelio pridedama daugiau pavyzdžių, koeficientas parodys tikimybę arba tikimybę, kad naujas taškas ar naujas duomenų rinkinys nukris tiese. Net jei abu kintamieji turi tvirtą ryšį, nustatymas neįrodo priežastingumo.

Kai kurios erdvės, kuriose dažniausiai naudojamas R kvadratas, yra naudojamos investicinių fondų rezultatams stebėti, rizikos draudimo fondų rizikai stebėti, siekiant nustatyti, kaip gerai akcijos juda kartu su rinka, kur R2 pasiūlytų, kiek akcijų pokyčių galima paaiškinti. rinkos pokyčiai.