Korrelaatiokerroimen laskeminen Excelissä (2 helppoa tapaa)

Excel on tehokas työkalu, jolla on hämmästyttäviä toimintoja tilastoja käsiteltäessä.

Korrelaation löytäminen kahden datasarjan välillä on yksi yleisimmistä tilastollisista laskutoimituksista suurten tietojoukkojen kanssa.

Työskentelin talousanalyytikkona muutama vuosi sitten, ja vaikka emme olleet vahvasti mukana tilastotiedoissa, korrelaation löytäminen oli jotain, mitä meidän oli vielä tehtävä melko usein.

Tässä opetusohjelmassa näytän sinulle kaksi todella helppoa tapaa laskea korrelaatiokerroin Excelissä. Tätä varten on jo sisäänrakennettu toiminto, ja voit myös käyttää Data Analysis Toolpakia.

Aloitetaan siis!

Mikä on korrelaatiokerroin?

Koska tämä ei ole tilastoluokka, haluan selittää lyhyesti, mikä on korrelaatiokerroin, ja siirrymme sitten osaan, jossa laskemme korrelaatiokerroimen Excelissä.

Korrelaatiokerroin on arvo, joka kertoo kuinka läheisesti kaksi datasarjaa liittyvät toisiinsa.

Yleisesti käytetty esimerkki on 10 henkilön paino ja pituus ryhmässä. Jos laskemme näiden ihmisten pituus- ja painotietojen korrelaatiokertoimen, saamme arvon -1 ja 1 välillä.

Alle nolla arvo osoittaa negatiivisen korrelaation, mikä tarkoittaa, että jos korkeus kasvaa, paino pienenee tai jos paino kasvaa silloin korkeuden laskua.

Ja arvo yli nolla osoittaa positiivisen korrelaation, mikä tarkoittaa, että jos korkeus kasvaa, paino kasvaa ja jos korkeus laskee, paino laskee.

Mitä lähempänä arvo on 1, sitä vahvempi on positiivinen korrelaatio. Joten arvo 0,8 osoittaisi, että korkeus- ja painotiedot korreloivat vahvasti keskenään.

Huomautus: Korrelaatiokertoimia ja tilastoja on erityyppisiä, mutta tässä opetusohjelmassa tarkastellaan yleisintä, joka on Pearsonin korrelaatiokerroin

Katsotaanpa nyt, kuinka tämä korrelaatiokerroin lasketaan Excelissä.

Korrelaatiokertoimen laskeminen Excelissä

Kuten mainitsin, on olemassa pari tapaa laskea korrelaatiokerroin Excelissä.

CORREL -kaavan käyttäminen

CORREL on tilastotoiminto, joka otettiin käyttöön Excel 2007: ssä.

Oletetaan, että sinulla on alla olevan kuvan mukainen tietojoukko, jossa haluat laskea korrelaatiokertoimen 10 henkilön pituuden ja painon välillä.

Alla on kaava, jolla tämä tehdään:

= VIRTA (B2: B12, C2: C12)

Yllä oleva CORREL -funktio sisältää kaksi argumenttia - sarjan, jossa on korkeusdatapisteet ja sarjan, jossa on painotietopisteet.

Ja siinä se!

Heti kun painat Enter-näppäintä, Excel suorittaa kaikki laskelmat taustalla ja antaa sinulle yhden Pearsonin korrelaatiokerroinluvun.

Esimerkissämme tämä arvo on hieman yli .5, mikä osoittaa, että positiivinen korrelaatio on melko vahva.

Tätä menetelmää käytetään parhaiten, jos sinulla on kaksi sarjaa ja haluat vain korrelaatiokertoimen.

Mutta jos sinulla on useita sarjoja ja haluat selvittää kaikkien näiden sarjojen korrelaatiokertoimen, voit myös harkita tietojen analysointityökalupaketin käyttöä Excelissä (käsitellään seuraavassa)

Data Analysis Toolpakin käyttäminen

Excelissä on Data Analysis Toolpak, jonka avulla voidaan nopeasti laskea erilaisia ​​tilastollisia arvoja (mukaan lukien korrelaatiokertoimen saaminen).

Mutta tietojen analysointityökalupakki on oletuksena pois käytöstä Excelissä. Joten ensimmäinen askel olisi ottaa käyttöön tietojen analysointityökalu ja laskea sitten sen avulla Pearsonin korrelaatiokerroin Excelissä.

Data Analysis Toolpakin käyttöönotto

Alla on ohjeet tietojen analysointityökalupaketin ottamiseen käyttöön Excelissä:

  1. Napsauta Tiedosto -välilehteä
  2. Napsauta Asetukset
  3. Napsauta avautuvassa Excel-asetukset-valintaikkunassa sivupalkki-apuohjelmat-vaihtoehtoa
  4. Valitse avattavasta Hallitse-valikosta Excel-apuohjelmat
  5. Napsauta Siirry. Tämä avaa apuohjelmien valintaikkunan
  6. Tarkista Analysis Toolpak -vaihtoehto
  7. Napsauta Ok

Yllä olevat vaiheet lisäisivät uuden ryhmän Excel -valintanauhan Data -välilehdelle nimeltä Analyysi. Tässä ryhmässä sinulla olisi Data Analysis -vaihtoehto

Korrelaatiokertoimen laskeminen Data Analysis Toolpakin avulla

Nyt kun analyysityökalu on jälleen käytettävissä nauhassa, katsotaanpa, kuinka lasketaan korrelaatiokerroin sen avulla.

Oletetaan, että sinulla on alla esitetyn kaltainen tietojoukko ja haluat selvittää kolmen sarjan (korkeus ja paino, pituus ja tulot sekä paino ja tulot) välisen korrelaation.

Alla on vaiheet tämän tekemiseen:

  1. Napsauta Data -välilehteä
  2. Napsauta Analysis -ryhmässä Data Analysis -vaihtoehtoa
  3. Napsauta avautuvassa Tietojen analysointi -valintaikkunassa Korrelaatio
  4. Napsauta OK. Tämä avaa Korrelaatio -valintaikkunan
  5. Valitse syöttöalueeksi kolme sarjaa - myös otsikot
  6. Varmista ryhmittelyn mukaan, että Sarakkeet on valittuna
  7. Valitse vaihtoehto - "Tarra ensimmäisellä rivillä". Näin varmistetaan, että tuloksena olevissa tiedoissa on samat otsikot ja tulosten ymmärtäminen on paljon helpompaa
  8. Valitse tulostusvaihtoehdoista, mihin haluat saada taulukon. Aion käyttää solua G1 samalla laskentataulukolla. Voit myös halutessasi näyttää tulokset uudella laskentataulukolla tai uudella työkirjalla
  9. Napsauta OK

Heti kun teet tämän, Excel laskee korrelaatiokertoimen kaikille sarjoille ja antaa sinulle alla olevan taulukon:

Huomaa, että tuloksena oleva taulukko on staattinen, eikä sitä päivitetä, jos jokin taulukon datapisteistä muuttuu. Jos muutoksia tapahtuu, sinun on toistettava yllä olevat vaiheet uuden korrelaatiokertoimien taulukon luomiseksi.

Nämä ovat siis kaksi nopeaa ja helppoa tapaa laskea korrelaatiokerroin Excelissä.

Toivottavasti pidit tätä opetusohjelmaa hyödyllisenä!

wave wave wave wave wave