Standaard score

In statistieken, de Standaard score is het aantal standaard afwijkingen waardoor de waarde van een ruwe score (d.w.z. een waargenomen waarde of gegevenspunt) is boven of onder de gemeen waarde van wat wordt waargenomen of gemeten. Ruwe scores boven het gemiddelde hebben positieve standaardscores, terwijl die onder het gemiddelde negatieve standaardscores hebben.
Het wordt berekend door de populatie gemiddelde van een individuele ruwe score en vervolgens het verschil delen door de bevolking standaardafwijking. Dit proces van het omzetten van een ruwe score in een standaardscore wordt genoemd standaardisatie of normaal ("Normaliseren" kan echter verwijzen naar vele soorten verhoudingen; zie normalisatie voor meer).
Standaardscores worden meestal genoemd z-Scores; De twee termen kunnen door elkaar worden gebruikt, zoals in dit artikel. Andere equivalente termen die in gebruik zijn, zijn onder meer Z-waarden, normale scores, gestandaardiseerde variabelen en trekken in Hoge energie -fysica.[1][2]
Het berekenen van een z-score vereist kennis van het gemiddelde en de standaardafwijking van de volledige populatie waartoe een gegevenspunt behoort; Als men slechts een steekproef van waarnemingen van de populatie, vervolgens de analoge berekening met behulp van het monstergemiddelde en de standaarddeviatie van de steekproef levert de t-statistisch.
Berekening
Als het bevolkingsgemiddelde en de standaarddeviatie van de bevolking bekend zijn, een ruwe scorex wordt omgezet in een standaardscore door[3]
waar:
- μ is de gemeen van de populatie,
- σ is de standaardafwijking van de populatie.
De absolute waarde van z vertegenwoordigt de afstand tussen die ruwe score x en de bevolking betekent in eenheden van de standaardafwijking. z is negatief wanneer de RAW -score onder het gemiddelde is, positief wanneer hierboven.
Berekenen z Het gebruik van deze formule vereist het gebruik van het populatiegemiddelde en de standaardafwijking van de populatie, niet het steekproefgemiddelde of steekproefafwijking. Het kennen van het ware gemiddelde en de standaardafwijking van een bevolking is echter vaak een onrealistische verwachting, behalve in gevallen zoals zoals gestandaardiseerd testen, waar de hele bevolking wordt gemeten.
Wanneer het populatiegemiddelde en de standaardafwijking van de populatie onbekend zijn, kan de standaardscore worden geschat met behulp van het steekproefgemiddelde en de standaarddeviatie als schattingen van de populatiewaarden.[4][5][6][7]
In deze gevallen, de z-Score wordt gegeven door
waar:
- is de gemeen van het monster,
- S is de standaardafwijking van het monster.
Hoewel het altijd moet worden vermeld, wordt het onderscheid tussen het gebruik van de populatie en steekproefstatistieken vaak niet gemaakt. In beide gevallen hebben de teller en de noemer van de vergelijkingen dezelfde maateenheden zodat de eenheden worden geannuleerd via divisie en z wordt achtergelaten als een Dimensieloze hoeveelheid.
Toepassingen
Z-test
De z-score wordt vaak gebruikt in de z-test in gestandaardiseerde testen-de analoog van de Student's t-test voor een populatie waarvan de parameters bekend zijn, in plaats van geschat. Omdat het heel ongebruikelijk is om de hele bevolking te kennen, wordt de t-test veel breder gebruikt.
Voorspellingsintervallen
De standaardscore kan worden gebruikt bij de berekening van voorspellingsintervallen. Een voorspellingsinterval [L,U], bestaande uit een lager eindpunt aangewezen L en een bovenste eindpunt aangewezen U, is een interval zodanig dat een toekomstige observatie X zal met grote waarschijnlijkheid in het interval liggen , d.w.z.
Voor de standaardscore Z van X het geeft:[8]
Door de kwantiele z zodanig te bepalen
het volgt:
Procescontrole
In procescontroletoepassingen biedt de Z-waarde een beoordeling van de mate waarin een proces off-target werkt.
Vergelijking van scores gemeten op verschillende schalen: ACT en SAT

Wanneer scores op verschillende schalen worden gemeten, kunnen deze worden omgezet in Z-scores om de vergelijking te ondersteunen. Dietz et al.[9] Geef het volgende voorbeeld dat de scores van studenten op de (oude) vergelijken ZA en HANDELEN middelbare schooltests. De tabel toont de gemiddelde en standaardafwijking voor totale score op de SAT en ACT. Stel dat student A op de SAT 1800 scoorde en student B scoorde 24 op de ACT. Welke student presteerde beter ten opzichte van andere testpersonen?
ZA | HANDELEN | |
---|---|---|
Gemeen | 1500 | 21 |
Standaardafwijking | 300 | 5 |

De z-score voor student a is
De z-score voor student B is
Omdat student A een hogere Z-score heeft dan student B, presteerde student A beter in vergelijking met andere test-takers dan student B.
Percentage waarnemingen onder een Z-score
Voortzetting van het voorbeeld van ACT- en SAT-scores, als verder kan worden aangenomen dat zowel ACT- als SAT-scores normaal worden verdeeld (wat ongeveer correct is), kunnen de Z-scores worden gebruikt om het percentage testpersonen te berekenen dat lager is ontvangen Scores dan studenten A en B.
Clusteranalyse en multidimensionale schaal
"Voor sommige multivariate technieken zoals multidimensionale schaal- en clusteranalyse is het concept van afstand tussen de eenheden in de gegevens vaak van aanzienlijk belang en belang ... wanneer de variabelen in een multivariate dataset op verschillende schalen zijn, is het logischer om te berekenen om te berekenen de afstanden na een vorm van standaardisatie. "[10]
Analyse van de belangrijkste componenten
In principale componenten analyse, "variabelen gemeten op verschillende schalen of op een gemeenschappelijke schaal met sterk verschillende bereiken worden vaak gestandaardiseerd."[11]
Relatief belang van variabelen bij meerdere regressie: gestandaardiseerde regressiecoëfficiënten
Standaardisatie van variabelen voorafgaand aan meervoudige regressie-analyse wordt soms gebruikt als hulpmiddel voor interpretatie.[12] (pagina 95) vermeld het volgende.
"De gestandaardiseerde regressielope is de helling in de regressievergelijking als x en y zijn gestandaardiseerd ... standaardisatie van x en y wordt gedaan door de respectieve middelen af te trekken van elke set van waarnemingen en te delen door de respectieve standaardafwijkingen ... in meervoudige regressie, waar verschillende X -variabelen worden gebruikt, de gestandaardiseerde regressiecoëfficiënten kwantificeren de relatieve bijdrage van elke X -variabele. "
Kutner et al.[13] (p 278) Geef het volgende voorbehoud: "... men moet voorzichtig zijn met het interpreteren van regressiecoëfficiënten, al dan niet gestandaardiseerd. De reden is dat wanneer de voorspellende variabelen onderling gecorreleerd zijn, ... de regressiecoëfficiënten worden beïnvloed door de andere voorspellende variabelen In het model ... de grootten van de gestandaardiseerde regressiecoëfficiënten worden niet alleen beïnvloed door de aanwezigheid van correlaties tussen de voorspellende variabelen, maar ook door de afstanden van de waarnemingen op elk van deze variabelen. Soms kunnen deze afstand vrij willekeurig zijn. Vandaar dat het is, is het dat is, het is dat is. Normaal gesproken niet verstandig om de magnitudes van gestandaardiseerde regressiecoëfficiënten te interpreteren als een weerspiegeling van het vergelijkende belang van de voorspellende variabelen. "
Standaardiseren in wiskundige statistieken
In Wiskundige statistieken, a willekeurige variabele X is gestandaardiseerd door zijn af te trekken verwachte waarde en het verschil delen door zijn standaardafwijking
Als de willekeurige variabele in overweging de monstergemiddelde van een willekeurig monster van X:
dan is de gestandaardiseerde versie
T-score
In educatieve beoordeling, T-score is een standaardscore z verschoven en geschaald om een gemiddelde van 50 te hebben en een standaardafwijking van 10.[14][15][16] Het staat ook bekend als Hensachi in het Japans, waar het concept veel meer bekend is en gebruikt in de context van universitaire toelating.
In botdichtheidsmetingen is de T-score de standaardscore van de meting vergeleken met de populatie van gezonde 30-jarige volwassenen, en heeft het gebruikelijke gemiddelde van 0 en standaardafwijking van 1.[17]
Zie ook
Referenties
- ^ Mulders, Martijn; Zanderighi, Giulia, eds. (2017). 2015 European School of High -Energy Physics: Bansko, Bulgarije 02 - 15 september 2015. CERN YELL Rapporten: schoolprocedures. Genève: CERN. ISBN 978-92-9083-472-4.
- ^ Gross, Eilam (2017-11-06). "Praktische statistieken voor fysica met hoge energie". CERN YELL Rapporten: schoolprocedures. 4/2017: 165–186. doen:10.23730/CYRSP-2017-004.165.
- ^ E. Kreyszig (1979). Geavanceerde engineering wiskunde (Vierde ed.). Wiley. p. 880, Vgl. 5. ISBN 0-471-02140-7.
- ^ Spiegel, Murray R.; Stephens, Larry J (2008), Schaum's Countress Statistics (Vierde ed.), McGraw Hill, ISBN 978-0-07-148584-5
- ^ Mendenhall, William; Sincich, Terry (2007), Statistieken voor engineering en de wetenschappen (Vijfde ed.), Pearson / Prentice Hall, ISBN 978-0131877061
- ^ Glantz, Stanton A.; Slinker, Bryan K.; Neilands, Torsten B. (2016), Primer van toegepaste regressie en variantieanalyse (Derde ed.), McGraw Hill, ISBN 978-0071824118
- ^ Aho, Ken A. (2014), Fundamentele en toegepaste statistieken voor biologen (Eerste ed.), Chapman & Hall / CRC Press, ISBN 978-1439873380
- ^ E. Kreyszig (1979). Geavanceerde engineering wiskunde (Vierde ed.). Wiley. p. 880, Vgl. 6. ISBN 0-471-02140-7.
- ^ Diez, David; Barr, Christopher; Çetinkaya-Rundel, Mine (2012), OpenIntro -statistieken (Second ed.), Openintro.org
- ^ Everitt, Brian; Hothorn, Torsten J (2011), Een inleiding tot toegepaste multivariate analyse met r, Springer, ISBN 978-1441996497
- ^ Johnson, Richard; Wichern, Wichern (2007), Multivariate statistische analyse toegepast, Pearson / Prentice Hall
- ^ Afifi, Abdelmonem; May, Susanne K.; Clark, Virginia A. (2012), Praktische multivariate analyse (Vijfde ed.), Chapman & Hall/CRC, ISBN 978-1439816806
- ^ Kutner, Michael; Nachtsheim, Christopher; Neter, John (204), Lineaire regressiemodellen toegepast (Vierde ed.), McGraw Hill, ISBN 978-0073014661
- ^ John Salvia; James Ysseldyke; Sara Witmer (29 januari 2009). Beoordeling: in speciale en inclusieve opleiding. Cengage leren. pp. 43–. ISBN 978-0-547-13437-6.
- ^ Edward S. Neukrug; R. Charles Fawcett (1 januari 2014). Essentials van testen en beoordeling: een praktische gids voor counselors, maatschappelijk werkers en psychologen. Cengage leren. pp. 133–. ISBN 978-1-305-16183-2.
- ^ Randy W. Kamphaus (16 augustus 2005). Klinische beoordeling van intelligentie voor kinderen en adolescenten.Springer.pp. 123–. ISBN 978-0-387-26299-4.
- ^ "Botmassa meting: wat de getallen betekenen". Nih osteoporose en gerelateerde botziekten National Resource Center. National Institute of Health. Opgehaald 5 augustus 2017.
Verder lezen
- Carroll, Susan Rovezzi;Carroll, David J. (2002). Statistieken eenvoudig gemaakt voor schoolleiders (Illustrated ed.).Rowman & Littlefield. ISBN 978-0-8108-4322-6. Opgehaald 7 juni 2009.
- Larsen, Richard J.;Marx, Morris L. (2000). Een inleiding tot wiskundige statistieken en de toepassingen ervan (Derde ed.).p.282. ISBN 0-13-922303-7.