Parametrische statistieken

Parametrische statistieken is een tak van statistieken die ervan uitgaat dat steekproefgegevens afkomstig zijn van een populatie die adequaat kan worden gemodelleerd door een waarschijnlijkheidsverdeling dat heeft een vaste set van parameters.[1] Omgekeerd a niet-parametrisch model neemt geen expliciete (eindige-parametrische) wiskundige vorm aan voor de verdeling bij het modelleren van de gegevens. Het kan echter enkele veronderstellingen maken over die verdeling, zoals continuïteit of symmetrie.

De meest bekende statistische methoden zijn parametrisch.[2] Wat betreft niet -parametrische (en semiparametrische) modellen, Sir David Cox heeft gezegd: "deze omvatten meestal minder veronderstellingen van structuur en distributievorm, maar bevatten meestal sterke veronderstellingen over onafhankelijkheid".[3]

Voorbeeld

De Normale familie van distributies Ze hebben allemaal dezelfde algemene vorm en zijn geparametriseerd door gemeen en standaardafwijking. Dat betekent dat als het gemiddelde en de standaardafwijking bekend zijn en als de verdeling normaal is, de kans op toekomstige observatie in een bepaald bereik bekend is.

Stel dat we een monster van 99 testscores hebben met een gemiddelde van 100 en een standaardafwijking van 1. Als we aannemen dat alle 99 testscores willekeurige waarnemingen zijn van een normale verdeling, voorspellen we dat er een kans van 1% is dat de 100e test Score zal hoger zijn dan 102.33 (dat wil zeggen het gemiddelde plus 2.33 standaardafwijkingen), ervan uitgaande dat de 100e testscore afkomstig is van dezelfde verdeling als de andere. Parametrische statistische methoden worden gebruikt om de bovenstaande 2.33 -waarde te berekenen, gegeven 99 onafhankelijk Observaties van dezelfde normale verdeling.

A niet parametrisch Schatting van hetzelfde is het maximum van de eerste 99 scores. We hoeven niets aan te nemen over de verdeling van testscores om te redeneren dat het voordat we de test gaven even waarschijnlijk was dat de hoogste score een van de eerste 100 zou zijn. Er is dus een kans van 1% dat de 100e score is hoger dan een van de 99 die eraan voorafgingen.

Geschiedenis

Parametrische statistieken werden genoemd door R. A. Fisher in zijn werk Statistische methoden voor onderzoekswerkers in 1925, die de basis creëerde voor moderne statistieken.

Zie ook

Referenties

  1. ^ Geisser, S. (2006), Modi van parametrische statistische inferentie, John Wiley & Sons
  2. ^ Cox, D. R. (2006), Principes van statistische inferentie, Cambridge University Press
  3. ^ Cox 2006, p. 2