Statistiek

A statistiek (enkelvoudig) of steekproefstatistiek is elke hoeveelheid berekend uit waarden in een steekproef die wordt overwogen voor een statistisch doel. Statistische doeleinden omvatten schatting a bevolking parameter, een monster beschrijven of een hypothese evalueren. De Gemiddeld (of gemiddeld) van steekproefwaarden is een statistiek. De term statistiek wordt zowel voor de functie als voor de waarde van de functie op een bepaald monster gebruikt. Wanneer een statistiek voor een specifiek doel wordt gebruikt, kan deze worden verwezen door een naam die het doel ervan aangeeft.

Wanneer een statistiek wordt gebruikt voor het schatten van een populatieparameter, wordt de statistiek een schatter. Een populatieparameter is een kenmerk van een bestudeerde populatie, maar wanneer deze niet haalbaar is om de waarde van een populatieparameter direct te meten, worden statistische methoden gebruikt om de waarschijnlijke waarde van de parameter af te leiden op basis van een statistiek berekend uit een monster genomen van de bevolking. Bijvoorbeeld de monstergemiddelde is een onbevooroordeelde schatter van de populatie gemiddelde. Dit betekent dat de verwachte waarde van het steekproefgemiddelde is gelijk aan het werkelijke populatiegemiddelde.[1]

A beschrijvende statistiek wordt gebruikt om de voorbeeldgegevens samen te vatten. EEN teststatistiek wordt gebruikt in Statistische hypothese -testen. Merk op dat een enkele statistiek voor meerdere doeleinden kan worden gebruikt - het monstergemiddelde kan bijvoorbeeld worden gebruikt om het populatiegemiddelde te schatten, om een ​​steekproefgegevensset te beschrijven of om een ​​hypothese te testen.

Voorbeelden

Enkele voorbeelden van statistieken zijn:

  • "In een recent onderzoek van Amerikanen, 52% van Republikeinen Zeg dat de opwarming van de aarde gebeurt. "

In dit geval is "52%" een statistiek, namelijk het percentage Republikeinen in de enquête -steekproef die in de opwarming van de aarde geloven. De bevolking is de set Van alle Republikeinen in de Verenigde Staten, en de geschatte bevolkingsparameter is het percentage van allemaal Republikeinen in de Verenigde Staten, niet alleen de ondervraagden, die geloven in de opwarming van de aarde.

  • "De manager van een groot hotel in de buurt van Disney World gaf aan dat 20 geselecteerde gasten een gemiddelde verblijfsduur hadden 5.6 Dagen. "

In dit voorbeeld is "5,6 dagen" een statistiek, namelijk de gemiddelde verblijfsduur voor onze steekproef van 20 hotelgasten. De bevolking is de set van alle gasten van dit hotel, en de geschatte populatieparameter is de gemiddelde verblijfsduur voor allemaal Gasten.[2] Merk op dat of de schatter in dit geval onbevooroordeeld is, afhangt van het selectieproces van het monster; zien de inspectieparadox.

Er zijn verschillende functies die worden gebruikt om statistieken te berekenen. Sommige zijn onder meer:

Eigendommen

Waarneembaarheid

Statistici overwegen vaak een geparametriseerde familie van waarschijnlijkheidsverdelingen, waarvan elk lid de verdeling zou kunnen zijn van een meetbaar aspect van elk lid van een populatie, waaruit een steekproef willekeurig wordt getrokken. De parameter kan bijvoorbeeld de gemiddelde hoogte zijn van 25-jarige mannen in Noord-Amerika. De hoogte van de leden van een steekproef van 100 van dergelijke mannen wordt gemeten; Het gemiddelde van die 100 cijfers is een statistiek. Het gemiddelde van de hoogten van alle leden van de bevolking is geen statistiek tenzij dat op de een of andere manier ook is vastgesteld (zoals door elk lid van de bevolking te meten). De gemiddelde hoogte die zou worden berekend met behulp van allemaal van de individuele hoogten van allemaal 25-jarige Noord-Amerikaanse mannen is een parameter en geen statistiek.


Statistische eigenschappen

Belangrijke potentiële eigenschappen van statistieken omvatten volledigheid, samenhang, toereikendheid, onbevooroordeel, Minimale gemiddelde vierkante fout, laag variantie, robuustheiden computationeel gemak.

Informatie over een statistiek

Informatie over een statistiek over modelparameters kan op verschillende manieren worden gedefinieerd. De meest voorkomende is de Fisher -informatie, dat wordt gedefinieerd op het statistiekmodel veroorzaakt door de statistiek. Kullback -informatie maat kan ook worden gebruikt.

Zie ook

Referenties

  • Kokoska, Stephen (2015). Inleidende statistieken: een probleemoplossende aanpak (2e ed.). New York: W. H. Freeman and Company. ISBN 978-1-4641-1169-3.
  • Parker, Sybil P (hoofdredacteur). "Statistiek". McGraw-Hill Dictionary of Scientific and Technical Feards. Vijfde editie. McGraw-Hill, Inc. 1994. ISBN0-07-042333-4. Pagina 1912.
  • Degroot en Schervish. "Definitie van een statistiek". Waarschijnlijkheid en statistieken. Internationale editie. Derde editie. Addison Wesley. 2002. ISBN0-321-20473-5. Pagina's 370 tot 371.
  1. ^ Kokoska 2015, p. 296-308.
  2. ^ Kokoska 2015, p. 296-297.