Psychometrie
Psychometrie is een vakgebied van binnenin psychologie bezorgd over de theorie en techniek van meting. Psychometrie verwijst over het algemeen naar gespecialiseerde velden binnen psychologie en onderwijs gewijd aan testen, meting, beoordeling en gerelateerde activiteiten.[1] Psychometrie houdt zich bezig met de objectieve meting van latente constructies dat kan niet direct worden waargenomen. Voorbeelden van latente constructen zijn intelligentie-, introversie, psychische aandoening, en leerprestatie.[2] De niveaus van individuen op niet -observeerbare latente variabelen zijn afgeleide door wiskundige modellering Op basis van wat wordt waargenomen uit de antwoorden van individuen op items op tests en schalen.[2]
Beoefenaars worden beschreven als psychometricians, hoewel niet iedereen die zich bezighoudt met psychometrisch onderzoek door deze titel. Psychometricians hebben meestal een specifieke kwalificatie zoals graden of certificeringen, en de meeste zijn psychologen met geavanceerde afgestudeerde training in psychometrie en meettheorie. Naast traditionele, academische instellingen werken beoefenaars ook voor organisaties zoals de Educatieve testservice en Psychologisch bedrijf. Sommige psychometrische onderzoekers richten zich op de constructie en validatie van beoordelingsinstrumenten, waaronder enquêtes, schubben, en open- of dichtbij vragenlijsten. Anderen richten zich op onderzoek met betrekking tot meettheorie (bijv. Itemresponstheorie; intraclass correlatie) of gespecialiseerd als leren en ontwikkeling professionals.
Historische basis
Psychologisch testen zijn afkomstig van twee denkromen: de eerste, van Darwin, Galton, en Cattell Over de meting van individuele verschillen, en de tweede, van Kruid, Weber, Fechner, en Wundt en hun psychofysische metingen van een vergelijkbaar construct. De tweede set individuen en hun onderzoek is wat heeft geleid tot de ontwikkeling van experimentele psychologie en gestandaardiseerde testen.[3]
Victoriaanse stroom
Charles Darwin was de inspiratie achter Sir Francis Galton, een wetenschapper die de ontwikkeling van psychometrie heeft geavanceerd. In 1859 publiceerde Darwin zijn boek Over de herkomst van soorten. Darwin beschreef de rol van natuurlijke selectie in de opkomst, in de loop van de tijd, van verschillende populaties van soorten planten en dieren. Het boek liet zien hoe individuele leden van een soorten verschillen tussen elkaar en hoe ze kenmerken bezitten die min of meer adaptief zijn aan hun omgeving. Degenen met meer adaptieve kenmerken hebben meer kans om te overleven om zich voort te brengen en aanleiding te geven tot een andere generatie. Degenen met minder adaptieve kenmerken zijn minder waarschijnlijk. Deze ideeën stimuleerden de interesse van Galton in de studie van mensen en hoe ze elkaar verschillen van een ander en, nog belangrijker, hoe die verschillen te meten.
Galton schreef een boek getiteld Erfelijk genie. Het boek beschreef verschillende kenmerken die mensen bezitten en hoe die kenmerken wat meer "fit" maken dan andere. Tegenwoordig zijn deze verschillen, zoals sensorisch en motorisch functioneren (reactietijd, gezichtsscherpte en fysieke sterkte), belangrijke domeinen van de wetenschappelijke psychologie. Veel van de vroege theoretische en toegepaste werk in psychometrie werd uitgevoerd in een poging om te meten intelligentie-. Galton, vaak aangeduid als 'de vader van de psychometrie', bedacht en omvatte mentale tests onder de zijne antropometrisch maatregelen. James McKeen Cattell, een pionier op het gebied van psychometrie, breidde het werk van Galton uit. Cattell bedacht de term mentale test, en is verantwoordelijk voor onderzoek en kennis die uiteindelijk heeft geleid tot de ontwikkeling van moderne tests.[4]
Duitse stroom
De oorsprong van psychometrie heeft ook verbindingen met het gerelateerde veld van psychofysica. Rond dezelfde tijd dat Darwin, Galton en Cattell hun ontdekkingen deden, was Herbart ook geïnteresseerd in "de mysteries van het menselijk bewustzijn ontgrendelen" door de wetenschappelijke methode.[4] Herbart was verantwoordelijk voor het creëren van wiskundige modellen van de geest, die in de komende jaren invloedrijk waren in educatieve praktijken.
E.H. Weber bouwde voort op het werk van Herbart en probeerde het bestaan van een psychologische drempel te bewijzen, en zei dat een minimale stimulus nodig was om een sensorisch systeem te activeren. Na Weber, G.T. Fechner breidde zich uit met de kennis die hij uit Herbart en Weber heeft opgedaan, om de wet te bedenken dat de kracht van een sensatie groeit als de logaritme van de stimulusintensiteit. Een volgeling van Weber en Fechner, Wilhelm Wundt wordt gecrediteerd voor het oprichten van de wetenschap van de psychologie. Het is de invloed van Wundt die de weg heeft vrijgemaakt voor anderen om psychologisch testen te ontwikkelen.[4]
20ste eeuw
In 1936, de psychometriciaan L. L. Thurstone, oprichter en eerste president van de Psychometric Society, ontwikkelde en paste een theoretische benadering van meten aangeduid als de wet van vergelijkend oordeel, een benadering die nauwe verbindingen heeft met de psychofysische theorie van Ernst Heinrich Weber en Gustav Fechner. Bovendien hebben Spearman en Thurstone beide belangrijke bijdragen geleverd aan de theorie en toepassing van factoren analyse, een statistische methode ontwikkeld en uitgebreid gebruikt in psychometrie.[5] Eind jaren 1950, Leopold Szondi maakte een historische en epistemologische beoordeling van de impact van statistisch denken op de psychologie in de vorige decennia: "In de afgelopen decennia is het specifiek psychologische denken bijna volledig onderdrukt en verwijderd en vervangen door een statistisch denken. Precies hier zien we de kanker van testologie en testomanie van vandaag. "[6]
Meer recent is psychometrische theorie toegepast bij het meten van persoonlijkheid, houding, en overtuigingen, en academische prestatie. Deze latente constructen kunnen niet echt worden gemeten, en veel van het onderzoek en de wetenschap in deze discipline is ontwikkeld in een poging deze constructen zo dicht mogelijk bij de ware score te meten.
Cijfers die belangrijke bijdragen aan psychometrie hebben geleverd, zijn onder meer Karl Pearson, Henry F. Kaiser, Carl Brigham, L. L. Thurstone, E. L. Thorndike, Georg Rasch, Eugene Galanter, Johnson O'Connor, Frederic M. Lord, Ledyard R Tucker, Louis Guttman, en Jane Loevvinger.
Definitie van meting in de sociale wetenschappen
De definitie van meting in de sociale wetenschappen heeft een lange geschiedenis. Een huidige wijdverbreide definitie, voorgesteld door Stanley Smith Stevens, is dat meting "de toewijzing van cijfers aan objecten of gebeurtenissen volgens een regel" is. Deze definitie werd geïntroduceerd in een 1946 Wetenschap Artikel waarin Stevens vier voorstelde niveaus van meet.[7] Hoewel algemeen aangenomen, verschilt deze definitie in belangrijke opzichten van de meer klassieke definitie van meting die in de fysieke wetenschappen wordt aangenomen, namelijk dat wetenschappelijke meting "de schatting of ontdekking van de verhouding van een omvang van een kwantitatief kenmerk aan een eenheid van hetzelfde kenmerk inhoudt, "(p. 358)[8]
De definitie van meting van Stevens werd inderdaad naar voren gebracht als reactie op het Britse Comité van Ferguson, wiens voorzitter, A. Ferguson, een natuurkundige was. De commissie werd in 1932 benoemd door de British Association voor de bevordering van de wetenschap om de mogelijkheid te onderzoeken om sensorische gebeurtenissen kwantitatief te schatten. Hoewel de voorzitter en andere leden natuurkundigen waren, omvatte de commissie ook verschillende psychologen. Het rapport van de commissie benadrukte het belang van de definitie van meting. Hoewel het antwoord van Stevens was om een nieuwe definitie voor te stellen, die een aanzienlijke invloed in het veld heeft gehad, was dit geenszins de enige reactie op het rapport. Een ander, met name anders, reactie was om de klassieke definitie te accepteren, zoals weerspiegeld in de volgende verklaring:
- Meting in psychologie en natuurkunde is in geen enkel opzicht anders. Natuurkundigen kunnen meten wanneer ze de bewerkingen kunnen vinden waarmee ze aan de nodige criteria kunnen voldoen; Psychologen moeten hetzelfde doen. Ze hoeven zich geen zorgen te maken over de mysterieuze verschillen tussen de betekenis van meting in de twee wetenschappen (Reese, 1943, p. 49).[9]
Deze uiteenlopende reacties worden weerspiegeld in alternatieve benaderingen van metingen. Bijvoorbeeld methoden gebaseerd op covariantiematrices worden meestal gebruikt op het uitgangspunt dat cijfers, zoals ruwe scores die zijn afgeleid van beoordelingen, metingen zijn. Dergelijke benaderingen brengen impliciet in op Stevens 'definitie van meting, die alleen dat getallen vereist toegewezen volgens een regel. De belangrijkste onderzoekstaak wordt dus in het algemeen beschouwd als de ontdekking van associaties tussen scores en van factoren die worden gesteld om dergelijke associaties ten grondslag te liggen.[10]
Aan de andere kant, wanneer meetmodellen zoals de Rasch -model worden gebruikt, nummers worden niet toegewezen op basis van een regel. In plaats daarvan worden, in overeenstemming met de bovenstaande verklaring van Reese, specifieke criteria voor metingen vermeld en het doel is om procedures of bewerkingen te construeren die gegevens bieden die voldoen aan de relevante criteria. Metingen worden geschat op basis van de modellen en tests worden uitgevoerd om na te gaan of aan de relevante criteria is voldaan.
Instrumenten en procedures
De eerste psychometrische instrumenten zijn ontworpen om te meten intelligentie-.[11] Een vroege benadering van het meten van intelligentie was de test die in Frankrijk werd ontwikkeld door Alfred Binet en Theodore Simon. Die test stond bekend als het test binet-simon .De Franse test werd aangepast voor gebruik in de VS door Lewis Terman van Stanford University, en de naam van de Stanford-Binet IQ-test.
Een andere belangrijke focus in psychometrie is op Persoonlijkheidstesten. Er zijn een aantal theoretische benaderingen geweest om persoonlijkheid te conceptualiseren en te meten, hoewel er geen algemeen overeengekomen theorie is. Enkele van de beter bekende instrumenten omvatten de Minnesota Multiphasic Personality Inventory, de Vijf-factor model (of "Big 5") en tools zoals Persoonlijkheid en voorkeursinventaris en de Myers - Briggs Type indicator. Attitudes zijn ook uitgebreid bestudeerd met behulp van psychometrische benaderingen. Een alternatieve methode omvat de toepassing van ontplooiende meetmodellen, waarbij de meest algemene het hyperbolische cosinusmodel is (Andrich & Luo, 1993).[12]
Theoretische benaderingen
Psychometricians hebben een aantal verschillende meettheorieën ontwikkeld. Waaronder klassieke testtheorie (CTT) en Itemresponstheorie (IRT).[13][14] Een benadering die wiskundig lijkt op IRT, maar ook behoorlijk onderscheidend, in termen van zijn oorsprong en kenmerken, wordt vertegenwoordigd door de Rasch -model voor meting. De ontwikkeling van het Rasch -model, en de bredere klasse van modellen waartoe het behoort, werd expliciet gebaseerd op vereisten van meet in de fysieke wetenschappen.[15]
Psychometricians hebben ook methoden ontwikkeld om te werken met grote matrices van correlaties en covarianties. Technieken in deze algemene traditie zijn onder meer: factoren analyse,[16] Een methode om de onderliggende dimensies van gegevens te bepalen. Een van de belangrijkste uitdagingen waarmee gebruikers van factoranalyse worden geconfronteerd, is een gebrek aan consensus over geschikte procedures voor Het aantal latente factoren bepalen.[17] Een gebruikelijke procedure is om te stoppen met factureren wanneer eigenwaarden Druppel onder een omdat de originele bol krimpt. Het ontbreken van de snijpunten betreft ook andere multivariate methoden.
Multidimensionale schaling[18] is een methode voor het vinden van een eenvoudige weergave voor gegevens met een groot aantal latente afmetingen. Clusteranalyse is een benadering om objecten te vinden die op elkaar lijken. Factoranalyse, multidimensionale schaling en clusteranalyse zijn allemaal multivariate beschrijvende methoden die worden gebruikt om grote hoeveelheden gegevens eenvoudiger structuren te destilleren.
Recenter, Structurele vergelijkingsmodellering[19] en padanalyse vertegenwoordigen meer geavanceerde benaderingen om met grote te werken covariantiematrices. Met deze methoden kunnen statistisch geavanceerde modellen worden aangepast aan gegevens en getest om te bepalen of ze voldoende aanvallen zijn. Omdat psychometrisch onderzoek op een gedetailleerd niveau betrekking heeft op de omvang en aard van multidimensionaliteit in elk van de interessante items, een relatief nieuwe procedure die bekend staat als bi-factor analyse[20][21][22] kan nuttig zijn. Bi-factoranalyse kan "de systematische variantie van een item in termen van twee bronnen, een algemene factor en één bron van extra systematische variantie" ontbinden. "[23]
Belangrijkste concepten
Belangrijkste concepten in de klassieke testtheorie zijn betrouwbaarheid en Geldigheid. Een betrouwbare maatregel is er een die een constructie meet consequent in de tijd, individuen en situaties. Een geldige maatregel is er een die meet wat het bedoeld is om te meten. Betrouwbaarheid is noodzakelijk, maar niet voldoende, voor geldigheid.
Zowel betrouwbaarheid als geldigheid kunnen statistisch worden beoordeeld. Consistentie over herhaalde metingen van dezelfde test kunnen worden beoordeeld met de Pearson -correlatiecoëfficiënt en wordt vaak genoemd Test-hertest betrouwbaarheid.[24] Evenzo kan de equivalentie van verschillende versies van dezelfde maat worden geïndexeerd door een Pearson correlatie, en wordt gebeld gelijkwaardige vormen betrouwbaarheid of een vergelijkbare term.[24]
Interne consistentie, die de homogeniteit van een enkel testformulier aanpakt, kan worden beoordeeld door de prestaties te correleren op twee helften van een test, die wordt genoemd split-half betrouwbaarheid; de waarde hiervan Pearson product-moment correlatiecoëfficiënt voor twee halve tests wordt aangepast met de Spearman -Brown Prediction Formula Om overeen te komen met de correlatie tussen twee volledige tests.[24] Misschien is de meest gebruikte betrouwbaarheidsindex Cronbach's α, wat gelijk is aan de gemeen van alle mogelijke split-helft coëfficiënten. Andere benaderingen zijn de Intra-klasse correlatie, wat de variantieverhouding is van metingen van een bepaald doelwit tot de variantie van alle doelen.
Er zijn een aantal verschillende vormen van geldigheid. Criteriumgerelateerde validiteit verwijst naar de mate waarin een test of schaal een monster van gedrag voorspelt, d.w.z. het criterium, dat "extern is voor het meetinstrument zelf".[25] Dat externe monster van gedrag kan veel dingen zijn, waaronder een andere test; College Grade Point gemiddeld zoals wanneer de middelbare school zat wordt gebruikt om de prestaties op de universiteit te voorspellen; en zelfs gedrag dat in het verleden plaatsvond, bijvoorbeeld wanneer een test van huidige psychologische symptomen wordt gebruikt om het optreden van slachtofferschap in het verleden te voorspellen (die postdiction nauwkeurig zou vertegenwoordigen). Wanneer de criteriummaatregel tegelijkertijd wordt verzameld als de maatregel die wordt gevalideerd, is het doel om vast te stellen concurrente validiteit; Wanneer het criterium later wordt verzameld, is het doel om vast te stellen voorspellende geldigheid. Een maat heeft construeer geldigheid Als het gerelateerd is aan maatregelen van andere constructen zoals vereist door theorie. Inhoudsvaliditeit is een demonstratie dat de items van een test voldoende taak zijn om het gemeten domein te bedekken. In een voorbeeld van een personeelsselectie is testinhoud gebaseerd op een gedefinieerde verklaring of een reeks uitspraken van kennis, vaardigheid, vaardigheden of andere kenmerken verkregen van een functieanalyse.
Itemresponstheorie modelleert de relatie tussen latente eigenschappen en reacties op testitems. Onder andere voordelen biedt IRT een basis voor het verkrijgen van een schatting van de locatie van een test-taker op een gegeven latente eigenschap, evenals de standaard meetfout van die locatie. De kennis van een universiteitsstudent over de geschiedenis kan bijvoorbeeld worden afgeleid uit zijn of haar score op een universitaire test en vervolgens betrouwbaar worden vergeleken met de kennis van een middelbare scholier die is afgeleid van een minder moeilijke test. Scores afgeleid door de klassieke testtheorie hebben dit kenmerk niet, en de beoordeling van het werkelijke vermogen (in plaats van vermogen ten opzichte van andere testpersonen) moeten worden beoordeeld door scores te vergelijken met die van een "normgroep" die willekeurig uit de populatie is geselecteerd. In feite zijn alle maatregelen afgeleid van de klassieke testtheorie afhankelijk van het geteste monster, terwijl in principe die afgeleid van itemresponstheorie dat niet zijn.
Kwaliteitsnormen
De overwegingen van Geldigheid en betrouwbaarheid meestal worden gezien als essentiële elementen voor het bepalen van de kwaliteit van elke test. Professionele en beoefenaarsverenigingen hebben deze zorgen echter vaak in bredere contexten geplaatst bij het ontwikkelen normen en algehele oordelen over de kwaliteit van elke test als geheel binnen een bepaalde context. Een overweging van bezorgdheid in veel toegepaste onderzoeksinstellingen is of de statistiek van een bepaalde psychologische inventaris al dan niet zinvol of willekeurig is.[26]
Testnormen
In 2014 publiceerden de American Educational Research Association (AERA), American Psychological Association (APA) en National Council on Measurement in Education (NCME) een herziening van de Normen voor educatieve en psychologische tests,[27] die normen beschrijft voor testontwikkeling, evaluatie en gebruik. De Normen Dekken essentiële onderwerpen bij het testen, waaronder validiteit, betrouwbaarheid/meetfouten en billijkheid bij het testen. Het boek stelt ook normen vast met betrekking tot testen -bewerkingen, waaronder testontwerp en -ontwikkeling, scores, schalen, normen, scorekoppeling, snijscores, testbeheer, scoren, rapportage, score interpretatie, testdocumentatie en rechten en verantwoordelijkheden van testpersonen en testgebruikers . eindelijk, de Normen Onderwerpen met betrekking tot testtoepassingen, inclusief Psychologische tests en beoordeling, Werkplektesten en referentie, educatieve testen en beoordelingen testen in programma evaluatie en openbaar beleid.
Evaluatiestandaarden
Op het gebied van evaluatie, en vooral educatieve evaluatie, de Joint Committee on Standards for Educational Evaluation[28] heeft drie sets normen gepubliceerd voor evaluaties. De personeelsevaluatienormen[29] werd gepubliceerd in 1988, De programma -evaluatiestandaarden (2e editie)[30] werd gepubliceerd in 1994, en De standaarden van de evaluatie van de student[31] werd gepubliceerd in 2003.
Elke publicatie presenteert en gaat uit voor een aantal normen voor gebruik in verschillende educatieve instellingen. De normen bieden richtlijnen voor het ontwerpen, implementeren, beoordelen en verbeteren van de geïdentificeerde vorm van evaluatie.[32] Elk van de normen is in een van de vier fundamentele categorieën geplaatst om educatieve evaluaties te bevorderen die goed, nuttig, haalbaar en nauwkeurig zijn. In deze sets van normen vallen de geldigheid en betrouwbaarheidsoverwegingen onder het nauwkeurigheidsonderwerp. De normen voor studentennauwkeurigheid helpen bijvoorbeeld ervoor te zorgen dat de evaluaties van studenten goede, nauwkeurige en geloofwaardige informatie zullen bieden over het leren en prestaties van studenten.
Controverse en kritiek
Omdat psychometrie is gebaseerd latente psychologische processen gemeten door correlaties, er is controverse geweest over enkele psychometrische maatregelen.[33][pagina nodig] Critici, waaronder beoefenaars in de Fysieke wetenschappen, hebben betoogd dat een dergelijke definitie en kwantificering moeilijk is en dat dergelijke metingen vaak worden misbruikt door leken, zoals bij persoonlijkheidstests die worden gebruikt bij de werkgelegenheidsprocedures. De normen voor educatieve en psychologische meting geven de volgende verklaring over Test geldigheid: "Geldigheid verwijst naar de mate waarin bewijsmateriaal en theorie de interpretaties van testscores ondersteunen die met voorgesteld gebruik van tests met zich meebrengen".[34] Simpel gezegd, een test is niet geldig tenzij deze wordt gebruikt en geïnterpreteerd op de manier waarop het is bedoeld.[35]
Twee soorten tools die worden gebruikt om te meten karakter eigenschappen zijn objectieve tests en projectieve maatregelen. Voorbeelden van dergelijke tests zijn de: Big Five Inventory (Bfi), Minnesota Multiphasic Personality Inventory (MMPI-2), Rorschach Inkblot -test, Neurotic Personality Questionnaire Kon-2006,[36] of Eysenck's Persoonlijkheidsvragenlijst (EPQ-R). Sommige van deze tests zijn nuttig omdat ze voldoende hebben betrouwbaarheid en Geldigheid, Twee factoren die tests consistente en nauwkeurige reflecties van het onderliggende construct maken. De Myers - Briggs Type Indicator (MBTI) heeft echter een twijfelachtige geldigheid en is het onderwerp van veel kritiek geweest. Psychometrische specialist Robert Hogan Schreef over de maatregel: "De meeste persoonlijkheidspsychologen beschouwen de MBTI als weinig meer dan een uitgebreid Chinees fortuinkoekje."[37]
Lee Cronbach opgemerkt in Amerikaanse psycholoog (1957) dat, "correlationele psychologie, hoewel volledig zo oud als experimenten, langzamer was om te rijpen. Het kwalificeert echter ook als een discipline, omdat het een onderscheidend type vraag stelt en technische methoden heeft om te onderzoeken of de vraag correct is geweest Zet en de gegevens correct geïnterpreteerd. " Hij zou verder gaan met zeggen: "De correlatiemethode van zijn kant kan bestuderen wat de mens niet heeft geleerd om te beheersen of nooit kan hopen te beheersen ... een echte federatie van de disciplines is vereist. Onafhankelijk gehouden, ze kunnen alleen geven Verkeerde antwoorden of helemaal geen antwoorden met betrekking tot bepaalde belangrijke problemen. "[38]
Niet-mens: dieren en machines
Psychometrische adressen menselijk Vaardigheden, attitudes, eigenschappen en educatieve evolutie. Met name de studie van gedrag, mentale processen en vaardigheden van niet-mens dieren wordt meestal aangepakt door Vergelijkende psychologieof met een continuüm tussen niet-menselijke dieren en de rest van dieren door evolutionaire psychologie. Desalniettemin zijn er enkele pleitbezorgers voor een meer geleidelijke overgang tussen de benadering die voor mensen is gevolgd en de benadering voor (niet-menselijke) dieren.[39][40][41][42]
De evaluatie van vaardigheden, eigenschappen en leerevolutie van machines heeft meestal geen verband gehouden met het geval van mensen en niet-menselijke dieren, met specifieke benaderingen op het gebied van kunstmatige intelligentie. Een meer geïntegreerde aanpak, onder de naam van universele psychometrie, is ook voorgesteld.[43]
Zie ook
- Cattell - Horn - Carroll -theorie
- Klassieke testtheorie
- Computational psychometrie
- Conceptinventaris
- Cronbach's Alpha
- Datamining
- Educatieve beoordeling
- Psychologie
- Factoren analyse
- Itemresponstheorie
- Lijst met psychometrische software
- Lijst met scholen voor psychometrie
- Operationalisatie
- Kwantitatieve psychologie
- Psychometrische samenleving
- Rasch -model
- Schaal (sociale wetenschappen)
- Decaan
- Schoolpsychologie
- Gestandaardiseerde test
Referenties
- ^ "Glossary1". 22 juli 2017. Gearchiveerd van het origineel op 2017-07-22. Opgehaald 28 juni 2022.
- ^ a b Tabachnick, B.G.; Fidell, L.S. (2001). Multivariate analyse gebruiken. Boston: Allyn en Bacon. ISBN 978-0-321-05677-1.[pagina nodig]
- ^ Kaplan, R.M., & Saccuzzo, D.P. (2010). Psychologische testen: principes, toepassingen en problemen. (8e ed.). Belmont, CA: Wadsworth, Cengage Learning.
- ^ a b c Kaplan, R.M., & Saccuzzo, D.P. (2010). Psychologische tests: principes, toepassingen en problemen (8e ed.). Belmont, CA: Wadsworth, Cengage Learning.
- ^ Nunnally, J., & Berstein, I. H. (1994). Psychometrische theorie (3e ed.). New York: McGraw-Hill.
- ^ Leopold Szondi (1960) Das Zweite Buch: Lehrbuch der Experimentellen Triebdiagnostik. Huber, Bern und Stuttgart, 2e editie. Ch.27, van de Spaanse vertaling, b) ii Las Condiciones Estadisticas, p.396. Citaat:
El Pensamiento Psicologico Especifico, En Las Ultima Decadas, Fue Suprimido y Eliminado Casi Totalmente, Siendo Sustituido Por Un Pensamiento Estadistico. Precisamente aqui vemos el cáncer de la Testología y Testomania de Hoy.
- ^ Stevens, S. S. (7 juni 1946). "Over de theorie van schalen van meet". Wetenschap. 103 (2684): 677–680. Bibcode:1946sci ... 103..677S. doen:10.1126/science.103.2684.677. Pmid 17750512. S2CID 4667599.
- ^ Michell, Joel (augustus 1997). "Kwantitatieve wetenschap en de definitie van meting in de psychologie". British Journal of Psychology. 88 (3): 355–383. doen:10.1111/j.2044-8295.1997.tb02641.x.
- ^ Reese, T.W. (1943). De toepassing van de theorie van fysieke meting op de meting van psychologische grootten, met drie experimentele voorbeelden. Psychologische monografieën, 55, 1–89. doen:10.1037/h0061367
- ^ "Psychometrie". AssessmentPsychology.com. Opgehaald 28 juni 2022.
- ^ Stern, Theodore A.; Fava, Maurizio; Wilens, Timothy E.; Rosenbaum, Jerrold F. (2016). Massachusetts General Hospital Comprehensive Clinical Psychiatry (Tweede ed.). Londen. p. 73. ISBN 978-0323295079. Opgehaald 31 oktober 2021.
- ^ Andrich, D. & Luo, G. (1993). Een hyperbolisch cosinus latent eigenschapsmodel voor ontvouwen dichotoom reacties met één stimulus. Toegepaste psychologische meting, 17, 253–276.
- ^ Embetson, S.E., & Reise, S.P. (2000). Itemresponstheorie voor psychologen. Mahwah, NJ: Erlbaum.
- ^ Hambleton, R.K., & Swaminathan, H. (1985). Itemresponstheorie: principes en toepassingen. Boston: Kluwer-Nijhoff.
- ^ Rasch, G. (1960/1980). Probabilistische modellen voor sommige intelligentie- en prestatietests. Kopenhagen, Deense Instituut voor educatief onderzoek, uitgebreide editie (1980) met voorwoord en nawoord door B.D. Wright. Chicago: The University of Chicago Press.
- ^ Thompson, B.R. (2004). Verkennende en bevestigende factoranalyse: concepten en toepassingen begrijpen. American Psychological Association.
- ^ Zwick, William R.; Velicer, Wayne F. (1986). "Vergelijking van vijf regels voor het bepalen van het aantal te behouden componenten". Psychologisch bulletin. 99 (3): 432–442. doen:10.1037/0033-2909.99.3.432.
- ^ Davison, M.L. (1992). Multidimensionale schaalverdeling. Krieger.
- ^ Kaplan, D. (2008). Structurele vergelijkingsmodellering: stichtingen en extensies, 2e ed. Verstandig.
- ^ Demars, C. E. (2013). Een tutorial over het interpreteren van bi-factor modellencores.International Journal of Testing, 13, 354–378. http://dx.doi.org/10 .1080/15305058.2013.799067
- ^ Reise, S. P. (2012). De herontdekking van bi-factor modellering. Multivariate gedragsonderzoek, 47, 667–696. http://dx.doi.org/10.1080/00273171.2012.715555
- ^ Rodriguez, A., Reise, S. P., & Haviland, M. G. (2016). Bifactor -modellen evalueren: statistische indices berekenen en interpreteren. Psychologische methoden, 21, 137–150. http://dx.doi.org/10.1037/met0000045
- ^ Schonfeld, I.S., Verkuilen, J. & Bianchi, R. (2019). Een verkennende structurele vergelijking modellering bi-factor analytische benadering om te ontdekken wat burn-out, depressie en angstschalen meten. Psychologische beoordeling, 31, 1073-1079. http://dx.doi.org/10.1037/pas0000721 p. 1075
- ^ a b c "Home - Educatief onderzoek Basics door Del Siegle". www.gifted.uconn.edu. 17 februari 2015.
- ^ Nunnally, J.C. (1978). Psychometrische theorie (2e ed.). New York: McGraw-Hill.
- ^ Blanton, H., & Jaccard, J. (2006). Willekeurige statistieken in de psychologie. Gearchiveerd 2006-05-10 op de Wayback -machine Amerikaanse psycholoog, 61(1), 27–41.
- ^ "De normen voor educatieve en psychologische testen". apa.org.
- ^ "Gezamenlijk comité voor normen voor educatieve evaluatie". Gearchiveerd van het origineel Op 15 oktober 2009. Opgehaald 28 juni 2022.
- ^ Gezamenlijk commissie voor normen voor educatieve evaluatie. (1988). De normen voor personeelsevaluatie: het beoordelen van systemen voor het evalueren van opvoeders. Gearchiveerd 2005-12-12 op de Wayback -machine Newbury Park, CA: Sage Publications.
- ^ Gezamenlijk commissie voor normen voor educatieve evaluatie. (1994). De programma -evaluatiestandaarden, 2e editie. Gearchiveerd 2006-02-22 op de Wayback -machine Newbury Park, CA: Sage Publications.
- ^ Comité voor normen voor educatieve evaluatie. (2003). De normen voor de evaluatie van studenten: hoe de evaluaties van studenten te verbeteren. Gearchiveerd 2006-05-24 op de Wayback -machine Newbury Park, CA: Corwin Press.
- ^ [ E. Cabrera-Nguyen (2010). "Richtlijnen voor auteur voor het melden van schaalontwikkeling en validatieresultaten in het Journal of the Society for Social Work and Research]". Academia.edu. 1 (2): 99-103.
- ^ Tabachnick, B.G.; Fidell, L.S. (2001). Multivariate analyse gebruiken. Boston: Allyn en Bacon. ISBN 978-0-321-05677-1.
- ^ American Educational Research Association, American Psychological Association en National Council on Measurement in Education. (1999) Normen voor educatieve en psychologische tests. Washington, DC: American Educational Research Association.
- ^ Bandalos, Deborah L. (2018). Meetheorie en toepassingen voor de sociale wetenschappen. New York. p. 261. ISBN 978-1-4625-3215-5. Oclc 1015955756.
- ^ Aleksandrowicz JW, Klasa K, Sobański JA, Stolarska D (2009). "KON-2006 Neurotic Personality Questionnaire" (PDF). Archieven van psychiatrie en psychotherapie. 1: 21–22.
- ^ Hogan, Robert (2007). Persoonlijkheid en het lot van organisaties. Mahwah, NJ: Lawrence Erlbaum Associates. p. 28. ISBN 978-0-8058-4142-8. Oclc 65400436.
- ^ Cronbach, L. J. (1957). "De twee disciplines van de wetenschappelijke psychologie". Amerikaanse psycholoog. 12 (11): 671–684. doen:10.1037/h0043943 - via EBSCO.
- ^ Humphreys, L.G. (1987). "Psychometrische overwegingen bij de evaluatie van intraspeciesverschillen in intelligentie". Gedrag Brain Sci. 10 (4): 668–669. doen:10.1017/s0140525x0005514x.
- ^ Eysenck, H.J. (1987). "De verschillende betekenissen van intelligentie". Gedrag Brain Sci. 10 (4): 663. doen:10.1017/s0140525x00055060.
- ^ Locurto, C. & Scanlon, C (1987). "Individuele verschillen en ruimtelijke leerfactor in twee stammen van muizen". Gedrag Brain Sci. 112: 344–352.
- ^ King, James E & Figueredo, Aurelio Jose (1997). "Het vijf-factor model plus dominantie in chimpansee-persoonlijkheid". Journal of Research in Personality. 31 (2): 257–271. doen:10.1006/jrpe.1997.2179.
- ^ J. Hernández-Orallo; D.L. Doen we; M.V. Hernández-Lelloreda (2013). "Universele psychometrie: het meten van cognitieve vaardigheden in het machinekoninkrijk" (PDF). Cognitive Systems Research. 27: 50–74. doen:10.1016/j.cogsys.2013.06.001. HDL:10251/50244. S2CID 26440282.
Bibliografie
- Andrich, D. & Luo, G. (1993). "Een hyperbolisch cosinusmodel voor het ontvouwen van dichotome reacties met één stimulus" (PDF). Psychologische meting toegepast. 17 (3): 253–276. Citeseerx 10.1.1.1003.8107. doen:10.1177/014662169301700307. S2CID 120745971.
- Michell, J. (1999). Meting in de psychologie. Cambridge: Cambridge University Press. doen:10.1017/CBO9780511490040
- Rasch, G. (1960/1980). Probabilistische modellen voor sommige intelligentie- en prestatietests. Kopenhagen, Deense Instituut voor educatief onderzoek), Expanded Edition (1980) met voorwoord en nawoord door B.D. Wright. Chicago: The University of Chicago Press.
- Reese, T.W. (1943). De toepassing van de theorie van fysieke meting op de meting van psychologische grootten, met drie experimentele voorbeelden. Psychologische monografieën, 55, 1–89. doen:10.1037/h0061367
- Stevens, S. S. (1946). "Over de theorie van schalen van meet". Wetenschap. 103 (2684): 677–80. Bibcode:1946sci ... 103..677S. doen:10.1126/science.103.2684.677. Pmid 17750512.
- Thurstone, L.L. (1927). "Een wet van vergelijkend oordeel". Psychologische beoordeling. 34 (4): 278–286. doen:10.1037/h0070288.
- Thurstone, L.L. (1929). De meting van psychologische waarde. In T.V. Smith en W.K. Wright (eds.), Essays in Philosophy door Seventeen Doctors of Philosophy of the University of Chicago. Chicago: Open Court.
- Thurstone, L.L. (1959). Het meten van waarden. Chicago: The University of Chicago Press.
- S.F. Blinkhorn (1997). "Past Imperfect, Future Conditional: Fifty Years of Test Theory". British Journal of Mathematical and Statistical Psychology. 50 (2): 175–185. doen:10.1111/j.2044-8317.1997.tb01139.x.
- Sanford, David (18 november 2017). "Cambridge vertelde me net dat Big Data nog niet werkt". LinkedIn.
Verder lezen
- Robert F. Devellis (2016). Schaalontwikkeling: theorie en toepassingen. Wijze publicaties. ISBN 978-1-5063-4158-3.
- BorsBoom, Denny (2005). Het meten van de geest: conceptuele kwesties in de hedendaagse psychometrie. Cambridge: Cambridge University Press. ISBN 978-0-521-84463-5.
- Leslie A. Miller; Robert L. Lovler (2015). Foundations of Psychological Testing: een praktische benadering. Wijze publicaties. ISBN 978-1-4833-6927-3.
- Roderick P. McDonald (2013). Testtheorie: een uniforme behandeling. Psychology Press. ISBN 978-1-135-67530-1.
- Paul Kline (2000). Het handboek van psychologische tests. Psychology Press. ISBN 978-0-415-21158-1.
- Rush aj jr; Eerste MB; Blacker D (2008). Handboek van psychiatrische maatregelen. American Psychiatric Publishing. ISBN 978-1-58562-218-4. Oclc 85885343.
- Ann C Silverlake (2016). Testhandleidingen begrijpen: een gids en werkboek. Taylor & Francis. ISBN 978-1-351-97086-0.
- SNIGDHA RAI (2018). "Een ultieme gids voor psychometrische tests". Mercer Mettl.