Voorbeeldpunten van een Bivariate Gaussiaanse verdeling met een standaardafwijking van 3 in ruwweg de rechter richting linksonder en van 1 in de orthogonale richting. Omdat de x en y componenten co-variëren, de varianties van en Beschrijf de verdeling niet volledig. EEN Covariantiematrix is nodig; De aanwijzingen van de pijlen komen overeen met de eigenvectoren van deze covariantiematrix en hun lengtes tot de vierkante wortels van de eigenwaarden.
Intuïtief generaliseert de covariantiematrix het begrip variantie naar meerdere dimensies. Als voorbeeld kan de variatie in een verzameling willekeurige punten in tweedimensionale ruimte niet volledig worden gekenmerkt door een enkel getal, noch zouden de varianties in de en aanwijzingen bevatten alle benodigde informatie; a Matrix zou nodig zijn om de tweedimensionale variatie volledig te karakteriseren.
De covariantiematrix van een willekeurige vector wordt meestal aangeduid door of .
Gedurende dit artikel, boldfaced niet -gesubscripteerd en worden gebruikt om te verwijzen naar willekeurige vectoren, en niet -beboldfaced subscript en worden gebruikt om te verwijzen naar scalaire willekeurige variabelen.
waar de operator geeft de verwachte waarde (gemiddelde) van zijn argument aan.
Tegenstrijdige nomenclaturen en notaties
Nomenclatures verschillen. Sommige statistici, volgens de probabilist William Feller In zijn boek met twee volumes Een inleiding tot de waarschijnlijkheidstheorie en de toepassingen ervan,[2] Bel de matrix de variantie van de willekeurige vector , omdat het de natuurlijke generalisatie is naar hogere dimensies van de 1-dimensionale variantie. Anderen noemen het de covariantiematrix, omdat het de matrix van covarianties is tussen de scalaire componenten van de vector .
Beide vormen zijn vrij standaard en er is geen dubbelzinnigheid tussen hen. De matrix wordt ook vaak de variantie-covariantiematrix, omdat de diagonale termen in feite varianties zijn.
Een entiteit die nauw verwant is aan de covariantiematrix is de matrix van Pearson product-moment correlatiecoëfficiënten tussen elk van de willekeurige variabelen in de willekeurige vector , die kan worden geschreven als
waar is de matrix van de diagonale elementen van (d.w.z. een diagonale matrix van de varianties van voor ).
Elk element op de hoofddiagonaal van een correlatiematrix is de correlatie van een willekeurige variabele met zichzelf, die altijd gelijk is aan 1. elk off-diagonaal element ligt tussen −1 en +1 inclusief.
Omgekeerde van de covariantiematrix
De omgekeerde van deze matrix, , als het bestaat, is de omgekeerde covariantiematrix (of omgekeerde concentratiematrix), ook bekend als de precisiematrix (of concentratiematrix).[3]
Basiseigenschappen
Voor en , waar is een -Dimensionale willekeurige variabele, de volgende basiseigenschappen zijn van toepassing:[4]
De matrix staat bekend als de matrix van regressie coëfficiënten, terwijl in lineaire algebra is de Schur complement van in .
De matrix van regressiecoëfficiënten kan vaak worden gegeven in transponering, , geschikt voor het post-multiply van een rijvector van verklarende variabelen in plaats van een kolomvector vooraf te maken . In deze vorm komen ze overeen met de coëfficiënten die zijn verkregen door de matrix van de normale vergelijkingen van gewone kleinste vierkanten (OLS).
Gedeeltelijke covariantiematrix
Een covariantiematrix met alle niet-nul elementen vertelt ons dat alle individuele willekeurige variabelen met elkaar verbonden zijn. Dit betekent dat de variabelen niet alleen direct gecorreleerd zijn, maar ook indirect via andere variabelen worden gecorreleerd. Vaak zo'n indirecte, gebruikelijke modus Correlaties zijn triviaal en oninteressant. Ze kunnen worden onderdrukt door de gedeeltelijke covariantiematrix te berekenen, dat is het deel van de covariantiematrix dat alleen het interessante deel van de correlaties toont.
Als twee vectoren van willekeurige variabelen en zijn gecorreleerd via een andere vector , de laatste correlaties worden onderdrukt in een matrix[6]
De gedeeltelijke covariantiematrix is effectief de eenvoudige covariantiematrix alsof de oninteressante willekeurige variabelen werden constant gehouden.
Toegepast op één vector, geeft de covariantiematrix een lineaire combinatie toe c van de willekeurige variabelen X op een vector van covarianties met die variabelen: . Behandeld als een bilineaire vorm, het levert de covariantie tussen de twee lineaire combinaties op: . De variantie van een lineaire combinatie is dan , zijn covariantie met zichzelf.
Evenzo biedt de (pseudo-) omgekeerde covariantiematrix een innerlijk product , die de Mahalanobis -afstand, een maat voor het "onwaarschijnlijkheid" van c.
Welke matrices zijn covariantiematrices?
Laat uit de identiteit net boven, laat wees een reële waarde vector
die altijd niet negatief moeten zijn, omdat het de variantie van een reële gewaardeerde willekeurige variabele, dus een covariantiematrix is altijd een positief-semidefinietmatrix.
Het bovenstaande argument kan als volgt worden uitgebreid:
waar de laatste ongelijkheid voortkomt uit de observatie dat is een scalair.
Omgekeerd is elke symmetrische positieve semi-definitieve matrix een covariantiematrix. Stel dit om dit te zien is een Symmetrische positief-semidefinietmatrix. Van het eindige-dimensionale geval van de spectrale stelling, het volgt dat heeft een niet -negatieve symmetrische vierkantswortel, die kan worden aangegeven door M1/2. Laten iets zijn kolom vector gewaardeerde willekeurige variabele waarvan de covariantiematrix de identiteitsmatrix. Dan
De variantie van een complexscalair gewaardeerd Willekeurige variabele met de verwachte waarde is conventioneel gedefinieerd met behulp van Complexe vervoeging:
waarbij het complexe conjugaat van een complex getal wordt aangeduid ; De variantie van een complexe willekeurige variabele is dus een reëel getal.
Als is een kolomvector van complex gewaardeerde willekeurige variabelen, vervolgens de conjugaat transponeren wordt gevormd door beide Transponeren en conjugeren. In de volgende uitdrukking resulteert het product van een vector met zijn geconjugeerde transponering in een vierkante matrix genaamd de covariantiematrix, als verwachting:[7]: p. 293
,
De aldus verkregen matrix zal zijn Hermitiaanspositief-semidefiniet,[8] met reële getallen in de belangrijkste diagonale en complexe nummers off-diagonaal.
De diagonale elementen van de covariantiematrix zijn echt.[1]: p. 179
Pseudo-covariantiematrix
Voor complexe willekeurige vectoren, een ander soort tweede centraal moment, de pseudo-covariantiematrix (ook wel genoemd relatiematrix) wordt als volgt gedefinieerd:
In tegenstelling tot de hierboven gedefinieerde covariantiematrix, wordt Hermitiaanse transpositie vervangen door transpositie in de definitie. De diagonale elementen kunnen complex worden gewaardeerd; het is een Complexe symmetrische matrix.
Als en zijn gecentreerd Gegevensmatrices dimensie en respectievelijk, d.w.z. met n kolommen van observaties van p en q Rijen van variabelen, van waaruit de rijmiddelen zijn afgetrokken, dan, als de rijmiddelen werden geschat op basis van de gegevens, steekproefcovariantiematrices en kan worden gedefinieerd
of, als de rij -middelen a priori bekend waren,
Deze empirische steekproefcovariantiematrices zijn de meest eenvoudige en meestal gebruikte schatters voor de covariantiematrices, maar er bestaan ook andere schatters, waaronder geregulariseerde of krimpschatters, die mogelijk betere eigenschappen hebben.
Toepassingen
De covariantiematrix is een nuttig hulpmiddel in veel verschillende gebieden. Daaruit een transformatiematrix kan worden afgeleid, een Whitening -transformatie, waarmee men de gegevens volledig kan decorreleren of, vanuit een ander oogpunt, een optimale basis te vinden voor het weergeven van de gegevens op een compacte manier (zie Rayleigh quotiënt voor een formeel bewijs en aanvullende eigenschappen van covariantiematrices). Dit heet Hoofdcomponentanalyse (PCA) en de Karhunen - Loève Transform (KL-Transform).
De evolutietrategie, een bepaalde familie van gerandomiseerde zoekheuristieken, vertrouwt fundamenteel op een covariantiematrix in zijn mechanisme. De karakteristieke mutatie -operator haalt de updatestap uit een multivariate normale verdeling met behulp van een evoluerende covariantiematrix. Er is een formeel bewijs dat het evolutietrategie's covariantiematrix past zich aan het omgekeerde van de Hessiaanse matrix van het zoeklandschap, tot Een scalaire factor en kleine willekeurige schommelingen (bewezen voor een eenouderstrategie en een statisch model, naarmate de populatiegrootte toeneemt, afhankelijk van de kwadratische benadering).[9] Intuïtief wordt dit resultaat ondersteund door de reden dat de optimale covariantieverdeling mutatiestappen kan bieden waarvan de evenwichtscontouren overeenkomen met de niveausets van het landschap, en daarom maximaliseren ze het voortgangspercentage.
Covariantie mapping
In covariantie mapping de waarden van de of Matrix wordt uitgezet als een tweedimensionale kaart. Wanneer vectoren en zijn discreet Willekeurige functies, de kaart toont statistische relaties tussen verschillende regio's van de willekeurige functies. Statistisch onafhankelijke regio's van de functies verschijnen op de kaart als flatland op nulniveau, terwijl positieve of negatieve correlaties respectievelijk verschijnen als heuvels of valleien.
In de praktijk de kolomvectoren , en worden experimenteel verworven als rijen van monsters, b.v.
waar is de i-De discrete waarde in het voorbeeld j van de willekeurige functie . De verwachte waarden die nodig zijn in de covariantieformule worden geschat met behulp van de monstergemiddelde, b.v.
en de covariantiematrix wordt geschat door de Proef covariantie Matrix
waarbij de hoekbeugels het gemiddelde van de steekproef aangeven zoals voorheen behalve dat de Bessel's correctie moet worden gemaakt om te vermijden vooroordeel. Met behulp van deze schatting kan de gedeeltelijke covariantiematrix worden berekend als
waar de backslash de linker matrixdivisie Operator, die de vereiste om een matrix om te keren omzeilen en beschikbaar is in sommige rekenpakketten zoals zoals Matlab.[10]
Figuur 1: Constructie van een gedeeltelijke covariantiekaart van n2 Moleculen die Coulomb-explosie ondergaan, geïnduceerd door een vrije-elektronenlaser.[11] Panelen a en b Breng de twee termen van de covariantiematrix in kaart, die in paneel wordt weergegeven c. Paneel d kaarten gemeenschappelijke moduscorrelaties via intensiteitsschommelingen van de laser. Paneel e kent de gedeeltelijke covariantiematrix in kaart die wordt gecorrigeerd voor de intensiteitsschommelingen. Paneel f laat zien dat 10% overcorrectie de kaart verbetert en ion-ionen correlaties duidelijk zichtbaar maakt. Vanwege het momentumbehoud verschijnen deze correlaties als lijnen die ongeveer loodrecht op de autocorrelatielijn (en voor de periodieke modulaties die worden veroorzaakt door het rinkelen van de detector).
Fig. 1 illustreert hoe een gedeeltelijke covariantiekaart is geconstrueerd op een voorbeeld van een experiment dat wordt uitgevoerd op de FLASHvrije-elektronenlaser in Hamburg.[11] De willekeurige functie is de vliegtijd spectrum van ionen uit een Coulomb -explosie van stikstofmoleculen vermenigvuldigd geïoniseerd met een laserpuls. Omdat slechts enkele honderden moleculen bij elke laserpuls worden geïoniseerd, zijn de single-shot spectra zeer fluctuerend. Typisch verzamelen Dergelijke spectra, , en gemiddeld ze over produceert een soepel spectrum , die in rood wordt getoond onderaan Fig. 1. Het gemiddelde spectrum onthult verschillende stikstofionen in een vorm van pieken die worden verbreed door hun kinetische energie, maar om de correlaties tussen de ionisatiestadia te vinden en de ionenmomenta vereist het berekenen van een covariantiekaart.
In het voorbeeld van figuur 1 spectra en zijn hetzelfde, behalve dat het bereik van het tijdstip van de vlucht verschilt. Paneel a shows , paneel b shows en paneel c toont hun verschil, dat is (Let op een verandering in de kleurschaal). Helaas wordt deze kaart overweldigd door oninteressante, gemeenschappelijke moduscorrelaties veroorzaakt door laserintensiteit die fluctueert van schot naar schot. Om dergelijke correlaties de laserintensiteit te onderdrukken wordt opgenomen bij elke schot, in plaats van en wordt berekend als panelen d en e show. De onderdrukking van de niet-interesterende correlaties is echter onvolmaakt omdat er andere bronnen van gewone-modusfluctuaties zijn dan de laserintensiteit en in principe moeten al deze bronnen in vector worden gecontroleerd . Toch is het in de praktijk vaak voldoende om de gedeeltelijke covariantiecorrectie als paneel te overschrijden f Shows, waar interessante correlaties van ionenmomenta nu duidelijk zichtbaar zijn als rechte lijnen gecentreerd op ionisatiestadia van atomaire stikstof.
Tweedimensionale infraroodspectroscopie
Tweedimensionale infraroodspectroscopie gebruikt correlatie analyse om 2D -spectra van de gecondenseerde fase. Er zijn twee versies van deze analyse: synchroon en asynchroon. Wiskundig wordt de eerste uitgedrukt in termen van de steekproefcovariantiematrix en de techniek is gelijk aan covariantiemapping.[12]
^ abc Park, Kun IL (2018). Fundamentals of waarschijnlijkheid en stochastische processen met toepassingen bij communicatie. Springer. ISBN 978-3-319-68074-3.
^ Eaton, Morris L. (1983). Multivariate statistieken: een vectorruimte -aanpak. John Wiley en zonen. pp. 116–117. ISBN 0-471-02776-6.
^ abW J Krzanowski "Principles of Multivariate Analysis" (Oxford University Press, New York, 1988), hoofdstuk. 14.4; K v Mardia, J T Kent en J M Bibby "Multivariate Analysis (Academic Press, London, 1997), hoofdstuk 6.5.3; T W Anderson" Een inleiding tot multivariate statistische analyse "(Wiley, New York, 2003), 3rd ed., Chaps . 2.5.1 en 4.3.1.
^ Lapidoth, Amos (2009). Een basis in digitale communicatie. Cambridge University Press. ISBN 978-0-521-19395-5.
^ abO Kornilov, M Eckstein, M Rosenblatt, C P Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, D M P Holland, T Schlatholter, T Marchenko, S Düsterer, K Ueda, M J J Vrakking en L J Frasinski "Coulomb -explosie van diatomaire moleculen in intense XUV -velden in kaart gebracht door gedeeltelijke covariantie" J. Phys. B: At. Mol. Opt. Phys.46 164028 (2013), vrije toegang
^Ik noda "Gegeneraliseerde tweedimensionale correlatiemethode van toepassing op infrarood, Raman en andere soorten spectroscopie" Appl. Spectrosc.47 1329–36 (1993)