L1-norm principal component analysis

L1-Norm Principal Component Analysis (L1-PCA) is een algemene methode voor multivariate gegevensanalyse.[1] L1-PCA heeft vaak de voorkeur boven standaard L2-norm Hoofdcomponentanalyse (PCA) Wanneer de geanalyseerde gegevens kunnen bevatten uitbijters (Defecte waarden of corrupties).[2][3][4]
Zowel L1-PCA als standaard PCA zoeken een verzameling van orthogonaal aanwijzingen (hoofdcomponenten) die een definiëren subruimte waarbij gegevensrepresentatie wordt gemaximaliseerd volgens het geselecteerde criterium.[5][6][7] Standaard PCA kwantificeert gegevensrepresentatie als geaggregeerd van de L2-norm van het gegevenspunt projecties in de subruimte, of gelijkwaardig het aggregaat Euclidische afstand van de originele punten van hun subruimte-geprojecteerde representaties.L1-PCA gebruikt in plaats daarvan het aggregaat van de L1-Norm van de datapuntprojecties in de subruimte.[8] In PCA en L1-PCA is het aantal hoofdcomponenten (pc's) lager dan het rang van de geanalyseerde matrix, die samenvalt met de dimensionaliteit van de ruimte die wordt gedefinieerd door de oorspronkelijke gegevenspunten.Daarom worden PCA of L1-PCA vaak gebruikt voor dimensionaliteitsvermindering voor het doel van gegevens denoising of compressie.Een van de voordelen van standaard PCA die hebben bijgedragen aan de hoge populariteit zijn goedkoop computationele implementatie door middel van singuliere waarden ontbinding (SVD)[9] en statistische optimaliteit wanneer de gegevensset wordt gegenereerd door een waar multivariate normaal databron.
In moderne big data -sets omvatten gegevens echter vaak beschadigde, defecte punten, meestal aangeduid als uitbijters.[10] Het is bekend dat standaard PCA gevoelig is voor uitbijters, zelfs wanneer ze als een kleine fractie van de verwerkte gegevens verschijnen.[11] De reden is dat de L2-Norm-formulering van L2-PCA kwadratische nadruk legt op de omvang van elke coördinaat van elk gegevenspunt, uiteindelijk overdreven perifere punten, zoals uitbijters.Aan de andere kant legt L1-PCA na een L1-Norm-formulering lineaire nadruk op de coördinaten van elk gegevenspunt, waardoor uitbijters effectief worden beperken.[12]
Formulering
Overweeg een Matrix bestaande uit -Dimensionale gegevenspunten.Definiëren . Voor gehele getal zoals dat , L1-PCA is geformuleerd als:[1]
-
(1)
Voor , (1) vereenvoudigt het vinden van de L1-Norm Principal Component (L1-PC) van door
-
(2)
In (1)-(2), L1-norm Retourneert de som van de absolute vermeldingen van zijn argument en L2-norm Retourneert de som van de vierkante inzendingen van zijn argument.Als men vervangt in (2) Door de Frobenius/L2-norm , dan wordt het probleem standaard PCA en wordt het opgelost door de matrix dat bevat de dominante enkelvoudige vectoren van (d.w.z. de enkelvoudige vectoren die overeenkomen met de hoogst enkelvoudige waarden).
De maximalisatiestatistiek in (2) kan worden uitgebreid als
-
(3)
Oplossing
Voor elke matrix met , definiëren als de dichtstbijzijnde (in de L2-Norm Sense) matrix tot dat heeft orthonormale kolommen.Dat wil zeggen, definiëren
-
(4)
Procrustes Stelling[13][14] stelt dat als heeft SVD , dan.
Markopoulos, Karystinos en Pados[1] toonde dat, als is de exacte oplossing voor het probleem van de binaire nucleaire-norm maximalisatie (BNM)
-
(5)
dan
-
(6)
is de exacte oplossing voor L1-PCA in (2). De nucleaire norm in (2) Retourneert de sommatie van de enkelvoudige waarden van zijn matrixargument en kan worden berekend door middel van standaard SVD.Bovendien is het van mening dat, gezien de oplossing voor L1-PCA, , de oplossing voor BNM kan worden verkregen als
-
(7)
waar Retourneert de -Sign matrix van zijn matrixargument (zonder verlies van algemeenheid, kunnen we overwegen ).Bovendien volgt daaruit .Bnm in (5) is een combinatorisch Probleem over antipodale binaire variabelen.Daarom kan de exacte oplossing worden gevonden door een uitputtende evaluatie van iedereen elementen van zijn haalbaarheidsset, met asymptotische kosten .Daarom kan L1-PCA ook worden opgelost, via BNM, met kosten (Exponentieel in het product van het aantal gegevenspunten met het aantal gezochte componenten).Het blijkt dat L1-PCA optimaal (exact) kan worden opgelost met polynoomcomplexiteit in voor vaste gegevensdimensie , .[1]
Voor het speciale geval van (enkele L1-PC van ), BNM neemt de vorm van binaire quadratische maximalisatie (BQM) aan
-
(8)
De overgang van (5) tot (8) voor geldt waar, omdat de unieke enkelvoudige waarde van is gelijk aan , voor iedere . Dan, als is de oplossing voor BQM in (7), het houdt van dat
-
(9)
is de exacte l1-pc van , zoals gedefinieerd in (1).Bovendien is het van mening dat en .
Algoritmen
Exacte oplossing van exponentiële complexiteit
Zoals hierboven getoond, kan de exacte oplossing voor L1-PCA worden verkregen door het volgende tweestapsproces:
1. Los het probleem op in (5) verkrijgen .2. Pas SVD aan op verkrijgen .
Bnm in (5) kan worden opgelost door uitputtende zoektocht over het domein van met kosten .
Exacte oplossing van polynoomcomplexiteit
Ook kan L1-PCA optimaal worden opgelost met kosten , wanneer is constant ten opzichte van (altijd waar voor eindige gegevensdimensie ).[1][15]
Geschatte efficiënte oplossers
In 2008, Kwak[12] stelde een iteratief algoritme voor voor de geschatte oplossing van L1-PCA voor .Deze iteratieve methode werd later gegeneraliseerd componenten.[16] Een andere geschatte efficiënte oplosser werd voorgesteld door McCoy en Tropp[17] door middel van semi-definitieve programmering (SDP).Onlangs, L1-PCA (en BNM in (5)) werden efficiënt opgelost door middel van bit-flipping iteraties (L1-BF-algoritme).[8][18]
L1-BF-algoritme
1 functie L1bf (, ): 2 Initialiseren en 3 Set en 4 tot beëindiging (of iteraties) 5 , 6 voor 7 , 8 // flip bit 9 // berekend door SVD of sneller (zie[8]) 10 IF 11 , 12 13 einde 14 als // Er is geen bit omgedraaid 15 IF 16 Beëindiging 17 anders 18
De rekenkosten van L1-BF zijn .[8]
Complexe gegevens
L1-PCA is ook gegeneraliseerd om te verwerken complex gegevens.Voor complexe L1-PCA werden in 2018 twee efficiënte algoritmen voorgesteld.[19]
Tensor -gegevens
L1-PCA is ook uitgebreid voor de analyse van tensor Gegevens, in de vorm van L1-Tucker, de L1-Norm robuust analoog aan standaard Tucker -ontleding.[20] Twee algoritmen voor de oplossing van L1-Tucker zijn L1-HOSVD en L1-HOOI.[20][21][22]
Code
Matlab Code voor L1-PCA is beschikbaar bij MathWorks[23] en andere repositories.[18]
Referenties
- ^ a b c d e Markopoulos, Panos P.;Karystinos, George N.;Pados, Dimitris A. (oktober 2014)."Optimale algoritmen voor L1-SubSpace-signaalverwerking". IEEE -transacties op signaalverwerking. 62 (19): 5046–5058. arxiv:1405.6785. Bibcode:2014itsp ... 62.5046m. doen:10.1109/TSP.2014.2338077. S2CID 1494171.
- ^ Barrodale, I. (1968)."L1 -benadering en de analyse van gegevens". Toegepaste statistieken. 17 (1): 51–57. doen:10.2307/2985267. Jstor 2985267.
- ^ Barnett, Vic;Lewis, Toby (1994). Uitbijters in statistische gegevens (3. Ed.).Chichester [U.A.]: Wiley. ISBN 978-0471930945.
- ^ Kanade, T.; KE, Qifa (juni 2005). Robuuste L1 -normfactorisatie in aanwezigheid van uitbijters en ontbrekende gegevens door alternatieve convexe programmering. 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05). Vol. 1. IEEE. p. 739. Citeseerx 10.1.1.63.4605. doen:10.1109/cvpr.2005.309. ISBN 978-0-7695-2372-9. S2CID 17144854.
- ^ Jolliffe, I.T.(2004). Hoofdcomponentanalyse (2e ed.). New York: Springer. ISBN 978-0387954424.
- ^ Bishop, Christopher M. (2007). Patroonherkenning en machine learning (Corr. Printing. Ed.).New York: Springer. ISBN 978-0-387-31073-2.
- ^ Pearson, Karl (8 juni 2010). "Op lijnen en vliegtuigen van dichtstbijzijnde passen bij systemen van punten in de ruimte". The London, Edinburgh en Dublin Philosophical Magazine and Journal of Science. 2 (11): 559–572. doen:10.1080/14786440109462720.
- ^ a b c d Markopoulos, Panos P.;Kundu, Sandipan;Chamadia, Shubham;Pados, Dimitris A. (15 augustus 2017)."Efficiënte L1-Norm Principal-componentanalyse via bit flipping". IEEE -transacties op signaalverwerking. 65 (16): 4252–4264. arxiv:1610.01959. Bibcode:2017itsp ... 65.4252m. doen:10.1109/TSP.2017.2708023. S2CID 7931130.
- ^ Golub, Gene H. (april 1973)."Sommige gemodificeerde matrix -eigenwaardeproblemen". Siam Review. 15 (2): 318–334. Citeseerx 10.1.1.454.9868. doen:10.1137/1015032.
- ^ Barnett, Vic;Lewis, Toby (1994). Uitbijters in statistische gegevens (3. Ed.).Chichester [U.A.]: Wiley. ISBN 978-0471930945.
- ^ Candès, Emmanuel J.;Li, Xiaodong;Mag ik;Wright, John (1 mei 2011)."Robuuste principale componentanalyse?". Journal of the ACM. 58 (3): 1–37. arxiv:0912.3599. doen:10.1145/1970392.1970395. S2CID 7128002.
- ^ a b Kwak, N. (september 2008)."Principale componentanalyse op basis van L1-Norm-maximalisatie". IEEE -transacties op patroonanalyse en machine -intelligentie. 30 (9): 1672–1680. Citeseerx 10.1.1.333.1176. doen:10.1109/tpami.2008.114. Pmid 18617723. S2CID 11882870.
- ^ Eldén, Lars;Park, Haesun (1 juni 1999)."Een Procrustes -probleem op het Stiefel -verdeelstuk". Numerische wiskunde. 82 (4): 599–619. Citeseerx 10.1.1.54.3580. doen:10.1007/S002110050432. S2CID 206895591.
- ^ Schönemann, Peter H. (maart 1966)."Een gegeneraliseerde oplossing van het probleem van de orthogonale Procrustes". Psychometrika. 31 (1): 1–10. doen:10.1007/BF02289451. HDL:10338.dmlcz/103138. S2CID 121676935.
- ^ Markopoulos, PP;Kundu, S;Chamadia, S;Tsagkarakis, n;Pados, DA (2018). Uitbijter-resistente gegevensverwerking met L1-Norm Principal Component Analysis. Vooruitgang in de principale componentanalyse. p. 121. doen:10.1007/978-981-10-6704-4_6. ISBN 978-981-10-6703-7.
- ^ Nie, f;Huang, h;Ding, C;Luo, Dijun;Wang, H (juli 2011)."Robuuste principale componentanalyse met niet-greedy L1-Norm maximalisatie". 22e internationale gezamenlijke conferentie over kunstmatige intelligentie: 1433–1438.
- ^ McCoy, Michael;Tropp, Joel A. (2011)."Twee voorstellen voor robuuste PCA met behulp van semidefinietprogrammering". Electronic Journal of Statistics. 5: 1123–1160. arxiv:1012.1086. doen:10.1214/11-EJS636. S2CID 14102421.
- ^ a b Markopoulos, pp. "Software repository". Opgehaald 21 mei, 2018.[Permanente dode link]
- ^ Tsagkarakis, Nicholas;Markopoulos, Panos P.;Sklivanitis, George;Pados, Dimitris A. (15 juni 2018)."L1-Norm Principal-componentanalyse van complexe gegevens". IEEE -transacties op signaalverwerking. 66 (12): 3256–3267. arxiv:1708.01249. Bibcode:2018itsp ... 66.3256t. doen:10.1109/TSP.2018.2821641. S2CID 21011653.
- ^ a b Chachlakis, Dimitris G.;Prater-Bennette, Ashley;Markopoulos, Panos P. (22 november 2019). "L1-Norm Tucker Tensor-ontleding". IEEE -toegang. 7: 178454–178465. arxiv:1904.06455. doen:10.1109/Access.2019.2955134.
- ^ Markopoulos, Panos P.;Chachlakis, Dimitris G.;Prater-Bennette, Ashley (21 februari 2019)."L1-Norm hogere orde enkelvoudige waarde ontleding". IEEE Proc.IEEE Global Conference 2018 over signaal- en informatieverwerking: 1353–1357. doen:10.1109/globalsip.2018.8646385. ISBN 978-1-7281-1295-4. S2CID 67874182.
- ^ Markopoulos, Panos P.;Chachlakis, Dimitris G.;Papalexakis, Evangelos (april 2018)."De exacte oplossing voor Rank-1 L1-Norm Tucker2-ontleding". IEEE -signaalverwerking letters. 25 (4): 511–515. arxiv:1710.11306. Bibcode:2018ispl ... 25..511m. doen:10.1109/lsp.2018.2790901. S2CID 3693326.
- ^ "L1-PCA Toolbox". Opgehaald 21 mei, 2018.