Niet-negatieve matrixfactorisatie

Niet-negatieve matrixfactorisatie (NMF of Nnmf), ook niet-negatieve matrixbenadering[1][2] is een groep van algoritmen in multivariate analyse en lineaire algebra waar een Matrix V is factorisch in (meestal) twee matrices W en H, met de eigenschap dat alle drie de matrices geen negatieve elementen hebben.Deze niet-negativiteit maakt de resulterende matrices gemakkelijker te inspecteren.In toepassingen zoals het verwerken van audiospectrogrammen of spieractiviteit is ook niet-negativiteit inherent aan de gegevens die worden overwogen.Omdat het probleem in het algemeen niet precies oplosbaar is, wordt het meestal numeriek benaderd.
NMF vindt applicaties op dergelijke velden als astronomie,[3][4][5] computer visie, Documentclustering,[1] Ontbrekende data -imputatie,[6] chemometrie, Audiosignaalverwerking, Aanbevelingssystemen,[7][8] en bio -informatica.[9]
Geschiedenis
In chemometrie Niet-negatieve matrixfactorisatie heeft een lange geschiedenis onder de naam "zelfmodelleringscurve-resolutie".[10] In dit kader zijn de vectoren in de rechtermatrix continue krommen in plaats van discrete vectoren.Ook vroeg werk aan niet-negatieve matrixfactorisaties werd uitgevoerd door een Finse groep onderzoekers in de jaren negentig onder de naam Positieve matrixfactorisatie.[11][12][13] Het werd meer algemeen bekend als niet-negatieve matrixfactorisatie na Lee en Seung Onderzocht de eigenschappen van het algoritme en publiceerde enkele eenvoudige en nuttige algoritmen voor twee soorten factorisaties.[14][15]
Achtergrond
Laat matrix V Wees het product van de matrices W en H,,
Matrixvermenigvuldiging kan worden geïmplementeerd als het berekenen van de kolomvectoren van V Als lineaire combinaties van de kolomvectoren in W met behulp van coëfficiënten geleverd door kolommen van H.Dat wil zeggen elke kolom van V kan als volgt worden berekend:
waar vi is de i-de kolomvector van de productmatrix V en hi is de i-de kolomvector van de matrix H.
Bij het vermenigvuldigen van matrices kunnen de dimensies van de factormatrices aanzienlijk lager zijn dan die van de productmatrix en het is deze eigenschap die de basis vormt van NMF.NMF genereert factoren met aanzienlijk verminderde dimensies in vergelijking met de oorspronkelijke matrix.Bijvoorbeeld, als V is een m × n Matrix, W is een m × p matrix, en H is een p × n Matrix dan p kan aanzienlijk minder zijn dan beide m en n.
Hier is een voorbeeld gebaseerd op een tekstmijntoepassing:
- Laat de ingangsmatrix (de te bewerken matrix) zijn V Met 10000 rijen en 500 kolommen waar woorden in rijen zijn en documenten in kolommen zijn.Dat wil zeggen, we hebben 500 documenten geïndexeerd met 10000 woorden.Hieruit volgt dat een kolomvector v in V vertegenwoordigt een document.
- Stel dat we het algoritme vragen om 10 functies te vinden om een Functies Matrix W met 10000 rijen en 10 kolommen en een coëfficiëntenmatrix H met 10 rijen en 500 kolommen.
- Het product van W en H is een matrix met 10000 rijen en 500 kolommen, dezelfde vorm als de ingangsmatrix V En als de factorisatie werkte, is dit een redelijke benadering van de invoermatrix V.
- Uit de behandeling van matrixvermenigvuldiging hierboven volgt dat elke kolom in de productmatrix Wh is een lineaire combinatie van de 10 kolomvectoren in de kenmerken Matrix W met coëfficiënten geleverd door de coëfficiëntenmatrix H.
Dit laatste punt is de basis van NMF omdat we elk origineel document in ons voorbeeld kunnen beschouwen als gebouwd uit een kleine set verborgen functies.NMF genereert deze functies.
Het is handig om aan elke functie (kolomvector) te denken in de Features Matrix W Als document archetype dat een reeks woorden omvat waarbij de celwaarde van elk woord de rang van het woord in de functie definieert: hoe hoger de celwaarde van een woord, hoe hoger de rang van het woord in de functie.Een kolom in de coëfficiëntenmatrix H Vertegenwoordigt een origineel document met een celwaarde die de rang van het document voor een functie definieert.We kunnen nu een document (kolomvector) reconstrueren van onze invoermatrix door een lineaire combinatie van onze functies (kolomvectoren in W) waarbij elke functie wordt gewogen door de celwaarde van de functie uit de kolom van het document in H.
Clusteringseigenschap
NMF heeft een inherente clusteringseigenschap,[16] d.w.z. het clusteert automatisch de kolommen van invoergegevens .
Meer specifiek, de benadering van door wordt bereikt door te vinden en die de foutfunctie minimaliseren (met behulp van de Frobenius Norm))
onderworpen aan ,,
Als we verder een orthogonaliteitsbeperking opleggen , d.w.z. , dan is de bovenstaande minimalisatie wiskundig equivalent aan de minimalisatie van K-middelen clustering.[16]
Verder de berekende geeft het clusterlidmaatschap, d.w.z. als voor iedereen i ≠ k, dit suggereert dat de invoergegevens hoort bij -th cluster.De berekende geeft de cluster zwaartepunts, d.w.z. de -TH -kolom geeft het cluster -centroid van -th cluster.De weergave van dit centroid kan aanzienlijk worden verbeterd door convexe NMF.
Wanneer de orthogonaliteitsbeperking wordt niet expliciet opgelegd, de orthogonaliteit geldt grotendeels en de clusteringseigenschap geldt ook.Clustering is het hoofddoel van de meeste datamining Toepassingen van NMF.
Wanneer de te gebruiken foutfunctie is Kullback - leibler divergentie, NMF is identiek aan de Probabilistische latente semantische analyse (PLSA), een populaire documentclustermethode.[17]
Soorten
Geschatte niet-negatieve matrixfactorisatie
Meestal het aantal kolommen van W en het aantal rijen van H In NMF worden dus het product geselecteerd Wh wordt een benadering van V.De volledige ontleding van V komt dan neer op de twee niet-negatieve matrices W en H evenals een rest U, zoals dat: V = Wh + U.De elementen van de resterende matrix kunnen negatief of positief zijn.
Wanneer W en H zijn kleiner dan V Ze worden gemakkelijker op te slaan en te manipuleren.Een andere reden om factorering te factureren V in kleinere matrices W en H, is dat als iemand in staat is om de elementen van te vertegenwoordigen van V Door aanzienlijk minder gegevens, moet men dan een latent structuur in de gegevens afleiden.
Convexe niet-negatieve matrixfactorisatie
In standaard NMF, matrixfactor W ∈ R+m × k, D.w.z. W kan alles in die ruimte zijn.Convexe NMF[18] beperkt de kolommen van W tot convexe combinaties van de invoergegevensvectoren .Dit verbetert de kwaliteit van gegevensrepresentatie aanzienlijk W.Bovendien is de resulterende matrixfactor H wordt schaars en orthogonaal.
Niet -negatieve rangfactorisatie
In het geval de niet -negatieve rang van V is gelijk aan zijn werkelijke rang, V = Wh wordt een niet -negatieve rangfactorisatie (NRF) genoemd.[19][20][21] Het probleem van het vinden van de NRF van V, als het bestaat, is bekend als NP-Hard.[22]
Verschillende kostenfuncties en regularisaties
Er zijn verschillende soorten niet-negatieve matrixfactorisaties.De verschillende typen komen voort uit het gebruik van verschillende Kostenfuncties voor het meten van de divergentie tussen V en Wh en mogelijk door regularisatie van de W en/of H matrices.[1]
Twee eenvoudige divergentie -functies bestudeerd door Lee en Seung zijn de kwadraatfout (of Frobenius Norm) en een uitbreiding van de kullback -leibler -divergentie naar positieve matrices (het origineel Kullback - leibler divergentie is gedefinieerd op waarschijnlijkheidsverdelingen).Elke divergentie leidt tot een ander NMF -algoritme, meestal het minimaliseren van de divergentie met behulp van iteratieve updateregels.
Het factorisatieprobleem in de kwadratische foutversie van NMF kan worden vermeld als: Gegeven een matrix Vind niet -negatieve matrices w en h die de functie minimaliseren
Een ander type NMF voor afbeeldingen is gebaseerd op de Totale variatienorm.[23]
Wanneer L1 -regularisatie (verwant aan Lasso) wordt toegevoegd aan NMF met de gemiddelde kwadratische foutkostenfunctie, het resulterende probleem kan worden genoemd Niet-negatieve schaarse codering vanwege de gelijkenis met de schaarse codering probleem,[24][25] Hoewel het ook nog steeds NMF kan worden genoemd.[26]
Online NMF
Veel standaard NMF -algoritmen analyseren alle gegevens samen;d.w.z. de hele matrix is vanaf het begin beschikbaar.Dit kan onbevredigend zijn in toepassingen waar te veel gegevens zijn om in het geheugen te passen of waar de gegevens worden verstrekt streaming mode.Een dergelijk gebruik is voor samenwerkingsfiltering in Aanbevelingssystemen, waar er veel gebruikers en veel items kunnen zijn om aan te bevelen, en het zou inefficiënt zijn om alles opnieuw te berekenen wanneer een gebruiker of één item aan het systeem wordt toegevoegd.De kostenfunctie voor optimalisatie in deze gevallen kan al dan niet hetzelfde zijn als voor standaard NMF, maar de algoritmen moeten nogal verschillend zijn.[27][28][29]
Algoritmen
Er zijn verschillende manieren waarop de W en H kan worden gevonden: Lee en Seung's Multiplicatieve updateregel[15] is een populaire methode geweest vanwege de eenvoud van implementatie.Dit algoritme is:
- Initialiseren: W en H niet negatief.
- Werk vervolgens de waarden in W en H door het volgende te berekenen, met als een index van de iteratie.
- en
- Tot W en H zijn stabiel.
Merk op dat de updates op een element per elementbasis niet matrixvermenigvuldiging worden uitgevoerd.
We merken op dat de multiplicatieve factoren voor W en H, d.w.z. de en voorwaarden, zijn Matrices of ones wanneer .
Meer recent zijn andere algoritmen ontwikkeld.Sommige benaderingen zijn gebaseerd op afwisselend Niet-negatieve kleinste vierkanten: in elke stap van een dergelijk algoritme, eerst H is vast en W gevonden door een niet-negatieve kleinste vierkantenoplosser, dan W is vast en H wordt analoog gevonden.De procedures die worden gebruikt om op te lossen W en H kan hetzelfde zijn[30] of anders, zoals sommige NMF -varianten regulariseren W en H.[24] Specifieke benaderingen omvatten de geprojecteerde gradiëntafkomst Methoden,[30][31] de actieve set methode,[7][32] De optimale gradiëntmethode,[33] en de Block Principal Pivoting -methode[34] onder verschillende anderen.[35]
Huidige algoritmen zijn suboptimaal omdat ze alleen garanderen dat het vinden van een lokaal minimum, in plaats van een wereldwijd minimum van de kostenfunctie.Een aantoonbaar optimaal algoritme is in de nabije toekomst onwaarschijnlijk, omdat is aangetoond NP-complete.[36] Zoals bij veel andere data -mining -toepassingen, kan een lokaal minimum echter nog steeds nuttig blijken te zijn.

Sequentieel NMF
De opeenvolgende constructie van NMF -componenten (W en H) werd eerst gebruikt om NMF te relateren met Hoofdcomponentanalyse (PCA) in astronomie.[37] De bijdrage van de PCA -componenten wordt gerangschikt door de grootte van hun overeenkomstige eigenwaarden;Voor NMF kunnen de componenten ervan empirisch worden gerangschikt wanneer ze één voor één (opeenvolgend) worden geconstrueerd, d.w.z. de -th component met de eerste componenten geconstrueerd.
De bijdrage van de sequentiële NMF -componenten kan worden vergeleken met de Karhunen - Loève stelling, een toepassing van PCA, met behulp van de plot van eigenwaarden.Een typische keuze van het aantal componenten met PCA is gebaseerd op het "elleboog" -punt, dan geeft het bestaan van het platte plateau aan dat PCA de gegevens niet efficiënt vastlegt, en eindelijk bestaat er een plotselinge druppel die de verovering van willekeurige weergave weerspiegeltRuis en valt in het regime van overfitting.[38][39] Voor sequentiële NMF wordt de grafiek van eigenwaarden benaderd door de grafiek van de fractionele resterende variantiecurves, waarbij de krommen continu afnemen, en convergeren naar een hoger niveau dan PCa,[5] wat de indicatie is van minder overpassende opeenvolgende NMF.
Exacte NMF
Exacte oplossingen voor de varianten van NMF kunnen worden verwacht (in polynomiale tijd) wanneer extra beperkingen voor matrix gelden V.Een polynomiaal tijdsalgoritme voor het oplossen van niet -negatieve rangfactorisatie als V Bevat een monomiale submatrix van rang gelijk aan zijn rang werd gegeven door Campbell en Poole in 1981.[40] Kalofolias en Gallopoulos (2012)[41] loste de symmetrische tegenhanger van dit probleem op, waar V is symmetrisch en bevat een diagonale hoofdsubmatrix van rang R.Hun algoritme komt binnen O (RM2) tijd in de dichte zaak.Arora, GE, Halpern, Mimno, Moitra, Sontag, Wu en Zhu (2013) geven een polynomiaal tijdsalgoritme voor exacte NMF dat werkt voor het geval waarbij een van de factoren W voldoet aan een scheidbaarheidsconditie.[42]
Relatie met andere technieken
In Het leren van de delen van objecten door niet-negatieve matrixfactorisatie Lee en Seung[43] Voorgesteld NMF voornamelijk voor onderdelengebaseerde ontleding van afbeeldingen.Het vergelijkt nmf met vector kwantisatie en Hoofdcomponentanalyse, en laat zien dat hoewel de drie technieken als factorisaties kunnen worden geschreven, ze verschillende beperkingen implementeren en daarom verschillende resultaten opleveren.

Later werd aangetoond dat sommige soorten NMF een instantie zijn van een meer algemeen probabilistisch model genaamd "multinomiale PCA".[44] Wanneer NMF wordt verkregen door de Kullback - leibler divergentie, het is in feite gelijk aan een ander exemplaar van multinomiale PCa, Probabilistische latente semantische analyse,[45] getraind door maximale kans schatting.Die methode wordt vaak gebruikt voor het analyseren en clusteren van tekstgegevens en is ook gerelateerd aan de latente klassenmodel.
NMF met het kleinste kwadratendoel is gelijk aan een ontspannen vorm van K-middelen clustering: de matrixfactor W Bevat clustercentrums en H Bevat cluster -lidmaatschapsindicatoren.[16][46] Dit biedt een theoretische basis voor het gebruik van NMF voor gegevensclustering.K-Means handhaaft echter niet-negativiteit niet op zijn zwaartepunt, dus de dichtstbijzijnde analogie is in feite met "semi-NMF".[18]
NMF kan worden gezien als een tweelaagse Gericht grafisch Model met één laag waargenomen willekeurige variabelen en één laag verborgen willekeurige variabelen.[47]
NMF strekt zich uit voorbij matrices tot tensoren van willekeurige orde.[48][49][50] Deze uitbreiding kan worden gezien als een niet-negatieve tegenhanger van bijvoorbeeld de Parafac model.
Andere uitbreidingen van NMF omvatten gewrichtsfactorisatie van verschillende gegevensmatrices en tensoren waarbij sommige factoren worden gedeeld.Dergelijke modellen zijn nuttig voor sensorfusie en relationeel leren.[51]
NMF is een voorbeeld van niet -negatief kwadratisch programmeren (NQP), net als de Ondersteuning vectormachine (SVM).SVM en NMF zijn echter op een meer intiem niveau gerelateerd dan die van NQP, waardoor directe toepassing van de oplossing -algoritmen is ontwikkeld die zijn ontwikkeld voor een van de twee methoden voor problemen in beide domeinen.[52]
Uniekheid
De factorisatie is niet uniek: een matrix en zijn omgekeerd kan worden gebruikt om de twee factorisatiematrices te transformeren door, b.v.[53]
Als de twee nieuwe matrices en zijn niet-negatief Ze vormen een andere parametrisering van de factorisatie.
De niet-negativiteit van en Geldt tenminste als B is een niet-negatief monomiale matrix.In dit eenvoudige geval komt het gewoon overeen met een schaalverdeling en een permutatie.
Meer controle over de niet-uniciteit van NMF wordt verkregen met sparsity-beperkingen.[54]
Toepassingen
Astronomie
In astronomie is NMF een veelbelovende methode voor dimensievermindering In de zin dat astrofysische signalen niet-negatief zijn.NMF is toegepast op de spectroscopische waarnemingen[3][4] en de directe beeldvormende observaties[5] als een methode om de gemeenschappelijke eigenschappen van astronomische objecten te bestuderen en de astronomische waarnemingen na te proces.De vooruitgang in de spectroscopische waarnemingen door Blanton & Roweis (2007)[4] houdt rekening met de onzekerheden van astronomische observaties, die later wordt verbeterd door ZHU (2016)[37] waar ontbrekende gegevens ook worden overwogen en parallel computing is ingeschakeld.Hun methode wordt vervolgens overgenomen door Ren et al.(2018)[5] naar het directe beeldvormingsveld als een van de Methoden voor het detecteren van exoplaneten, vooral voor de directe beeldvorming van Conditellar schijven.
Ren et al.(2018)[5] zijn in staat om de stabiliteit van NMF -componenten te bewijzen wanneer ze opeenvolgend zijn geconstrueerd (d.w.z. één voor één), waardoor de lineariteit van het NMF -modelleringsproces;de lineariteit eigenschap wordt gebruikt om het stellaire licht te scheiden en het licht verspreid van de exoplaneten en Conditellar schijven.
In directe beeldvorming, om de vage exoplaneten en circumstellaire schijven te onthullen van heldere de omringende stellaire lichten, die een typisch contrast hebben van 10⁵ tot 10¹⁰, zijn verschillende statistische methoden aangenomen,[55][56][38] Het licht van de exoplaneten of circumstellaire schijven is echter meestal te pakken, waarbij voorwaartse modellering moet worden aangenomen om de ware flux te herstellen.[57][39] Voorwaartse modellering is momenteel geoptimaliseerd voor puntbronnen,[39] Maar niet voor uitgebreide bronnen, vooral voor onregelmatig gevormde structuren zoals Conditellar -schijven.In deze situatie is NMF een uitstekende methode geweest, die minder te passen is in de zin van de niet-negativiteit en spitsigheid Van de NMF -modelleringscoëfficiënten kan daarom voorwaartse modellering worden uitgevoerd met een paar schaalfactoren,[5] in plaats van een rekenintensieve gegevens hervermindering op gegenereerde modellen.
Gegevensimputatie
Om ontbrekende gegevens in de statistieken toe te rekenen, kan NMF ontbrekende gegevens nemen en de kostenfunctie minimaliseren, in plaats van deze ontbrekende gegevens als nullen te behandelen.[6] Dit maakt het een wiskundig bewezen methode voor Gegevensimputatie in statistieken.[6] Door eerst te bewijzen dat de ontbrekende gegevens worden genegeerd in de kostenfunctie en vervolgens bewijzen dat de impact van ontbrekende gegevens zo klein kan zijn als een tweede orde -effect, Ren et al.(2020)[6] bestudeerde en paste een dergelijke aanpak op het gebied van astronomie.Hun werk richt zich op tweedimensionale matrices, met name omvat het wiskundige afleiding, gesimuleerde gegevensimputatie en toepassing op on-sky gegevens.
De procedure voor gegevensimputatie met NMF kan uit twee stappen worden samengesteld.Ten eerste, wanneer de NMF -componenten bekend zijn, Ren et al.(2020) bewees dat impact van het missen van gegevens tijdens data -imputatie ("doelmodellering" in hun onderzoek) een tweede orde effect is.Ten tweede, wanneer de NMF-componenten onbekend zijn, bewezen de auteurs dat de impact van ontbrekende gegevens tijdens de componentconstructie een order-effect van het eerste tot een seconde is.
Afhankelijk van de manier waarop de NMF -componenten worden verkregen, kan de eerdere stap hierboven onafhankelijk of afhankelijk zijn van de laatste.Bovendien kan de imputatiekwaliteit worden verhoogd wanneer de meer NMF -componenten worden gebruikt, zie figuur 4 van Ren et al.(2020) voor hun illustratie.[6]
Tekstmining
NMF kan worden gebruikt voor Tekstmining Toepassingen.In dit proces a documentterm Matrix is geconstrueerd met de gewichten van verschillende termen (meestal gewogen woordfrequentie -informatie) uit een reeks documenten.Deze matrix wordt meegedeeld in een termijn en een functie-document Matrix.De functies zijn afgeleid van de inhoud van de documenten, en de functie-document-matrix beschrijft Gegevensclusters van gerelateerde documenten.
Een specifieke applicatie gebruikte hiërarchische NMF op een kleine subset van wetenschappelijke samenvattingen van PubMed.[58] Een andere onderzoeksgroep geclusterde delen van de Enron E -maildataset[59] met 65.033 berichten en 91.133 termen in 50 clusters.[60] NMF is ook toegepast op citatiegegevens, met één voorbeeldclustering Engelse wikipedia artikelen en Wetenschappelijke tijdschriften Gebaseerd op de uitgaande wetenschappelijke citaten in het Engels Wikipedia.[61]
Arora, GE, Halpern, Mimno, Moitra, Sontag, Wu en Zhu (2013) hebben polynomiale tijd algoritmen gegeven om onderwerpmodellen te leren met behulp van NMF.Het algoritme veronderstelt dat de onderwerpmatrix voldoet aan een scheidbaarheidsvoorwaarde die vaak in deze instellingen wordt gevonden.[42]
Hassani, Iranmanesh en Mansouri (2019) stelden een functie-agglomeratiemethode voor voor term-documentmatrices voor die werkt met behulp van NMF.Het algoritme vermindert de term-documentmatrix tot een kleinere matrix die geschikterer is voor tekstclustering.[62]
Spectrale gegevensanalyse
NMF wordt ook gebruikt om spectrale gegevens te analyseren;Een dergelijk gebruik is in de classificatie van ruimteobjecten en puin.[63]
Schaalbare voorspelling van internetafstand
NMF wordt toegepast in voorspelling van schaalbare internetafstand (retour-tijd).Voor een netwerk met gastheren, met behulp van NMF, de afstanden van alle End-to-end links kunnen worden voorspeld nadat ze alleen hadden uitgevoerd afmetingen.Dit soort methode werd eerst geïntroduceerd in internetafstandsschattingsservice (IDES).[64] Daarna, als een volledig gedecentraliseerde aanpak, coördinatensysteem van het Phoenix -netwerk[65] is voorgesteld.Het bereikt een betere algehele voorspellingsnauwkeurigheid door het concept van gewicht te introduceren.
Niet-stationaire spraak denoising
Spraak denoising is een langdurig probleem geweest in Audiosignaalverwerking.Er zijn veel algoritmen voor denoising als het geluid stationair is.Bijvoorbeeld de Wiener -filter is geschikt voor additief Gaussiaanse ruis.Als het geluid echter niet-stationair is, hebben de klassieke denoiserende algoritmen meestal slechte prestaties omdat de statistische informatie van het niet-stationaire ruis moeilijk te schatten is.Schmidt et al.[66] Gebruik NMF om spraak te doen aan denoising onder niet-stationaire ruis, die totaal verschilt van klassieke statistische benaderingen.Het belangrijkste idee is dat schoon spraaksignaal dun kan worden weergegeven door een spraakwoordenboek, maar niet-stationaire ruis kan dat niet.Evenzo kan niet-stationaire ruis ook dun worden weergegeven door een ruiswoordenboek, maar spraak kan dat niet.
Het algoritme voor NMF Denoising gaat als volgt.Twee woordenboeken, één voor spraak en een voor ruis, moeten offline worden getraind.Zodra een lawaaierige spraak is gegeven, berekenen we eerst de grootte van de korte-tijd-fourier-transformatie.Ten tweede, scheid het in twee delen via NMF, de ene kan dun worden weergegeven door het spraakwoordenboek, en het andere deel kan dun worden weergegeven door het ruiswoordenboek.Ten derde zal het deel dat wordt weergegeven door het spraakwoordenboek de geschatte schone spraak is.
Bevolkingsgenetica
Schaarse nmf wordt gebruikt in Bevolkingsgenetica Voor het schatten van individuele mengselcoëfficiënten, het detecteren van genetische clusters van individuen in een populatiemonster of evalueren genetische mengsel in bemonsterde genomen.Bij menselijke genetische clustering bieden NMF -algoritmen schattingen die vergelijkbaar zijn met die van de computerprogramma -structuur, maar de algoritmen zijn efficiënter computationeel en maken analyse van grote populatie -genomische gegevenssets mogelijk.[67]
Bio -informatica
NMF is met succes toegepast in bio -informatica voor clustering genexpressie en DNA -methylatie Gegevens en het vinden van de genen die het meest representatief zijn voor de clusters.[25][68][69][70] Bij de analyse van kankermutaties is het gebruikt om gemeenschappelijke patronen van mutaties te identificeren die bij veel kankers optreden en die waarschijnlijk verschillende oorzaken hebben.[71] NMF -technieken kunnen bronnen van variatie identificeren, zoals celtypen, ziektesubtypen, populatiestratificatie, weefselsamenstelling en tumorclonaliteit.[72]
Een bepaalde variant van NMF, namelijk niet-negatieve matrix tri-factorisatie (NMTF),[73] is gebruikt voor het herbestemmen van geneesmiddelen om nieuwe eiwitdoelen en therapeutische indicaties voor goedgekeurde geneesmiddelen te voorspellen[74] en om een paar synergische geneesmiddelen tegen kanker af te leiden.[75]
Nucleaire beeldvorming
NMF, ook op dit gebied genoemd als factoranalyse, wordt sinds de jaren tachtig gebruikt[76] om sequenties van afbeeldingen in te analyseren Specteren en HUISDIER Dynamische medische beeldvorming.Niet-uniciteit van NMF werd aangepakt met behulp van sparsity-beperkingen.[77] [78] [79]
Huidig onderzoek
Huidig onderzoek (sinds 2010) in niet -negatieve matrixfactorisatie omvat, maar is niet beperkt tot,
- Algoritmisch: zoeken naar globale minima van de factoren en factorinitialisatie.[80]
- Schaalbaarheid: hoe factor is voor een miljoenen matrices van een miljard, die gebruikelijk zijn in datamining op webschaal, zie bijvoorbeeld gedistribueerde niet-negatieve matrixfactorisatie (DNMF),[81] Schaalbare niet -negatieve matrixfactorisatie (scalablenmf),[82] Gedistribueerde stochastische ontleding van enkelvoudige waarde.[83]
- Online: hoe de factorisatie bij te werken wanneer nieuwe gegevens binnenkomen zonder opnieuw te herstellen, zie bijvoorbeeld online CNSC[84]
- Collectieve (gezamenlijke) factorisatie: factorering van meerdere onderling verbonden matrices voor leren met meerdere views, b.v.Multi-view clustering, zie conmf[85] en multinmf[86]
- Cohen en Rothblum 1993 Probleem: of een rationele matrix altijd een NMF van minimale binnendimensie heeft waarvan de factoren ook rationeel zijn.Onlangs is dit probleem negatief beantwoord.[87]
Zie ook
Bronnen en externe links
Aantekeningen
- ^ a b c Suvrit Sra; Inderjit S. Dhillon (2006). Gegeneraliseerde niet -negatieve matrixbenaderingen met Bregman Divergences (PDF). Vooruitgang in neurale informatieverwerkingssystemen 18.Vooruitgang in neurale informatieverwerkingssystemen. ISBN 978-0-262-23253-1. WikidataQ77685465.
- ^ Tandon, Rashish;SRA, Suvrit (13 september 2010). Schaarse niet -negatieve matrixbenadering: nieuwe formuleringen en algoritmen (PDF) (Rapport).Max Planck Instituut voor biologische cybernetica.Technisch rapport nr. 193.
- ^ a b Berné, O.;Joblin, C.;Deville, Y.;Smith, J. D.;Rapacioli, M.;Bernard, J. P.;Thomas, J.;Reach, W.;Abergel, A. (2007-07-01). "Analyse van de emissie van zeer kleine stofdeeltjes uit Spitzer-spectrro-imagery-gegevens met behulp van blinde signaalscheidingsmethoden". Astronomie en astrofysica. 469 (2): 575–586. doen:10.1051/0004-6361: 20066282. ISSN 0004-6361.
- ^ a b c Blanton, Michael R.;Roweis, Sam (2007)."K-correcties en filtertransformaties in de ultraviolette, optische en bijna infrarood". The Astronomical Journal. 133 (2): 734–754. arxiv:Astro-PH/0606170. Bibcode:2007aJ .... 133..734b. doen:10.1086/510127. S2CID 18561804.
- ^ a b c d e f g Ren, bin;Pueyo, Laurent;Zhu, Guangtun B.;Duchêne, Gaspard (2018)."Niet-negatieve matrixfactorisatie: robuuste extractie van uitgebreide structuren". The Astrophysical Journal. 852 (2): 104. arxiv:1712.10317. Bibcode:2018apj ... 852..104R. doen:10.3847/1538-4357/AAA1F2. S2CID 3966513.
- ^ a b c d e Ren, bin;Pueyo, Laurent;Chen, Christine;Choquet, Elodie;Debes, John H;Duechene, Gaspard;Menard, Francois;Perrin, Marshall D. (2020)."Het gebruik van gegevensimputatie voor signaalscheiding bij beeldvorming met hoge contrast". The Astrophysical Journal. 892 (2): 74. arxiv:2001.00563. Bibcode:2020APJ ... 892 ... 74R. doen:10.3847/1538-4357/AB7024. S2CID 209531731.
- ^ a b Rainer Gemulla;Erik Nijkamp; Peter J. Haas;Yannis Sismanis (2011). Grootschalige matrixfactorisatie met gedistribueerde stochastische gradiëntafkomst.Proc.ACM SIGKDD INT'l Conf.over kennisontdekking en datamining.pp. 69–77.
- ^ Yang Bao;et al.(2014). TopicMF: tegelijkertijd gebruik maken van beoordelingen en beoordelingen voor aanbeveling. AAAI.
- ^ Ben Murrell;et al.(2011). "Niet-negatieve matrixfactorisatie voor leeruitlijningsspecifieke modellen van eiwitevolutie". PLOS One. 6 (12): E28898. Bibcode:2011Ploso ... 628898m. doen:10.1371/journal.pone.0028898. PMC 3245233. Pmid 22216138.
- ^ William H. Lawton;Edward A. Sylvestre (1971)."Zelfmodellerende curve -resolutie". Technometrie. 13 (3): 617–633. doen:10.2307/1267173. Jstor 1267173.
- ^ Pentti Pauatero;Tot tapper;Pasi Aalto;Markku Kulmala (1991)."Matrixfactorisatiemethoden voor het analyseren van diffusiebatterijgegevens". Journal of Aerosol Science. 22: S273 - S276. doen:10.1016/S0021-8502 (05) 80089-8. ISSN 0021-8502. WikidataQ58065673.
- ^ Pentti Pauatero;Tot Tapper (juni 1994). "Positieve matrixfactorisatie: een niet-negatief factormodel met een optimaal gebruik van foutschattingen van gegevenswaarden". Milieu. 5 (2): 111–126. doen:10.1002/env.3170050203. ISSN 1180-4009. WikidataQ29308406.
- ^ PIA Anttila;Pentti Pauatero;Tot tapper;Olli Järvinen (1995)."Bronidentificatie van bulk natte afzetting in Finland door positieve matrixfactorisatie". Sfeervolle omgeving. 29 (14): 1705–1718. Bibcode:1995atmen..29.1705a. doen:10.1016/1352-2310 (94) 00367-T.
- ^ a b Daniel D. Lee & H. Sebastian Seung (1999)."De delen van objecten leren door niet-negatieve matrixfactorisatie". Natuur. 401 (6755): 788–791. Bibcode:1999natur.401..788L. doen:10.1038/44565. Pmid 10548103. S2CID 4428232.
- ^ a b Daniel D. Lee & H. Sebastian Seung (2001). Algoritmen voor niet-negatieve matrixfactorisatie (PDF).Vooruitgang in neurale informatieverwerkingssystemen 13: Proceedings of the 2000 Conference. MIT Press. pp. 556–562.
- ^ a b c C. Ding, X. He, H.D.Simon (2005). "Over de gelijkwaardigheid van niet -negatieve matrixfactorisatie en spectrale clustering".Proc.Siam int'l conf.Data Mining, pp. 606-610.Mei 2005
- ^ Ding C, Li Y, Peng W (2008). "Over de gelijkwaardigheid tussen niet-negatieve matrixfactorisatie en probabilistische latente semantische indexering" (PDF). Computationele statistieken en gegevensanalyse. 52 (8): 3913–3927. doen:10.1016/j.csda.2008.01.011. Gearchiveerd van het origineel (PDF) op 2016-03-04.
- ^ a b C Ding, T Li, Mi Jordan, Convex en semi-niet-negatieve matrixfactorisaties, IEEE-transacties op patroonanalyse en machine-intelligentie, 32, 45-55, 2010
- ^ Berman, A.;R.J.Plemmons (1974)."Inverses van niet -negatieve matrices". Lineaire en multilineaire algebra. 2 (2): 161–172. doen:10.1080/03081087408817055.
- ^ A. Berman;R.J.Plemmons (1994). Niet -negatieve matrices in de wiskundige wetenschappen. Philadelphia: Siam.
- ^ Thomas, L.B.(1974)."Probleem 73-14, rangfactorisatie van niet-negatieve matrices". Siam Rev. 16 (3): 393–394. doen:10.1137/1016064.
- ^ Vavasis, S.A. (2009)."Over de complexiteit van niet -negatieve matrixfactorisatie". Siam J. Optim. 20 (3): 1364–1377. arxiv:0708.4149. doen:10.1137/070709967. S2CID 7150400.
- ^ Zhang, T.;Fang, B.;Liu, W.;Tang, Y. Y.;Hij g.;Wen, J. (2008)."Totale variatie-norm gebaseerde niet-negatieve matrixfactorisatie voor het identificeren van discriminerende weergave van beeldpatronen". Neurocomputing. 71 (10–12): 1824–1831. doen:10.1016/j.neucom.2008.01.022.
- ^ a b Hoyer, Patrik O. (2002). Niet-negatieve schaarse codering.Proc.IEEE -workshop over neurale netwerken voor signaalverwerking. arxiv:CS/0202009.
- ^ a b Leo Taslaman & Björn Nilsson (2012). "Een raamwerk voor geregulariseerde niet-negatieve matrixfactorisatie, met toepassing op de analyse van genexpressiegegevens". PLOS One. 7 (11): E46331. Bibcode:2012Ploso ... 746331T. doen:10.1371/journal.pone.0046331. PMC 3487913. Pmid 23133590.
- ^ Hsieh, C. J.;Dhillon, I. S. (2011). Snelle coördinaatafdaalmethoden met variabele selectie voor niet-negatieve matrixfactorisatie (PDF).Proceedings van de 17e ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD '11.p.1064. doen:10.1145/2020408.2020577. ISBN 9781450308137.
- ^ http://www.ijcai.org/papers07/papers/ijcai07-432.pdf[kale url pdf]
- ^ Fung, Yik-Hing;Li, Chun-Hung;Cheung, William K. (2 november 2007). Online discussie Participatie Voorspelling met behulp van niet-negatieve matrixfactorisatie.Wi-IATW '07.IEEE Computer Society.pp. 284–287. ISBN 9780769530284 - Via DL.acm.org.
- ^ Naiyang Guan;Dacheng Tao;Zhigang Luo & Bo Yuan (juli 2012)."Online niet -negatieve matrixfactorisatie met robuuste stochastische benadering". IEEE -transacties op neurale netwerken en leersystemen. 23 (7): 1087-1099. doen:10.1109/tnnls.2012.2197827. Pmid 24807135. S2CID 8755408.
- ^ a b Lin, Chih-Jen (2007). "Projecteerde gradiëntmethoden voor niet -negatieve matrixfactorisatie" (PDF). Neurale berekening. 19 (10): 2756–2779. Citeseerx 10.1.1.308.9135. doen:10.1162/neco.2007.19.10.2756. Pmid 17716011. S2CID 2295736.
- ^ Lin, Chih-Jen (2007)."Over de convergentie van multiplicatieve update -algoritmen voor niet -negatieve matrixfactorisatie". IEEE -transacties op neurale netwerken. 18 (6): 1589–1596. Citeseerx 10.1.1.407.318. doen:10.1109/tnn.2007.895831. S2CID 2183630.
- ^ Hyunoo Kim & Haesun Park (2008). "Niet -negatieve matrixfactorisatie op basis van afwisselende niet -negativiteit beperkt kleinste vierkanten en actieve set -methode" (PDF). SIAM Journal over matrixanalyse en toepassingen. 30 (2): 713–730. Citeseerx 10.1.1.70.3485. doen:10.1137/07069239x.
- ^ Naiyang Guan;Dacheng Tao;Zhigang Luo;Bo Yuan (juni 2012)."NENMF: een optimale gradiëntmethode voor niet -negatieve matrixfactorisatie". IEEE -transacties op signaalverwerking. 60 (6): 2882–2898. Bibcode:2012itsp ... 60.2882G. doen:10.1109/TSP.2012.2190406. S2CID 8143231.
- ^ Jingu Kim & Haesun Park (2011)."Snelle niet-negatieve matrixfactorisatie: een actieve set-achtige methode en vergelijkingen". Siam Journal on Scientific Computing. 58 (6): 3261–3281. Citeseerx 10.1.1.419.798. doen:10.1137/110821172.
- ^ Jingu Kim;Yunlong He & Haesun Park (2013). "Algoritmen voor niet -negatieve matrix- en tensorfactorisaties: een uniforme weergave op basis van blokcoördinaatafstemmingskader" (PDF). Journal of Global Optimization. 33 (2): 285–319. doen:10.1007/s10898-013-0035-4. S2CID 11197117.
- ^ Ding, C.;Hij, X. & Simon, H.D.(2005)."Over de gelijkwaardigheid van niet -negatieve matrixfactorisatie en spectrale clustering". Proc.Siam Data Mining Conf.Vol.4. pp. 606–610. doen:10.1137/1.9781611972757.70. ISBN 978-0-89871-593-4.
- ^ a b Zhu, Guangtun B. (2016-12-19)."Niet -negatieve matrixfactorisatie (NMF) met heteroscedastische onzekerheden en ontbrekende gegevens". arxiv:1612.06037 [astro-ph.im].
- ^ a b Soummer, Rémi;Pueyo, Laurent;Larkin, James (2012)."Detectie en karakterisering van exoplaneten en schijven met behulp van projecties op Karhunen-Loève-veligen". The Astrophysical Journal Letters. 755 (2): L28. arxiv:1207.4197. Bibcode:2012apj ... 755L..28S. doen:10.1088/2041-8205/755/2/L28. S2CID 51088743.
- ^ a b c Pueyo, Laurent (2016)."Detectie en karakterisering van exoplaneten met behulp van projecties op Karhunen Loeve -eigenschappen: voorwaartse modellering". The Astrophysical Journal. 824 (2): 117. arxiv:1604.06097. Bibcode:2016apj ... 824..117p. doen:10.3847/0004-637x/824/2/117. S2CID 118349503.
- ^ Campbell, S.L.;G.D. Poole (1981). "Niet -negatieve rangfactorisaties berekenen". Lineaire algebra appl. 35: 175–182. doen:10.1016/0024-3795 (81) 90272-X.
- ^ Kalofolias, V.;Gallopoulos, E. (2012). "Symmetrische niet -negatieve rangfactorisaties berekenen" (PDF). Lineaire algebra appl. 436 (2): 421–435. doen:10.1016/j.laa.2011.03.016.
- ^ a b Arora, Sanjeev;GE, Rong;Halpern, Yoni;Mimno, David;Moitra, Ankur;Sontag, David;Wu, Yichen;Zhu, Michael (2013). Een praktisch algoritme voor onderwerpmodellering met aantoonbare garanties.Proceedings of the 30th International Conference on Machine Learning. arxiv:1212.4777. Bibcode:2012arxiv1212.4777a.
- ^ Lee, Daniel D.;Sebastian, Seung, H. (1999). "De delen van objecten leren door niet-negatieve matrixfactorisatie" (PDF). Natuur. 401 (6755): 788–791. Bibcode:1999natur.401..788L. doen:10.1038/44565. Pmid 10548103. S2CID 4428232.
- ^ Wray Buntine (2002). Variabele extensies voor EM en multinomiale PCA (PDF).Proc.Europese conferentie over machine learning (ECML-02).Lnai.Vol.2430. pp. 23–34.
- ^ Eric Gaussier & Cyril Goutte (2005). Relatie tussen PLSA en NMF en implicaties (PDF).Proc.28e Internationale ACM SIGIR-conferentie over onderzoek en ontwikkeling bij het ophalen van informatie (SIGIR-05).pp. 601–602.Gearchiveerd van het origineel (PDF) op 2007-09-28. Opgehaald 2007-01-29.
- ^ Ron Zass en Amnon Shashua (2005). "Een verenigende benadering van harde en probabilistische clustering". Internationale conferentie over Computer Vision (ICCV) Beijing, China, oktober 2005.
- ^ Max Welling;et al.(2004). Exponentiële familharmoniums met een aanvraag voor het ophalen van informatie. NIPS.
- ^ Pentti Pauatero (1999)."De Multilinear Engine: een tabelgestuurd, minst vierkantenprogramma voor het oplossen van multilineaire problemen, waaronder het N-Way Parallel Factor Analysis Model". Journal of Computational and Graphical Statistics. 8 (4): 854–888. doen:10.2307/1390831. Jstor 1390831.
- ^ Max Welling & Markus Weber (2001)."Positieve tensorfactorisatie". Patroonherkenningsbrieven. 22 (12): 1255–1261. Bibcode:2001parel..22.1255W. Citeseerx 10.1.1.21.24. doen:10.1016/s0167-8655 (01) 00070-8.
- ^ Jingu Kim & Haesun Park (2012). Snelle niet-negatieve tensorfactorisatie met een actieve set-achtige methode (PDF).Hoogwaardige wetenschappelijke computing: algoritmen en toepassingen.Springer.pp. 311–326.
- ^ Kenan Yilmaz;A. Taylan Cemgil & Umut Simsekli (2011). Gegeneraliseerde gekoppelde tensorfactorisatie (PDF). NIPS.
- ^ Vamsi K. Potluru;Sergey M. Plis;Morten Morup;Vince D. Calhoun & Terran Lane (2009). Efficiënte multiplicatieve updates voor ondersteuningsvectormachines.Proceedings van de SIAM -conferentie van 2009 over datamining (SDM).pp. 1218–1229.
- ^ Wei Xu;Xin Liu & Yihong Gong (2003). Documentclustering op basis van niet-negatieve matrixfactorisatie.Proceedings van de 26e jaarlijkse internationale ACM SIGIR -conferentie over onderzoek en ontwikkeling bij het ophalen van informatie.New York: Association for Computing Machinery. pp. 267–273.
- ^ Eggert, J.;Korner, E. (2004)."Schaarse codering en NMF". 2004 IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541).Vol.4. pp. 2529–2533. doen:10.1109/ijcnn.2004.1381036. ISBN 978-0-7803-8359-3. S2CID 17923083.
- ^ Lafrenière, David;Maroid, christen;Doyon, René;Barman, Travis (2009)."HST/NICMOS -detectie van HR 8799 B in 1998". The Astrophysical Journal Letters. 694 (2): L148. arxiv:0902.3247. Bibcode:2009APJ ... 694L.148L. doen:10.1088/0004-637x/694/2/L148. S2CID 7332750.
- ^ Amara, Adam;Quanz, Sascha P. (2012)."Pynpoint: een beeldverwerkingspakket voor het vinden van exoplaneten". Maandelijkse kennisgevingen van de Royal Astronomical Society. 427 (2): 948. arxiv:1207.6637. Bibcode:2012mnras.427..948a. doen:10.1111/j.1365-2966.2012.21918.x. S2CID 119200505.
- ^ Wahhaj, Zahed;Cieza, Lucas A.;Mawet, Dimitri;Yang, bin;Canovas, Hector;De Boer, Jozua;Casassus, Simon;Ménard, François;Schreiber, Matthias R.;Liu, Michael C.;Biller, Beth A.;Nielsen, Eric L.;Hayward, Thomas L. (2015)."Verbetering van signaal-ruis in de directe beeldvorming van exoplaneten en circumstellaire schijven met Mloci". Astronomie en astrofysica. 581 (24): A24. arxiv:1502.03092. Bibcode:2015a & a ... 581a..24w. doen:10.1051/0004-6361/201525837. S2CID 20174209.
- ^ Nielsen, Finn Årup;Balslev, Daniela;Hansen, Lars Kai (2005). "Mijns van het achterste cingulate: segregatie tussen geheugen- en pijncomponenten" (PDF). Neuroimage. 27 (3): 520–522. doen:10.1016/j.neuroimage.2005.04.034. Pmid 15946864. S2CID 18509039.
- ^ Cohen, William (2005-04-04). "Enron e -maildataset". Opgehaald 2008-08-26.
- ^ Berry, Michael W.;Browne, Murray (2005)."E-mailbewaking met behulp van niet-negatieve matrixfactorisatie". Computationele en wiskundige organisatietheorie. 11 (3): 249–264. doen:10.1007/s10588-005-5380-5. S2CID 16249147.
- ^ Nielsen, Finn Årup (2008). Clustering van wetenschappelijke citaten in Wikipedia. Wikimania. arxiv:0805.1154.
- ^ Hassani, Ali;Iranmanesh, Amir;Mansouri, Najme (2019-11-12)."Tekstmining met behulp van niet -negatieve matrixfactorisatie en latente semantische analyse". arxiv:1911.04705 [Cs.lg].
- ^ Berry, Michael W.;Browne, Murray;Langville, Amy N.;Paucac, V. Paul;Plemmonsc, Robert J. (15 september 2007)."Algoritmen en toepassingen voor geschatte niet -negatieve matrixfactorisatie". Computationele statistieken en gegevensanalyse. 52 (1): 155–173. doen:10.1016/j.csda.2006.11.006.
- ^ Yun Mao;Lawrence Saul & Jonathan M. Smith (2006)."IDES: een internetafstandsschattingsservice voor grote netwerken". IEEE Journal op geselecteerde gebieden in communicatie. 24 (12): 2273–2284. Citeseerx 10.1.1.136.3837. doen:10.1109/jsac.2006.884026. S2CID 12931155.
- ^ Yang Chen;Xiao Wang;Cong Shi;et al.(2011). "Phoenix: een op gewicht gebaseerd netwerkcoördinatensysteem met behulp van matrixfactorisatie" (PDF). IEEE -transacties op netwerk- en servicebeheer. 8 (4): 334–347. Citeseerx 10.1.1.300.2851. doen:10.1109/tnsm.2011.110911.100079. S2CID 8079061. Gearchiveerd van het origineel (PDF) op 2011-11-14.
- ^ Schmidt, M.N., J. Larsen en F.T.Hsiao.(2007)."Windruisreductie met niet-negatieve schaarse codering", Machine learning voor signaalverwerking, IEEE -workshop op, 431–436
- ^ Frichot E, Mathieu F, Trouillon T, Bouchard G, Francois O (2014). "Snelle en efficiënte schatting van individuele afkomstcoëfficiënten". Genetica. 196 (4): 973–983. doen:10.1534/genetics.113.160572. PMC 3982712. Pmid 24496008.
- ^ Devarajan, K. (2008). "Niet -negatieve matrixfactorisatie: een analytisch en interpretatief hulpmiddel in computationele biologie". PLOS Computational Biology. 4 (7): E1000029. Bibcode:2008PLSCB ... 4E0029D. doen:10.1371/journal.pcbi.1000029. PMC 2447881. Pmid 18654623.
- ^ Hyunoo Kim & Haesun Park (2007). "Sparse niet-negatieve matrixfactorisaties via afwisselend niet-negativiteitsbeperkte kleinste kwadraten voor microarray-gegevensanalyse". Bio -informatica. 23 (12): 1495–1502. doen:10.1093/bioinformatica/BTM134. Pmid 17483501.
- ^ Schwalbe, E. (2013). "DNA-methyleringsprofilering van medulloblastoom maakt robuuste subclassificatie en verbeterde uitkomstvoorspelling mogelijk met behulp van formaline-gefixeerde biopten". Acta Neuropathologica. 125 (3): 359–371. doen:10.1007/S00401-012-1077-2. PMC 4313078. Pmid 23291781.
- ^ Alexandrov, Ludmil B.;Nik-Zainal, Serena;Wedge, David C.;Campbell, Peter J.;Stratton, Michael R. (2013-01-31). "Handtekeningen ontcijferen van mutatieprocessen die werken bij menselijke kanker". Celrapporten. 3 (1): 246–259. doen:10.1016/j.celrep.2012.12.008. ISSN 2211-1247. PMC 3588146. Pmid 23318258.
- ^ Stein-O’Brien, Genevieve L.;Arora, Raman;Culhane, Aedin C.;Favorov, Alexander V.;Garmire, Lana X.;Greene, Casey S.;Goff, Loyal A.;Li, Yifeng;Ngom, Aloune;Ochs, Michael F.;Xu, Yanxun (2018-10-01). "Voer de matrix in: factorisatie onthult kennis van omics". Trends in genetica. 34 (10): 790–805. doen:10.1016/j.tal.2018.07.003. ISSN 0168-9525. PMC 6309559. Pmid 30143323.
- ^ Ding;Li;Peng;Park (2006)."Orthogonale niet-negatieve matrix T-factorisaties voor clustering". Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining: 126–135. doen:10.1145/1150402.1150420. ISBN 1595933395. S2CID 165018.
- ^ Ceddia;Pinoli;Ceri;Masseroli (2020)."Matrix-factorisatie-gebaseerde techniek voor het herbestemmen van geneesmiddelen". IEEE Journal of Biomedical and Health Informatics. 24 (11): 3162–3172. doen:10.1109/jbhi.2020.2991763. Pmid 32365039. S2CID 218504587.
- ^ Pinoli;Ceddia;Ceri;Masseroli (2021)."Het voorspellen van drugssynergisme door middel van niet-negatieve matrix tri-factorisatie". IEEE/ACM -transacties op computationele biologie en bioinformatica. PP: 1. doen:10.1109/tcbb.2021.3091814. Pmid 34166199. S2CID 235634059.
- ^ Dipaola;Bazin;Aubry;Aurengo;Cavailloles;Herry;Kahn (1982)."Behandeling van dynamische sequenties in nucleaire geneeskunde". IEEE Trans Nucl Sci. 29 (4): 1310–21. Bibcode:1982itns ... 29.1310d. doen:10.1109/tns.1982.4332188. S2CID 37186516.
- ^ Sitek;Gullberg;Huesman (2002)."Correctie voor dubbelzinnige oplossingen in factoranalyse met behulp van een gestrafte minste vierkantendoelstelling". IEEE Trans Med Imaging. 21 (3): 216–25. doen:10.1109/42.996340. Pmid 11989846. S2CID 6553527.
- ^ Boutchko;Mitra;Bakker;Jagust;Gullberg (2015). "Clustering geïnitieerde factoranalyse (CIFA) -toepassing voor weefselclassificatie in dynamisch hersendier". Journal of cerebrale bloedstroom en metabolisme. 35 (7): 1104–11. doen:10.1038/jcbfm.2015.69. PMC 4640278. Pmid 25899294.
- ^ Abdalah;Boutchko;Mitra;Gullberg (2015). "Reconstructie van 4-D dynamische SPECT-afbeeldingen van inconsistente projecties met behulp van een spline-geïnitialiseerd FADS-algoritme (SIFAD's)". IEEE Trans Med Imaging. 34 (1): 216–18. doen:10.1109/tmi.2014.2352033. Pmid 25167546. S2CID 11060831.
- ^ C. Boutsidis & E. Gallopoulos (2008)."SVD -gebaseerde initialisatie: een voorsprong voor niet -negatieve matrixfactorisatie". Patroonherkenning. 41 (4): 1350–1362. Bibcode:2008Patre..41.1350B. Citeseerx 10.1.1.137.8281. doen:10.1016/j.patcog.2007.09.010.
- ^ Chao Liu;Hung-Chih Yang;Jinliang Fan;Li-Wei He & Yi-Min Wang (2010). "Gedistribueerde niet-negatieve matrixfactorisatie voor dyadische gegevensanalyse op webschaal op MapReduce" (PDF). Proceedings of the 19th International World Wide Web Conference.
- ^ Jiangtao Yin;LIXIN Gao & Zhongfei (Mark) Zhang (2014). "Schaalbare niet-negatieve matrixfactorisatie met blokgewijze updates" (PDF). Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases.
- ^ "Apache Mahout". mahout.apache.org. Opgehaald 2019-12-14.
- ^ Dong Wang;Ravichander Vipperla;Nick Evans;Thomas Fang Zheng (2013). "Online niet-negatief convolutief patroon leren voor spraaksignalen" (PDF). IEEE -transacties op signaalverwerking. 61 (1): 44–56. Bibcode:2013itsp ... 61 ... 44W. Citeseerx 10.1.1.707.7348. doen:10.1109/TSP.2012.2222381. S2CID 12530378. Gearchiveerd van het origineel (PDF) op 2015-04-19. Opgehaald 2015-04-19.
- ^ Xiangnan hij;Min-Yen Kan;Peichu Xie & Xiao Chen (2014). "Op commentaar gebaseerde multi-view clustering van Web 2.0-items" (PDF). Proceedings of the 23e International World Wide Web Conference. Gearchiveerd van het origineel (PDF) op 2015-04-02. Opgehaald 2015-03-22.
- ^ Jialu Liu;Chi Wang;Jing Gao & Jiawei Han (2013). Multi-view clustering via gezamenlijke niet-negatieve matrixfactorisatie (PDF). Proceedings of Siam Data Mining Conference.pp. 252–260. Citeseerx 10.1.1.301.1771. doen:10.1137/1.9781611972832.28. ISBN 978-1-61197-262-7.
- ^ Chistikov, Dmitry;Kiefer, Stefan;Marušić, Ines;Shirmohammadi, Mahsa;Worrell, James (2016-05-22)."Niet -negatieve matrixfactorisatie vereist irrationaliteit". arxiv:1605.06848 [CS.CC].
Anderen
- J. Shen;G. W. Israël (1989)."Een receptormodel met behulp van een specifieke niet-negatieve transformatietechniek voor Aerosol van de omgeving". Sfeervolle omgeving. 23 (10): 2289–2298. Bibcode:1989atmen..23.2289s. doen:10.1016/0004-6981 (89) 90190-X.
- Pentti Pauatero (1997)."Minste vierkantenformulering van robuuste niet-negatieve factoranalyse". Chemometrie en intelligente laboratoriumsystemen. 37 (1): 23–35. doen:10.1016/s0169-7439 (96) 00044-5.
- Raul Kompass (2007)."Een algemene divergentiemaat voor niet -negatieve matrixfactorisatie". Neurale berekening. 19 (3): 780–791. doen:10.1162/neco.2007.19.3.780. Pmid 17298233. S2CID 5337451.
- Liu, W.X.;Zheng, N.N.& U, q.b.(2006)."Niet -negatieve matrixfactorisatie en de toepassingen ervan bij patroonherkenning". Chinese wetenschapsbulletin. 51 (17–18): 7–18. Bibcode:2006chsbu..51 .... 7l. doen:10.1007/s11434-005-1109-6. S2CID 15445516.
- Ngoc-diep ho;Paul Van Dooren & Vincent Blondel (2008)."Descentiemethoden voor niet -negatieve matrixfactorisatie". arxiv:0801.3199 [Cs.na].
- Andrzej Cichocki;Rafal Zdunek & Shun-ichi Amari (2008)."Niet -negatieve matrix en tensor -factorisatie". IEEE Signal Processing Magazine. 25 (1): 142–145. Bibcode:2008ispm ... 25r.142c. doen:10.1109/msp.2008.4408452. S2CID 9997603.
- Cédric Févotte;Nancy Bertin & Jean-Louis DurrieU (2009)."Niet-negatieve matrixfactorisatie met de Itakura-Saito Divergence: met toepassing op muziekanalyse". Neurale berekening. 21 (3): 793–830. doen:10.1162/neco.2008.04-08-771. Pmid 18785855. S2CID 13208611.
- Ali Taylan Cemgil (2009). "Bayesiaanse inferentie voor niet -negatieve matrixfactorisatiemodellen". Computationele intelligentie en neurowetenschappen. 2009 (2): 1–17. doen:10.1155/2009/785152. PMC 2688815. Pmid 19536273.
- Andrzej Cichocki, Morten Mrup, et al.: "Advances in nonnegatieve matrix en tensor -factorisatie", Hindawi Publishing Corporation, ISBN978-9774540455 (2008).
- Andrzej Cichocki, Rafal Zdunek, Anh Huy Phan en Shun-ichi Amari: "Niet-negatieve matrix- en tensorfactorisaties: toepassingen voor verkennende meerdere weg gegevensanalyse en blinde bronscheiding", Wiley, ISBN978-0470746660 (2009).
- Andri Mirzal: "Niet -negatieve matrixfactorisaties voor clustering en LSI: theorie en programmering", Academische publicatie van Lap Lambert, ISBN978-3844324891 (2011).
- Yong Xiang: "Blinde bronscheiding: afhankelijke componentanalyse", Springer, ISBN978-9812872265 (2014).
- Ganesh R. Naik (ed.): "Niet-negatieve matrixfactorisatietechnieken: vooruitgang in theorie en toepassingen", Springer, ISBN978-3662517000 (2016).
- Julian Becker: "Niet -negatieve matrixfactorisatie met adaptieve elementen voor monietse audiobronscheiding: 1", Shaker Verlag GmbH, Duitsland, ISBN978-3844048148 (2016).
- Jen-Tzung Chien: "Source Separation and Machine Learning", Academic Press, ISBN978-0128177969 (2018).
- Shoji Makino (ed.): "Audio Source Separation", Springer, ISBN978-3030103033 (2019).
- Nicolas Gillis: "Nonnegative Matrix Factorization", SIAM, ISBN 978-1-611976-40-3 (2020).