Degelde correspondentieanalyse

Detrended Correspondentie Analyse (DCA) is een multivariate statistisch techniek veel gebruikt door ecologen Om de belangrijkste factoren of gradiënten te vinden in grote, soortenrijke maar meestal schaarse gegevensmatrices die typeren ecologische gemeenschap gegevens.DCA wordt vaak gebruikt om artefacten te onderdrukken die inherent zijn aan de meeste andere multivariate analyses Wanneer toegepast op gradiënt gegevens.[1]

Geschiedenis

DCA werd in 1979 gemaakt door Mark Hill van de Verenigde Koninkrijken Instituut voor terrestrische ecologie (nu samengevoegd tot Centrum voor ecologie en hydrologie) en geïmplementeerd in Fortran codepakket genaamd Decorana (Detrended Correspondentie -analyse), een Correspondentieanalyse methode.DCA wordt soms ten onrechte Decorana genoemd;DCA is echter het onderliggende algoritme, terwijl Decorana een tool is die het implementeert.

Problemen aangepakt

Volgens Hill en Gauch,[2] DCA onderdrukt twee artefacten die inherent zijn aan de meeste andere multivariate analyses wanneer toegepast op gradiënt gegevens.Een voorbeeld is een tijdreeks van plantensoorten die een nieuwe habitat koloniseren;vroeg opeenvolgende soorten worden vervangen door middelgrote soorten, vervolgens door late opeenvolgende soorten (zie voorbeeld hieronder).Wanneer dergelijke gegevens worden geanalyseerd door een standaard bevalling zoals een correspondentieanalyse:

  • De wijdingscores van de monsters zullen het 'randeffect' vertonen, d.w.z. de variantie van de scores aan het begin en het einde van een regelmatige opeenvolging van soorten zal aanzienlijk kleiner zijn dan die in het midden,
  • Wanneer gepresenteerd als een grafiek worden de punten gezien om een hoefijzer Gevormde curve in plaats van een rechte lijn ('Arch Effect'), hoewel het proces dat onder analyse is een gestage en continue verandering is die menselijke intuïtie liever zou zien als een lineaire trend.

Externe ecologie treden dezelfde artefacten op wanneer gradiëntgegevens worden geanalyseerd (bijv. Bodemeigenschappen langs een transect die tussen 2 verschillende geologieën loopt, of gedragsgegevens gedurende de levensduur van een individu) omdat de gebogen projectie een nauwkeurige weergave is van de vorm van de gegevens inmultivariate ruimte.

Ter Braak en Prentice (1987, p. 121) citeren een simulatie Studie analyseren van tweedimensionale soortenverpakkingsmodellen resulterend in een betere prestaties van DCA in vergelijking met CA.

Methode

DCA is een iteratief algoritme Dat is aangetoond dat het een zeer betrouwbaar en nuttig hulpmiddel is voor gegevensverkenning en samenvatting in gemeenschapsecologie (Shaw 2003).Het begint met het uitvoeren van een standaard wijding (CA of wederzijds gemiddelde) op de gegevens, om de initiële paardenschoencurve te produceren waarin de 1e ordinatieas in de 2e as vervormt.Vervolgens verdeelt het de eerste as in segmenten (standaard = 26) en herschikt elk segment als een gemiddelde waarde van nul op de 2e as - dit sompeert effectief de kromme plat.Het herschaalt ook de as zodat de uiteinden niet langer worden gecomprimeerd ten opzichte van het midden, zodat 1 DCA -eenheid benadert tot dezelfde omzet tot en met de gegevens: de vuistregel is dat 4 DCA -eenheden betekenen dat er is dat er iswas een totale omzet in de gemeenschap.Ter Braak en Prentice (1987, p. 122) waarschuwen tegen de niet-lineaire herschikking van de assen vanwege robuustheidsproblemen en bevelen aan om alleen detRending-by-polynomen te gebruiken.

Nadelen

Nee Significance Tests zijn beschikbaar met DCA, hoewel er een beperkte (canonieke) versie is genaamd DCCA waarin de assen worden gedwongen door Meerdere lineaire regressie optimaal correleren met een lineaire combinatie van andere (meestal milieu) variabelen;Dit maakt het mogelijk om een nulmodel te testen door Monte-Carlo permutatie analyse.

Voorbeeld

Het voorbeeld toont een ideale gegevensset: de soortgegevens bevinden zich in rijen, monsters in kolommen.Voor elk monster langs de gradiënt wordt een nieuwe soort geïntroduceerd, maar een andere soort is niet langer aanwezig.Het resultaat is een schaarse matrix.Degenen geven de aanwezigheid van een soort in een monster aan.Behalve aan de randen bevat elk monster vijf soorten.

Vergelijking van correspondentieanalyse en afgesproken correspondentieanalyse op voorbeeld (ideale) gegevens.Zie het boogeffect in CA en zijn oplossing in DCA.
Ideale wijdingsgegevens
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
SP1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP2 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP3 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP4 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SP5 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0
SP6 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0
SP7 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0
SP8 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
SP9 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0
SP10 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0
SP11 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0
SP12 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0
SP13 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0
SP14 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0
SP15 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0
SP16 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0
SP17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0
SP18 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1
SP19 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1
SP20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1

De plot van de eerste twee assen van het resultaat van de correspondentieanalyse aan de rechterkant toont duidelijk de nadelen van deze procedure: het randeffect, d.w.z. de punten zijn geclusterd aan de randen van de eerste as en het boogeffect.

Software

Een open source implementatie van DCA, gebaseerd op de originele Fortran -code, is beschikbaar[3] in de veganistische R-package.

Zie ook

Referenties

  1. ^ Hill en Gauch (1980)
  2. ^ Hill en Gauch (1980)
  3. ^ Oksanen, Jari;Simpson, Gavin L.;Blanchet, F. Guillaume;Kindt, Roelland;Legendre, Pierre;Minchin, Peter R.;O'Hara, R. B.;Solymos, Peter;Stevens, M. Henry H. (2022-04-17), Vegan: Community Ecology -pakket, opgehaald 2022-07-20
  • Hill, M.O.(1979). Decorana - Een Fortran -programma voor detreed correspondentieanalyse en wederzijds gemiddelde.Sectie van Ecology and Systematics, Cornell University, Ithaca, New York, 52pp.
  • Hill, M.O.en Gauch, H.G. (1980).Detrended Correspondentie -analyse: een verbeterde ordinatietechniek. Vegeterij 42, 47–58.
  • Oksanen J en Minchin PR (1997).Instabiliteit van wijdingsresultaten onder wijzigingen in invoergegevensvolgorde: uitleg en remedies. Journal of Vegetation Science 8, 447–454
  • Shaw PJA (2003). Multivariate statistieken voor de milieuwetenschappen.Londen: Hodder Arnold
  • Ter Braak, C.J.F.en Prentice, I.C.(1988).Een theorie van gradiëntanalyse. Vooruitgang in ecologisch onderzoek 18, 271–371. ISBN0-12-013918-9.Herdrukt in: Ter Braak, C.J.F.(1987). Unimodale modellen om soorten te relateren aan het milieu.Wageningen: PhD -scriptie Agricultural Mathematics Group, 101–146.

Externe links

  • Verleden (paleontologische statistieken)) - Gratis software inclusief DCA met aanpassingen volgens Oksanen en Minchin (1997)
  • Winbasp -Gratis software inclusief DCA met detrening-per-polynomen volgens ter Braak en Prentice (1988)
  • Vegan: Community Ecology -pakket voor R - Gratis software inclusief de functie Decorana: Detrended Correspondentie -analyse en basis wederzijds gemiddelde van Hill en Gauch (1980)