Chapitre 6 - Analyse des données contre ordination - Chapter 6 - Data analysis versus ordination

 

English text below

L’analyse des tableaux de relevés est dominée depuis des décennies par le concept d’ordination, associé à un ensemble d’analyses multivariées. Ce concept est-il réellement adapté à ce type d’analyse et à la nature des données ? Une approche plus statistique, comme l’analyse des données, pourrait-elle apporter de nouvelles ouvertures ? La nature des données, aussi bien que leur possible transformation, est prise en compte en premier lieu avant toute analyse. Plusieurs méthodes d’analyse multivariée sont appliquées à un tableau de relevés, en abordant de manière approfondie chaque étape de l’algorithme, de manière à mieux comprendre comment elles fonctionnent, c’est-à-dire le calcul de la table transformée (pour PCA et CA), d’une matrice de covariance ou de similitude – dissimilitude, de valeurs propres et de coordonnées des colonnes ou lignes. Des analyses multivariées sont maintenant mises en évidence : l’analyse des correspondances non symétriques, l’analyse d’un tableau disjonctif complet et l’analyse factorielle multiple. Un test associé aux valeurs propres est aussi introduit. Un ensemble de 80 relevés floristiques de la savane du parc de l’Akagera est pris comme exemple. Premièrement, la distribution des coefficients de la matrice de covariance ou de distance est examinée. Seule, une distribution gaussienne ou faiblement dissymétrique est à même de produire une analysemultivariée utilisable. L’analyse du tableau originel avec plusieurs types de variables produit de pauvres résultats. Plusieurs transformations de variables sont testées et comparées : tableau ordinal, disjonctif simple ou disjonctif complet. Seuls, les tableaux disjonctifs simples ou disjonctifs complets, associés à une analyse non symétrique des correspondances produisent des résultats utilisables. Le nombre d’axes statistiquement significatifs et le caractère significatif des contributions relatives offrent des informations utiles pour les étapes ultérieures. L’analyse factorielle multiple est recommandée pour les végétations pluristratales. Le concept d’analyse des données est bien adapté à ce type de tableau de relevés et conduit à une interprétation approfondie de la végétation. La structure de la matrice de covariance ou de distance est un nouvel outil pour évaluer les performances d’une analyse multivariée et le test de permutations, basé sur les valeurs propres et les contributions relatives des lignes et colonnes donne une dimension inférentielle à l’analyse.

 Pour le texte complet : ch6anversusordf

 

The analysis of relevé tables has been dominated for decades by the concept of ordination, combined with a set of multivariate analyses. Is this concept really appropriate for this type of analysis and the nature of the data? Could a more statistical approach, such as data analysis, bring new possibilities? The nature of the data, as well as their possible transformation, is taken into account in the first place before any analysis. Several methods of multivariate analysis are applied to a relevé table, thoroughly examining each step of the algorithm, in order to better understand how they work, that is to say the calculation of the transformed table (for PCA and CA), a matrix of covariance or similarity - dissimilarity, eigenvalues ​​and coordinates of columns or rows. Multivariate analyses are now highlighted: the non-symmetrical correspondence analysis, the analysis of a complete disjunctive table and the multiple factor analysis. A test associated with the eigenvalues ​​is also introduced. A set of 80 savannah relevés from the Akagera Park is taken as an example. First, the distribution of the covariance matrix coefficients is examined. Only a Gaussian or weakly asymmetric distribution is able to produce a usable multivariate analysis. The analysis of the original table with several types of variables produces poor results. Several transformations of variables are tested and compared: ordinal table, simple disjunctive or complete disjunctive. Only complete disjunctive or disjunctive tables associated with a non-symmetrical analysis of the correspondences produce usable results. The number of statistically significant axes and the significant nature of the relative contributions provide useful information for subsequent steps. Multiple factor analysis is recommended for pluristratal vegetation. The concept of data analysis is well suited to this type of relevé table and leads to a thorough interpretation of the vegetation. The structure of the covariance or distance matrix is ​​a new tool to evaluate the performance of a multivariate analysis and the permutation test, based on the eigenvalues ​​and the relative contributions of the rows and columns gives an inferential dimension to the analysis

For the complete text: ch6anversusorde

Ajouter un commentaire

 

Date de dernière mise à jour : 28/04/2017

×