Analyse des données ou ordination ?
English text below
L’analyse des tableaux de relevés est dominée depuis des décennies par le concept d’ordination, associé à un ensemble d’analyses multivariées. Ce concept est-il réellement adapté à ce type d’analyse et à la nature des données ? Une approche plus statistique, comme l’analyse des données, pourrait-elle apporter de nouvelles ouvertures ? La nature des données, aussi bien que leur possible transformation, est prise en compte en premier lieu avant toute analyse. Plusieurs méthodes d’analyse multivariée sont appliquées à un tableau de relevés, en abordant de manière approfondie chaque étape de l’algorithme, de manière à mieux comprendre comment elles fonctionnent, c’est-à-dire le calcul de la table transformée (pour PCA et CA), d’une matrice de covariance ou de similitude – dissimilitude, de valeurs propres et de coordonnées des colonnes ou lignes. Des analyses multivariées sont maintenant mises en évidence : l’analyse non symétrique des correspondances, l’analyse d’un tableau disjonctif et l’analyse factorielle multiple. Un test associé aux valeurs propres est aussi introduit. Un ensemble de 80 relevés floristiques de la savane du parc de l’Akagera est pris comme exemple. Premièrement, la distribution des coefficients de la matrice de covariance ou de distance est examinée. Seule, une distribution suffisamment étalée est à même de produire une analyse multivariée utilisable. L’analyse du tableau originel avec plusieurs types de variables produit de pauvres résultats. Plusieurs transformations de variables sont testées et comparées : tableau ordinal, disjonctif simple. Seuls, les tableaux disjonctifs simples, associés à une analyse non symétrique des correspondances produisent des résultats utiles. Le nombre d’axes statistiquement significatifs et le caractère significatif des contributions relatives offrent des informations utiles pour les étapes ultérieures. L’analyse factorielle multiple est recommandée pour les végétations pluristratales. Le concept d’analyse des données est bien adapté à ce type de tableau de relevés et conduit à une interprétation approfondie de la végétation. La structure de la matrice de covariance ou de distance est un nouvel outil pour évaluer les performances d’une analyse multivariée et le test de permutations, basé sur les valeurs propres et les contributions relatives des lignes et colonnes donne une dimension inférentielle à l’analyse.
Pour le texte complet : Ch5 (5.28 Mo)
The analysis of relevé tables has been dominated for decades by the concept of ordination, combined with a set of multivariate analyses. Is this concept really appropriate for this type of analysis and the nature of the data ? Could a more statistical approach, such as data analysis, bring new possibilities? The nature of the data, as well as their possible transformation, is taken into account in the first place before any analysis. Several methods of multivariate analysis are applied to a relevé table, thoroughly examining each step of the algorithm, in order to better understand how they work, that is to say the calculation of the transformed table (for PCA and CA), a matrix of covariance or similarity - dissimilarity, eigenvalues and coordinates of columns or rows. Multivariate analyses are now highlighted: non-symmetric correspondence analysis, the analysis of a disjunctive table and multiple factor analysis. A test associated with the eigenvalues is also introduced. A set of 80 savannah relevés from the Akagera Park is taken as an example. First, the distribution of the covariance matrix coefficients is examined. Only an enough spread out distribution is able to produce a usable multivariate analysis. The analysis of the original table with several types of variables produces poor results. Several transformations of variables are tested and compared: ordinal table or simple disjunctive one. Only disjunctive tables associated with a non-symmetric correspondence analysis produce usable results. The number of statistically significant axes and the significant nature of the relative contributions provide useful information for subsequent steps. Multiple factor analysis is recommended for pluristratal vegetation. The concept of data analysis is well suited to this type of relevé table and leads to a thorough interpretation of the vegetation. The structure of the covariance or distance matrix is a new tool to evaluate the performance of a multivariate analysis and the permutation test, based on the eigenvalues and the relative contributions of the rows and columns gives an inferential dimension to the analysis
For the complete text : Ch5a (5.57 Mo)
Date de dernière mise à jour : 10/04/2024
Ajouter un commentaire