Je n'arrive pas à trouver une réponse définitive à ma question.
Mes données se composent de plusieurs graphiques avec des moyennes mesurées variant de 0,27 à 0,57. Dans mon cas, toutes les valeurs de données sont positives, mais la mesure elle-même est basée sur un rapport de valeurs de réflectance pouvant aller de -1 à +1. Les graphiques représentent les valeurs du NDVI , un indicateur dérivé à distance de la "productivité" de la végétation.
Mon intention était de comparer la variabilité des valeurs sur chaque parcelle, mais comme chaque parcelle a une moyenne différente, j'ai opté pour l'utilisation du CV pour mesurer la dispersion relative des valeurs NDVI par parcelle.
D'après ce que je comprends, prendre le CV de ces parcelles n'est pas casher car chaque parcelle peut avoir des valeurs positives et négatives. Pourquoi n'est-il pas approprié d'utiliser le CV dans de tels cas? Quelles seraient des alternatives viables (c.-à-d. Test similaire de dispersion relative, transformations de données, etc.)?
la source
Réponses:
Réfléchissez à ce qu'est le CV: rapport de l'écart-type à la moyenne. Mais si la variable peut avoir des valeurs positives et négatives, la moyenne pourrait être très proche de 0; ainsi, CV ne fait plus ce qu'il est censé faire: c'est-à-dire donner une idée de la taille du sd par rapport à la moyenne.
EDIT: Dans un commentaire, j'ai dit que si vous pouviez raisonnablement ajouter une constante à la variable, le CV n'était pas bon. Voici un exemple:
x2 est simplement x + 10. Je pense qu'il est intuitivement clair qu'ils sont également variables; mais CV est différent.
Un exemple réel de cela serait si x était la température en degrés C et x2 était la température en degrés K (bien que l'on puisse affirmer que K est la bonne échelle, car il a un 0 défini).
la source
Je les considère comme différents modèles de variation. Il existe des modèles statistiques où le CV est constant. Lorsque ceux-ci travaillent, on peut signaler un CV. Il existe des modèles où l'écart-type est une fonction de puissance de la moyenne. Il existe des modèles où l'écart-type est constant. En règle générale, un modèle à CV constant est une meilleure estimation initiale qu'un modèle SD constant, pour les variables d'échelle de rapport. Vous pouvez spéculer sur la raison pour laquelle cela serait vrai, peut-être basé sur la prévalence des interactions multiplicatives plutôt qu'additives.
La modélisation à CV constant est souvent associée à la transformation logarithmique. (Une exception importante est une réponse non négative qui est parfois nulle.) Il y a deux façons de voir les choses. Premièrement, si le CV est constant, les logs sont la transformation conventionnelle stabilisatrice de variance. Alternativement, si votre modèle d'erreur est lognormal avec une constante SD dans l'échelle logarithmique, le CV est une simple transformation de cette SD. CV est à peu près égal à SD à l'échelle logarithmique lorsque les deux sont petits.
Deux méthodes d'application des méthodes de statistiques 101, comme un écart-type, sont les données telles que vous les avez obtenues ou (surtout s'il s'agit d'une échelle de rapport) dans leurs journaux. Vous faites la meilleure estimation possible en sachant que la nature pourrait être un peu plus compliquée et qu'une étude plus approfondie pourrait être nécessaire. Tenez compte de ce que les gens ont précédemment trouvé productif avec votre type de données.
Voici un cas où ce truc est important. Les concentrations chimiques sont parfois résumées avec CV ou modélisées sur une échelle logarithmique. Cependant, le pH est une concentration logarithmique.
la source