Mon problème est le suivant: j'ai un tableau de 3 colonnes et environ 15 000 lignes de données. Je voudrais trouver une formule ou un ensemble de formules qui devrait comparer la paire des deux premières colonnes et si elle trouve une correspondance avec un écart de 3% pour afficher les valeurs de la 3ème colonne. Donc, si, disons, on trouve la paire 'A52 et B52' qui n'est pas supérieure ou inférieure à 3% d'une autre paire, disons 'A3000 et B3000', pour afficher les deux valeurs, 'C52', respectivement C3000. Étant donné que les valeurs de ces 15 000 lignes contiennent beaucoup de chiffres, je suis obligé d’utiliser ces (+ -) 3%. J'espère que c'est une solution à mon problème.
microsoft-excel
Romeo Malancu
la source
la source
Réponses:
D'après ce que je comprends, vous essayez de regarder trois colonnes de données d'entrée (Temps, température, Insolation) et de les comparer à une quatrième (Production). Vous souhaitez contrôler la température et l'insolation et déterminer si la production varie avec le temps.
Il s’agit d’un exercice statistique assez complexe, d’autant plus que la variance de la production des systèmes photovoltaïques ne varie que très lentement dans le temps - de l’ordre de 20% de perte de production sur 20 ans, lorsque la variance due aux autres variables est beaucoup plus grande et tend à pour masquer l'effet que vous recherchez.
Je pense que vous vous rendez compte que c’est une tâche difficile, car vous avez demandé à simplifier l’analyse en examinant des paires de températures et d’insolation qui sont identiques à des jours différents. Cependant, cela donnerait des centaines de paires de données différentes, chacune avec un nombre de répétitions assez faible, et une puissance individuelle si faible pour rechercher une corrélation avec le temps.
Plutôt que de diviser les données en plusieurs centaines d'analyses plus petites, je suggérerais d'analyser l'ensemble des données, mais d'essayer d'isoler la variable de temps pour voir si elle a un impact sur la production.
Comme je l’ai dit plus haut, cela nécessite des statistiques complexes, au-delà de ce que j’ai l'habitude de faire tous les jours. Mais voici une solution que vous pouvez essayer et qui peut vous dire ce dont vous avez besoin sans être statistiquement rigoureuse:
En supposant que les données d'exemple suivantes:
Nous pouvons construire un modèle qui tente de prédire la production, à partir des 3 autres variables. Une fois que nous avons trouvé le meilleur ajustement, nous pouvons vérifier si le temps était une variable importante ou non, et quel taux de diminution il a appliqué.
Dans cet exemple, je vais supposer que l'équation suivante nous donnera la production:
Ce modèle suppose que les variations dues à la température et à l'insolation varient chacune avec une relation de puissance, et que le temps peut créer une pente négative sur le résultat, D représentant un petit nombre négatif.
Marquer certaines cellules comme A, B, b, C, c, D, d. Ensuite, créez une nouvelle colonne à côté de vos données de production pour calculer les nouvelles données de production à partir de ce modèle. Entrez l'équation en vous référant aux données enregistrées et aux cellules nommées, selon le cas. Faites les références aux cellules nommées fixes en utilisant la notation $, puis faites glisser / remplir.
Pour le moment, le modèle générera des erreurs car les paramètres sont nuls. Alors intégrez l’équation dans une instruction iferror (__, 0).
Faites une autre colonne à droite appelée Error, avec la formule (Production-Model) ^ 2, et remplissez-la. Ceci est une mesure de la distance par rapport à notre modèle. Somme que les valeurs des colonnes quelque part - cela fera un grand nombre. Idéalement, ce grand nombre deviendra petit plus tard, indiquant que notre équation fonctionne et prédit la réalité.
Utilisez le solveur pour modifier toutes les variables, en minimisant la valeur de la cellule correspondant à la somme des erreurs.
À ce stade, si vous représentez graphiquement la production dans le temps, ainsi que la production modélisée dans le temps, vous obtiendrez une bonne correspondance.
Parmi les valeurs de paramètre trouvées par le solveur, regardez celles relatives au temps (D et d). Si vous tracez la partie temps du modèle (y = 1 + D * Temps ^ d) par rapport au temps, vous verrez l'impact en% que le solveur estime que le temps a sur votre production.
la source
En supposant que la spécification de votre problème soit correcte, c’est-à-dire que vous souhaitez que le résultat (valeur de la production lorsque la température soit à ± 3% du rayonnement) soit affiché dans la colonne D.
Utilisez cette formule dans la colonne D et copiez-la à la dernière ligne.
=IF(AND(B2>A2*97/100, B2<A2*103/100), C2, "")
la source