Excell, comparez les options de deux colonnes et affichez le résultat de la 3ème

0

Mon problème est le suivant: j'ai un tableau de 3 colonnes et environ 15 000 lignes de données. Je voudrais trouver une formule ou un ensemble de formules qui devrait comparer la paire des deux premières colonnes et si elle trouve une correspondance avec un écart de 3% pour afficher les valeurs de la 3ème colonne. Donc, si, disons, on trouve la paire 'A52 et B52' qui n'est pas supérieure ou inférieure à 3% d'une autre paire, disons 'A3000 et B3000', pour afficher les deux valeurs, 'C52', respectivement C3000. Étant donné que les valeurs de ces 15 000 lignes contiennent beaucoup de chiffres, je suis obligé d’utiliser ces (+ -) 3%. J'espère que c'est une solution à mon problème.

Romeo Malancu
la source
essayez-vous de savoir si A52 et B52 sont proches de 3% l'un de l'autre? Quel est le lien entre A3000 et B3000 et A52 et B52? Pouvez-vous donner un exemple en utilisant peut-être 5 à 10 lignes de données, en utilisant la balise <code> </ code>, pour montrer les résultats que vous attendez dans la colonne 3?
Sir Adelaide
Ce que je veux faire, c’est: comparer le couple formé par la colonne A et la colonne B (A1, B1) par rapport à (A2, B2), (A3, B3), (A4, B4) ..... (A3000, B3000) et ainsi de suite. Il doit trouver si toute paire formée de colonnes A et B correspond dans les 3% (A1- + 3%, B1- + 3%), ...... (A10- + 3%, B10- + 3 %), ...... (A1000- + 3%, B1000- + 3%), ....., (A3000- + 3%, B3000- + 3%) pour me montrer les paires qui correspondent. Pour mieux comprendre, je vais vous dire ce que j'essaie de faire: j'ai une centrale photovoltaïque sous surveillance pour la 3ème année maintenant.
Romeo Malancu
Je peux acquérir des données de cette plante, les données sont les suivantes: température, rayonnement et production. Donc, pour chaque heure de la journée, je reçois un ensemble de 3 données: température, rayonnement et production. Je voudrais comparer le rayonnement et la température (entre - / + 3%) pour voir ce que la production était. De cette façon, je peux dire si, avec le temps, la production a diminué pour la même condition donnée (température et rayonnement). J'espère que c'est plus clair ce que j'essaie de faire.
Romeo Malancu

Réponses:

1

D'après ce que je comprends, vous essayez de regarder trois colonnes de données d'entrée (Temps, température, Insolation) et de les comparer à une quatrième (Production). Vous souhaitez contrôler la température et l'insolation et déterminer si la production varie avec le temps.

Il s’agit d’un exercice statistique assez complexe, d’autant plus que la variance de la production des systèmes photovoltaïques ne varie que très lentement dans le temps - de l’ordre de 20% de perte de production sur 20 ans, lorsque la variance due aux autres variables est beaucoup plus grande et tend à pour masquer l'effet que vous recherchez.

Je pense que vous vous rendez compte que c’est une tâche difficile, car vous avez demandé à simplifier l’analyse en examinant des paires de températures et d’insolation qui sont identiques à des jours différents. Cependant, cela donnerait des centaines de paires de données différentes, chacune avec un nombre de répétitions assez faible, et une puissance individuelle si faible pour rechercher une corrélation avec le temps.

Plutôt que de diviser les données en plusieurs centaines d'analyses plus petites, je suggérerais d'analyser l'ensemble des données, mais d'essayer d'isoler la variable de temps pour voir si elle a un impact sur la production.

Comme je l’ai dit plus haut, cela nécessite des statistiques complexes, au-delà de ce que j’ai l'habitude de faire tous les jours. Mais voici une solution que vous pouvez essayer et qui peut vous dire ce dont vous avez besoin sans être statistiquement rigoureuse:

En supposant que les données d'exemple suivantes:

Time       Temp      Rad    Production
hours        *C     W/m2    W
      1      18      20    3194
      2      20      30    3984
      3      20      40    3976
      4      16      20    3174
      5      14       0       0
      6      10       0       0
      7       8       0       0
      8      10       0       0
      9      14      10    1964
     10      16      20    3136
     11      17      30    3888
     12      18      40    3856
     13      15      30    3824
     14      13      20    3034
     15       5       0       0
     16       8       0       0
     17      12       8    1478
     18      25      15    2263
     19      30      25    2942
     20      30      35    3240
     21      25      20    2712
     22      20      10    1768
     23      22       0       0
     24      18       0       0
     25      22       0       0
     26      25      10    1619
     27      26      20    2539
     28      18      24    2943
     29      12      26    3047
     30      10      18    2427

Nous pouvons construire un modèle qui tente de prédire la production, à partir des 3 autres variables. Une fois que nous avons trouvé le meilleur ajustement, nous pouvons vérifier si le temps était une variable importante ou non, et quel taux de diminution il a appliqué.

Dans cet exemple, je vais supposer que l'équation suivante nous donnera la production:

 Production = A*(B*Temp^b)*(C*Rad^c)*(1+D*Time^d)

Ce modèle suppose que les variations dues à la température et à l'insolation varient chacune avec une relation de puissance, et que le temps peut créer une pente négative sur le résultat, D représentant un petit nombre négatif.

Marquer certaines cellules comme A, B, b, C, c, D, d. Ensuite, créez une nouvelle colonne à côté de vos données de production pour calculer les nouvelles données de production à partir de ce modèle. Entrez l'équation en vous référant aux données enregistrées et aux cellules nommées, selon le cas. Faites les références aux cellules nommées fixes en utilisant la notation $, puis faites glisser / remplir.

Pour le moment, le modèle générera des erreurs car les paramètres sont nuls. Alors intégrez l’équation dans une instruction iferror (__, 0).

Faites une autre colonne à droite appelée Error, avec la formule (Production-Model) ^ 2, et remplissez-la. Ceci est une mesure de la distance par rapport à notre modèle. Somme que les valeurs des colonnes quelque part - cela fera un grand nombre. Idéalement, ce grand nombre deviendra petit plus tard, indiquant que notre équation fonctionne et prédit la réalité.

Utilisez le solveur pour modifier toutes les variables, en minimisant la valeur de la cellule correspondant à la somme des erreurs.

À ce stade, si vous représentez graphiquement la production dans le temps, ainsi que la production modélisée dans le temps, vous obtiendrez une bonne correspondance. entrez la description de l'image ici

Parmi les valeurs de paramètre trouvées par le solveur, regardez celles relatives au temps (D et d). Si vous tracez la partie temps du modèle (y = 1 + D * Temps ^ d) par rapport au temps, vous verrez l'impact en% que le solveur estime que le temps a sur votre production.

Sir Adelaide
la source
Merci pour votre réponse, je vais essayer de comprendre ce que vous m'avez dit et ensuite le mettre au travail. Espérons que cela me donnera un début.
Romeo Malancu
0

En supposant que la spécification de votre problème soit correcte, c’est-à-dire que vous souhaitez que le résultat (valeur de la production lorsque la température soit à ± 3% du rayonnement) soit affiché dans la colonne D.

Utilisez cette formule dans la colonne D et copiez-la à la dernière ligne.

=IF(AND(B2>A2*97/100, B2<A2*103/100), C2, "")

mcalex
la source
Merci pour votre réponse. Voici ce que j'essaie d'accomplir: en un jour, à un moment de la journée, j'ai les conditions suivantes: rayonnement 100, température + 10 ° C et production 500. Un autre jour: rayonnement 103, température + 9,55 ° C et production 600. Je veux que la formule compare le couple de rayonnement (100 et 103) puis passe à côté de la température (+ 10C et + 9,55C) et trouve ces 2 conditions réunies pour afficher les résultats de production: 500, respectivement 600 .
romeo malancu