J'évalue deux (2) réfrigérants (gaz) qui ont été utilisés dans le même système de réfrigération. J'ai des données de température d'aspiration saturée ( ), de température de condensation ( ) et d'ampérage ( ) pour l'évaluation. Il y a deux (2) ensembles de données; 1er réfrigérant ( ) et 2e réfrigérant ( ). J'utilise un modèle polynomial de troisième ordre linéaire et multivarié ( & ) pour les analyses de régression. Je voudrais déterminer combien d'ampérage de moins / plus (ou, une mesure similaire comme comparaison de performances) en moyenne, en pourcentage, est consommée par le deuxième réfrigérant.D Y R 1 R 2 S D
Ma première pensée a été:
- Déterminez le modèle à utiliser:
- coefficients ( ) à partir des données de référence ( ).R 1
- À l'aide de ces coefficients, pour chaque & dans l' données , calculez chaque tirage d'ampères attendu ( ) puis la moyenne.D R 2
- Comparez la moyenne avec le tirage moyen réel ( ) des données . Y2R2
Cependant, comme le 2e réfrigérant a des propriétés thermiques légèrement différentes et de petits changements ont été apportés au système de réfrigération (réglages TXV et surchauffe), je ne pense pas que cette `` méthode de comparaison de base '' soit exacte.
Ma prochaine pensée était de faire deux (2) analyses de régression distinctes:
puis, pour la température d'aspiration saturée ( ), comparer les coefficients ( vs ) comme suit: a 1 b 1 % de variation = b 1 - a 1
Cependant, encore une fois, ces coefficients doivent être pondérés différemment. Par conséquent, les résultats seraient biaisés.
Je pense que je pourrais utiliser un test z pour déterminer la pondération différente des coefficients, mais je ne suis pas sûr de bien comprendre la signification de la sortie: . Mais cela ne me donnerait toujours pas de mesure de performance, ce qui est l'objectif global.
Réponses:
D'après la loi du gaz idéal ici , , suggérant un modèle proportionnel. Assurez-vous que vos unités sont en température absolue. Demander un résultat proportionnel impliquerait un modèle d'erreur proportionnel. Considérons, peut-être , puis pour une régression linéaire multiple, on peut utiliser en prenant les logarithmes des valeurs Y, D et S, de sorte que cela ressemble alors à , où les indices signifient "logarithme de". Maintenant, cela peut mieux fonctionner que le modèle linéaire que vous utilisez et les réponses sont alors de type d'erreur relative.PV= n R T Oui= a DbSc ln( Y) = ln( a ) + b ln( D ) + c ln( S) Ouil= al+ b Dl+ c Sl l
Pour vérifier le type de modèle à utiliser, essayez-en un et vérifiez si les résidus sont homoscédastiques. Si ce n'est pas le cas, vous avez un modèle biaisé , alors faites quelque chose d'autre comme modéliser les logarithmes, comme ci-dessus, une ou plusieurs inverses de données x ou y, racines carrées, quadrature, exponentiation et ainsi de suite jusqu'à ce que les résidus soient homoscédastiques. Si le modèle ne peut pas produire de résidus homoscédastiques, utilisez plusieurs régressions linéaires de Theil, avec censure si nécessaire.
La répartition normale des données sur l'axe des y n'est pas requise, mais les valeurs aberrantes peuvent fausser les résultats des paramètres de régression de manière marquée et le font souvent. Si l'homoscédasticité ne peut pas être trouvée, les moindres carrés ordinaires ne doivent pas être utilisés et un autre type de régression doit être effectué, par exemple la régression pondérée, la régression de Theil, les moindres carrés en x, la régression de Deming, etc. De plus, les erreurs ne doivent pas être corrélées en série.
Signification de la sortie: , peut ou non être pertinent. Cela suppose que la variance totale est la somme de deux variances indépendantes. Autrement dit, l'indépendance est l'orthogonalité (perpendicularité) sur un tracé . C'est-à-dire que la variabilité totale (variance) suit alors le théorème de Pythagore, , ce qui peut ou non être le cas pour vos données. Si tel est le cas, alors la statistique est une distance relative, c'est-à-dire une différence de moyennes (une distance), divisée par Pythagore, vecteur AKA, addition de l'erreur standard (SE), qui sont des écarts-types (SD) divisés par x,yH=+ √z= ( a1- b1) / SE2une1+ SE2b1)-----------√ x , y z√H= + A2+ O2-------√ z N--√ , où les SE sont eux-mêmes des distances. La division d'une distance par l'autre les normalise ensuite, c'est-à-dire la différence de moyennes divisée par l'erreur totale (standard), qui est alors sous une forme permettant d'appliquer ND (0,1) pour trouver une probabilité.
σ T ρ A , BC2= A2+ B2- 2 A B cos( θ ) , θ = ∠ ( A , B ) σT ρA , B σ2T= σ2UNE+ σ2B- 2 σUNEσBρA , B
la source