Supposons que nous ayons deux points (la figure suivante: cercles noirs) et que nous voulons trouver une valeur pour un troisième point entre eux (croix). Nous allons en effet l'estimer sur la base de nos résultats expérimentaux, les points noirs. Le cas le plus simple consiste à tracer une ligne, puis à trouver la valeur (c'est-à-dire l'interpolation linéaire). Si nous avions des points d'appui, par exemple, en tant que points bruns des deux côtés, nous préférons en tirer parti et ajuster une courbe non linéaire (courbe verte).
La question est: quel est le raisonnement statistique pour marquer la croix rouge comme la solution? Pourquoi les autres croix (par exemple les jaunes) ne sont-elles pas des réponses là où elles pourraient être? Quel genre d'inférence ou (?) Nous pousse à accepter la rouge?
Je développerai ma question d'origine sur la base des réponses obtenues pour cette question très simple.
la source
Réponses:
Toute forme d'ajustement de fonction, même non paramétrique (qui fait généralement des hypothèses sur le lissage de la courbe impliquée), implique des hypothèses, et donc un acte de foi.
L'ancienne solution d'interpolation linéaire est celle qui `` fonctionne juste '' lorsque les données que vous avez sont suffisamment `` fines '' (si vous regardez un cercle assez près, il semble également plat - il suffit de demander à Columbus), et était réalisable même avant l'ère informatique (ce qui n'est pas le cas pour de nombreuses solutions de splines modernes). Il est logique de supposer que la fonction «continuera dans la même matière (c'est-à-dire linéaire)» entre les deux points, mais il n'y a pas raison a priori à cela (sauf connaissance des concepts en question).
Il devient rapidement clair lorsque vous avez trois (ou plus) points non colinéaires (comme lorsque vous ajoutez les points bruns ci-dessus), que l'interpolation linéaire entre chacun d'eux impliquera bientôt des angles vifs dans chacun de ceux-ci, ce qui est généralement indésirable. C'est là que les autres options interviennent.
Cependant, sans autre connaissance du domaine, il n'y a aucun moyen d'affirmer avec certitude qu'une solution est meilleure que l'autre (pour cela, vous devez savoir quelle est la valeur des autres points, ce qui va à l'encontre de l'objectif d'adapter la fonction dans le première place).
Du côté positif, et peut-être plus pertinent pour votre question, dans les `` conditions de régularité '' (lire: hypothèses : si nous savons que la fonction est par exemple lisse), l'interpolation linéaire et les autres solutions populaires peuvent se révéler `` raisonnables '' approximations. Pourtant: cela nécessite des hypothèses, et pour celles-ci, nous n'avons généralement pas de statistiques.
la source
Vous pouvez calculer l'équation linéaire pour la ligne de meilleur ajustement (par exemple, y = 0,45554x + 0,7525), mais cela ne fonctionnerait que s'il y avait un axe étiqueté. Cependant, cela ne vous donnerait pas la réponse exacte uniquement la mieux adaptée par rapport aux autres points.
la source