Que signifie une "solution en forme fermée"?

82

J'ai souvent rencontré le terme "solution de forme fermée". Que signifie une solution sous forme fermée? Comment détermine-t-on si une solution proche existe pour un problème donné? En recherchant en ligne, j'ai trouvé des informations, mais rien dans le cadre de l'élaboration d'un modèle / solution statistique ou probabiliste.

Je comprends très bien la régression, donc si quelqu'un peut expliquer le concept en se référant à la régression ou à l'ajustement du modèle, il sera facile à consommer. :)

arjsgh21
la source
4
Cette question semble avoir attiré les réponses de mauvaise qualité pendant un certain temps; Je pensais que cela devrait peut-être être protégé pour le moment.
Glen_b

Réponses:

37

"Une équation est dite solution de forme fermée si elle résout un problème donné en termes de fonctions et d'opérations mathématiques à partir d'un ensemble donné généralement accepté. Par exemple, une somme infinie ne serait généralement pas considérée comme une forme fermée. le choix de ce qu'il faut appeler forme fermée ou non est plutôt arbitraire, car une nouvelle fonction "forme fermée" pourrait simplement être définie en termes de somme infinie. " --Wolfram Alpha

et

"En mathématiques, une expression est dite être sous forme fermée si elle peut être exprimée de manière analytique en termes de nombre fini de certaines fonctions" bien connues ". Typiquement, ces fonctions bien connues sont définies comme étant des fonctions élémentaires - constantes, une variable x, opérations arithmétiques élémentaires (+ - × ÷), racines nièmes, exposant et logarithme (qui incluent donc également des fonctions trigonométriques et des fonctions trigonométriques inverses). On dit souvent que les problèmes sont traitables s’ils peuvent être résolus en termes d'une expression de forme fermée ". -- Wikipédia

Un exemple de solution de forme fermée en régression linéaire serait l’équation des moindres carrés

β^=(XTX)1XTy

la source
Considérant que tous les scénarios de régression peuvent être exprimés comme un problème de résolution d’un système d’équations, quand n’y aurait-il pas une solution de forme fermée? Un problème mal posé ou rare nécessitera une solution approximative, est-ce le cas dans lequel une solution sous forme fermée n'existe pas? Et si on utilisait la descente de gradient conjugué avec régularisation?
Arjsgh21
J'ai trouvé cette discussion utile - "Résolution pour les paramètres de régression en mode fermé vs descente de gradient" link
arjsgh21
@ arjsgh21 avez-vous encore besoin de clarifications sur ce que signifie être une solution sous forme fermée? Parce que votre nouvelle question semble concerner le moment où existe-t-il des solutions fermées (ou non) aux problèmes de régression, ce qui est un sujet entièrement nouveau et devrait être posé comme une nouvelle question, à mon avis.
Merci BabakP. Je pense que je comprends maintenant, en référence à la régression et aussi autrement.
arjsgh21
1
Cela m'embrouille de voir pourquoi CrossValidated est le seul "forum stackexchange" qui prend systématiquement en charge les réponses obscurcissantes mais correctes par rapport aux réponses offrant une compréhension. La meilleure réponse de la culture actuelle est celle de @ Luca et est inappréciée. Certes, il ne s'agit que d'un lien, mais d'un excellent lien facile à comprendre. Cette réponse trop érudite ne fait que résoudre le problème pour ceux qui connaissent déjà la réponse. :(
Mike Williamson
17

La plupart des procédures d'estimation impliquent de trouver des paramètres qui minimisent (ou maximisent) une fonction objective. Par exemple, avec MCO, nous minimisons la somme des résidus au carré. Avec l’estimation du maximum de vraisemblance, nous maximisons la fonction log-vraisemblance. La différence est triviale: la minimisation peut être convertie en maximisation en utilisant le négatif de la fonction objectif.

Parfois, ce problème peut être résolu algébriquement en produisant une solution de forme fermée. Avec OLS, vous résolvez le système de conditions de premier ordre et obtenez la formule familière (bien que vous ayez probablement encore besoin d’un ordinateur pour évaluer la réponse). Dans d'autres cas, cela n'est pas mathématiquement possible et vous devez rechercher des valeurs de paramètres à l'aide d'un ordinateur. Dans ce cas, l'ordinateur et l'algorithme jouent un rôle plus important. Les moindres carrés non linéaires en sont un exemple. Vous n'obtenez pas une formule explicite; tout ce que vous obtenez est une recette que vous devez mettre en œuvre sur ordinateur. La recette peut commencer par une première estimation de la nature des paramètres et de leur variation. Vous essayez ensuite différentes combinaisons de paramètres et vous voyez lequel vous donne la valeur de fonction objectif la plus basse / la plus élevée. C'est l'approche de la force brute et prend beaucoup de temps. Par exemple,105 combinaisons, et cela vous met simplement dans le voisinage de la bonne réponse si vous êtes chanceux. Cette approche s'appelle la recherche par grille.

Vous pouvez également commencer par une estimation et l'affiner dans une certaine direction jusqu'à ce que les améliorations de la fonction objectif soient inférieures à une valeur. Celles-ci sont généralement appelées méthodes de gradient (bien que d'autres n'utilisent pas le gradient pour choisir la direction dans laquelle aller, comme les algorithmes génétiques et le recuit simulé). Certains problèmes, comme celui-ci, vous garantissent de trouver rapidement la bonne réponse (fonctions objectives quadratiques). D'autres ne donnent aucune telle garantie. Vous craignez peut-être de ne pas être optimisé au niveau local, mais plutôt global, de sorte que vous essayez une série de suppositions initiales. Vous constaterez peut-être que des paramètres très différents vous donnent la même valeur que la fonction objectif, vous ne savez donc pas quel jeu choisir.

Voici un bon moyen d'obtenir l'intuition. Supposons que vous ayez un modèle de régression exponentiel simple où le seul régresseur est l'interception:

E[y]=exp{α}

La fonction objectif est

QN(α)=12NiN(yiexp{α})2

Avec ce problème simple, les deux approches sont réalisables. La solution sous forme fermée que vous obtenez en prenant le dérivé est . Vous pouvez également vérifier que tout ce qui vous donne une valeur plus élevée de la fonction objectif en branchant plutôt . Si vous aviez des régresseurs, la solution analytique disparaît.α=lny¯ln(y¯+k)

Dimitriy V. Masterov
la source
Avez-vous assimilé implicitement «analytique» à «forme fermée» dans la dernière phrase?
whuber
2
Je pensais alors aussi: mathworld.wolfram.com/Analytic.html
Dimitriy V. Masterov
Avez-vous vu les commentaires d'homonymie à la fin de cette page de MathWorld? Le problème est que, dans le contexte actuel, le terme "analytique" peut raisonnablement être compris de plusieurs manières différentes. En outre, "analytique" et "analytique" ne signifient pas exactement la même chose (tout comme "historique" et "historique" ont des significations différentes).
whuber
Je ne suis pas au courant qu'il existe une différence entre "solution analytique", "solution analytique" et "forme fermée". MathWorld n'a pas d'entrée séparée pour l'analyse et définit une solution analytique comme un problème pouvant être écrit "sous forme fermée" en termes de fonctions connues, de constantes, etc. MW dit que analytique et analytique sont des variantes . La distinction entre historique et historique est valable, mais je ne comprends pas ce que cela a à voir avec ce cas. Si je me trompe, corrigez-moi s'il vous plaît.
Dimitriy V. Masterov
2
Dans de nombreux contextes mathématiques, "analytique" est un terme technique précis qui s'applique à toute fonction pouvant être exprimée localement en tant que série de puissances à rayon de convergence positif, alors que le terme "analytique" est beaucoup plus largement lié à la décomposabilité en parties fondamentales. Comme l'indiquent les citations de BabakP, la "forme fermée" acquiert une signification uniquement dans le contexte des procédures généralement acceptées pour combiner des valeurs (généralement supposées consister en des fonctions élémentaires mais non transcendantales).
whuber
13

Je pense que ce site Web fournit une intuition simple, dont un extrait est:

Une solution sous forme fermée (ou expression sous forme fermée) est une formule qui peut être évaluée dans un nombre fini d'opérations standard. ... Une solution numérique est toute approximation pouvant être évaluée dans un nombre fini d'opérations standard. Les solutions sous forme fermée et les solutions numériques sont similaires en ce sens qu’elles peuvent toutes deux être évaluées avec un nombre fini d’opérations standard. Ils diffèrent en ce qu'une solution de forme fermée est exacte alors qu'une solution numérique n'est qu'approximative.

Luca Bertinetto
la source
2
Bien que ne fournissant qu'un lien, c'est certainement la réponse la plus utile.
Mike Williamson
2
L'inclusion par Wayne d'une citation du lien a nettement amélioré la réponse.
Glen_b
2
De plus, le lien de Luca est maintenant mort.
Naramsim
-2

Vous recherchez des termes profanes ou le verbiage douloureux qui en définit rigoureusement le sens? Je présume que les termes profanes sont les mêmes, l’autre pouvant être trouvé partout. Supposons que vous vouliez la solution sous forme fermée de la racine carrée de 8. La solution sous forme fermée est 2 * (2) ^ 1/2 ou deux fois la racine carrée de deux. Ceci contraste avec la solution de formulaire non fermé 2.8284. (Voir wikipedia racine carrée de 2 pour voir qu'à 69 décimales, elle est précise au 1/10 000 près.) L'une est absolument définie en termes mathématiques alors que l'autre ne l'est pas. Une solution de formulaire fermé fournit une réponse exacte et une autre qui n'est pas un formulaire fermé est une approximation, mais vous pouvez obtenir une solution de formulaire non fermée aussi proche que vous le souhaitez. Cela semble contre-intuitif, mais si vous avez besoin de plus de précision, il vous suffit de faire un peu plus de calculs.

Cheesepipe
la source
3
Ceci est une utilisation inhabituelle du terme "forme fermée". Pourriez-vous fournir une référence?
whuber
1
Je ne suis pas sûr de pouvoir fournir suffisamment de documentation à l'appui pour gagner un débat à ce sujet sans plus de travail que ce que je suis disposé à proposer, mais voilà. Regardez sur Wikipedia pour l'expression sous forme fermée. Dans les deux dernières sections, il décrit comment les solutions de formulaire fermé ne sont pas nécessairement nécessaires car le calcul numérique peut généralement être utilisé avec succès pour trouver une solution, et la section suivante décrit comment certains programmes mathématiques tentent de générer des solutions de formulaire fermé à partir de valeurs numériques. Les solutions de forme fermée sont précises (hors de l'espace)
Cheesepipe
5
Wikipedia est très bien comme référence. Dans ce cas, il semble que vous ayez peut-être confondu "expression de formulaire fermé" avec "numéro de formulaire fermé". Ils ne signifient pas les mêmes choses.
whuber
-2

Forme fermée = forme fermée (fonctionnelle)

Fermé signifie que plus rien ne peut aller à l'intérieur; c'est-à-dire qu'il n'y a pas d'alternative => une seule solution => une seule fonction permettant d'établir la relation entre le résultat et les prédicteurs.

Vivek Astvansh
la source
3
C'est aussi une utilisation inhabituelle du terme. Pourriez-vous donner quelques exemples d'utilisation dans ce contexte? Je suis surtout surpris car on entend souvent une forme fermée / aucune forme fermée concernant les intégrales, qui n'ont pas vraiment de résultat ou de prédicteurs.
Matt Krause