Principaux avantages des modèles de processus gaussiens

Le processus gaussien a été largement utilisé, notamment en émulation. On sait que la demande de calcul est élevée ( ). $0(n^3)$

Qu'est-ce qui les rend populaires?
Quels sont leurs principaux avantages cachés?
Pourquoi sont-ils utilisés à la place des modèles paramétriques (par modèle paramétrique, je veux dire une régression linéaire typique dans laquelle différentes formes paramétriques peuvent être utilisées pour décrire la tendance entrée vs sortie; par exemple, qaudratique)?

J'apprécierais vraiment une réponse technique expliquant les propriétés inhérentes qui rendent le processus gaussien unique et avantageux

gaussian-process Wis
la source

Pouvez-vous préciser ce que vous entendez par modèles paramétriques?

Alexey Zaytsev

@Alexey J'ai clarifié ce que j'entends par modèle paramétrique ci-dessus. Merci

Jeudi

D'après ce que je suppose sur les modèles paramétriques, vous devez spécifier le modèle à la main pour chaque problème. Ce n'est pas toujours possible, car la vraie nature n'est pas toujours connue. De plus, l'ajustement de ces modèles peut poser des problèmes, tandis que pour les processus gaussiens, l'estimation des paramètres fonctionne bien presque à chaque fois.

Alexey Zaytsev

Les splines et la régression linéaire sont équivalentes à la régression des processus gaussiens avec la fonction de covariance appropriée sélectionnée. Mais les processus gaussiens fournissent un cadre probabiliste pratique bien adapté à de nombreuses tâches.

Alexey Zaytsev

Quand n'utiliseriez-vous pas le processus gaussien?

Alby

Réponses:

Les principaux avantages sont du point de vue de l' ingénierie (comme @Alexey l'a mentionné). Dans la procédure de Krigeage largement utilisée , vous pouvez interpréter votre propre «espace» en fournissant un modèle de «corrélation» (ou covariance) (généralement appelé ellipsoïde de variogramme ) pour les relations en fonction de la distance et de l'orientation.

Rien n'empêche d'autres méthodologies d'avoir les mêmes caractéristiques, il se trouve que la façon dont le krigeage a été conceptualisé pour la première fois avait une approche amicale envers les personnes qui n'étaient pas des statisticiens.

De nos jours avec l'essor des méthodologies stochastiques basées sur la géostatistique, comme la simulation gaussienne séquentielle, entre autres , ces procédures sont utilisées dans des secteurs où il est important de définir l'espace d'incertitude (qui peut prendre des milliers à des millions de dimensions). Encore une fois, du point de vue de l'ingénierie, les algorithmes basés sur la géostatistique sont très faciles à inclure dans la programmation génétique . Ainsi, lorsque vous avez des problèmes inverses, vous devez pouvoir tester plusieurs scénarios et tester leur adaptabilité à votre fonction d'optimisation.

Laissons la pure argumentation un instant exposer les faits pour un exemple réel moderne de cette utilisation. Vous pouvez soit échantillonner des échantillons souterrains directement (données matérielles), soit faire une carte sismique du sous-sol (données immatérielles).

Dans les données dures, vous pouvez mesurer une propriété (disons l'impédance acoustique) directement sans erreur (ish). Le problème est que c'est rare (et cher). D'un autre côté, vous avez la cartographie sismique qui est littéralement une carte du volume, au niveau des pixels, de la sous-surface mais ne vous donne pas d'impédance acoustique. Par souci de simplicité, disons qu'il vous donne le rapport entre deux valeurs d'impédance acoustique (haut et bas). Ainsi, un rapport de 0,5 pourrait être une division de 1000/2000 ou 10 000/20 000. C'est un espace de solutions multiples et plusieurs combinaisons suffiront, mais une seule représente avec précision la réalité. Comment résolvez-vous cela?

La façon dont fonctionne l'inversion sismique (les procédures stochastiques) consiste à produire des scénarios plausibles (et c'est une autre histoire ensemble) d'impédance acoustique (ou d'autres propriétés), à transformer ces scénarios en une sismique synthétique (comme le rapport dans l'exemple précédent) et comparer la sismique synthétique avec la vraie (corrélation). Les meilleurs scénarios seront utilisés pour produire encore plus de scénarios, convergeant vers une solution (ce n'est pas aussi simple qu'il y paraît).

Tenant compte de cela et parlant du point de vue de l'utilisabilité, je répondrais à vos questions de la manière suivante:

1) Ce qui les rend populaires, c'est la convivialité, la flexibilité dans la mise en œuvre, un bon nombre de centres de recherche et d'institutions qui continuent à créer des procédures gaussiennes plus récentes et plus adaptables pour plusieurs domaines différents (en particulier en géosciences, SIG inclus).

2) Les principaux avantages sont , comme mentionné précédemment, la convivialité et la flexibilité de mon point de vue. S'il est facile à manipuler et à utiliser, faites-le. Il n'y a pas de particularités dans les processus gaussiens qui ne soient pas reproductibles dans d'autres méthodologies (statistiques ou autres).

3) Ils sont utilisés lorsque vous devez inclure plus d'informations dans votre modèle que les seules données (des informations telles que des relations spatiales, des distributions statistiques, etc.). Je peux vous assurer que si vous avez beaucoup de données avec un comportement isotrope en utilisant le krigeage, c'est une perte de temps. Vous pouvez obtenir les mêmes résultats en utilisant toute autre méthode qui, en nécessitant moins d'informations, est plus rapide à exécuter.

armatita
la source

Et quand un autre modèle est-il un meilleur choix?

Ben

@Ben Cela dépendra toujours de l'étude de cas. Le krigeage ou les méthodes basées sur le krigeage ont un coût de calcul élevé (donc pas rapide). Par exemple, les téléviseurs modernes 4k (ou plus) utilisent des méthodes d'interpolation pour essayer d'améliorer le contenu conçu pour des résolutions plus petites. Cela implique qu'il doit effectuer cette opération rapidement et sans intervention de l'utilisateur (ce qui nécessiterait un modèle de covariance). Si je devais résoudre ce problème particulier, j'éviterais complètement le krigeage. De plus certains phénomènes sont basés sur des motifs, ou ont une variable discrète, ou peuvent être réduits à une formule (FEM, par exemple), etc ...

armatita

Et quand la vitesse n'est pas importante?

Ben

@Ben Speed est moins important si votre résultat n'a pas besoin d'être immédiat. La modélisation souterraine, la prévision météorologique et un ensemble d'opérations dans les sciences SIG ne sont que quelques exemples. Un autre est celui présenté dans la réponse (inversion sismique).

armatita

Désolé, je n'ai pas compris. Ni le calcul ni la vitesse des résultats ne sont importants, quels sont les inconvénients d'un GP? Ou en d'autres termes: ne devrait-il pas être utilisé beaucoup plus souvent?

Ben

Pour les ingénieurs, il est important:

d'avoir des intervalles de confiance pour les prédictions
pour interpoler les données d'entraînement
d'avoir des modèles lisses et non linéaires
utiliser des modèles de régression obtenus pour la conception adaptative d'expériences et l'optimisation

Les processus gaussiens répondent à toutes ces exigences.

De plus, souvent les ensembles de données d'ingénierie et de géostatistique ne sont pas si gros ou ont une structure de grille spécifique permettant une inférence rapide.

Alexey Zaytsev
la source

Merci pour votre commentaire . Il semble qu'en raison de leur interprétation bayésienne, les modèles de processus gaussiens peuvent avoir une bonne quantification de l'incertitude, mais cela est également possible en régression paramétrique. Je recherche une approche technique qui puisse expliquer l'ensemble des avantages statistiques

Wis

Les avantages du modèle gaussien.

Le PDF gaussien ne dépend que de ses moments de premier et de second ordre. Un processus gaussien stationnaire au sens large est également un processus stationnaire au sens strict et vice versa.

Les fichiers PDF gaussiens peuvent modéliser la distribution de nombreux processus, y compris certaines classes importantes de signaux et de bruit. La somme de nombreux processus aléatoires indépendants a une distribution gaussienne (théorème central limite).

Les processus non gaussiens peuvent être approximés par une combinaison pondérée (c'est-à-dire un mélange) d'un certain nombre de pdfs gaussiens de moyennes et de variances appropriées.

Les méthodes d'estimation optimales basées sur des modèles gaussiens aboutissent souvent à des solutions linéaires et mathématiquement exploitables.

Wilson
la source