Le processus gaussien a été largement utilisé, notamment en émulation. On sait que la demande de calcul est élevée ( ).
- Qu'est-ce qui les rend populaires?
- Quels sont leurs principaux avantages cachés?
- Pourquoi sont-ils utilisés à la place des modèles paramétriques (par modèle paramétrique, je veux dire une régression linéaire typique dans laquelle différentes formes paramétriques peuvent être utilisées pour décrire la tendance entrée vs sortie; par exemple, qaudratique)?
J'apprécierais vraiment une réponse technique expliquant les propriétés inhérentes qui rendent le processus gaussien unique et avantageux
Réponses:
Les principaux avantages sont du point de vue de l' ingénierie (comme @Alexey l'a mentionné). Dans la procédure de Krigeage largement utilisée , vous pouvez interpréter votre propre «espace» en fournissant un modèle de «corrélation» (ou covariance) (généralement appelé ellipsoïde de variogramme ) pour les relations en fonction de la distance et de l'orientation.
Rien n'empêche d'autres méthodologies d'avoir les mêmes caractéristiques, il se trouve que la façon dont le krigeage a été conceptualisé pour la première fois avait une approche amicale envers les personnes qui n'étaient pas des statisticiens.
De nos jours avec l'essor des méthodologies stochastiques basées sur la géostatistique, comme la simulation gaussienne séquentielle, entre autres , ces procédures sont utilisées dans des secteurs où il est important de définir l'espace d'incertitude (qui peut prendre des milliers à des millions de dimensions). Encore une fois, du point de vue de l'ingénierie, les algorithmes basés sur la géostatistique sont très faciles à inclure dans la programmation génétique . Ainsi, lorsque vous avez des problèmes inverses, vous devez pouvoir tester plusieurs scénarios et tester leur adaptabilité à votre fonction d'optimisation.
Laissons la pure argumentation un instant exposer les faits pour un exemple réel moderne de cette utilisation. Vous pouvez soit échantillonner des échantillons souterrains directement (données matérielles), soit faire une carte sismique du sous-sol (données immatérielles).
Dans les données dures, vous pouvez mesurer une propriété (disons l'impédance acoustique) directement sans erreur (ish). Le problème est que c'est rare (et cher). D'un autre côté, vous avez la cartographie sismique qui est littéralement une carte du volume, au niveau des pixels, de la sous-surface mais ne vous donne pas d'impédance acoustique. Par souci de simplicité, disons qu'il vous donne le rapport entre deux valeurs d'impédance acoustique (haut et bas). Ainsi, un rapport de 0,5 pourrait être une division de 1000/2000 ou 10 000/20 000. C'est un espace de solutions multiples et plusieurs combinaisons suffiront, mais une seule représente avec précision la réalité. Comment résolvez-vous cela?
La façon dont fonctionne l'inversion sismique (les procédures stochastiques) consiste à produire des scénarios plausibles (et c'est une autre histoire ensemble) d'impédance acoustique (ou d'autres propriétés), à transformer ces scénarios en une sismique synthétique (comme le rapport dans l'exemple précédent) et comparer la sismique synthétique avec la vraie (corrélation). Les meilleurs scénarios seront utilisés pour produire encore plus de scénarios, convergeant vers une solution (ce n'est pas aussi simple qu'il y paraît).
Tenant compte de cela et parlant du point de vue de l'utilisabilité, je répondrais à vos questions de la manière suivante:
1) Ce qui les rend populaires, c'est la convivialité, la flexibilité dans la mise en œuvre, un bon nombre de centres de recherche et d'institutions qui continuent à créer des procédures gaussiennes plus récentes et plus adaptables pour plusieurs domaines différents (en particulier en géosciences, SIG inclus).
2) Les principaux avantages sont , comme mentionné précédemment, la convivialité et la flexibilité de mon point de vue. S'il est facile à manipuler et à utiliser, faites-le. Il n'y a pas de particularités dans les processus gaussiens qui ne soient pas reproductibles dans d'autres méthodologies (statistiques ou autres).
3) Ils sont utilisés lorsque vous devez inclure plus d'informations dans votre modèle que les seules données (des informations telles que des relations spatiales, des distributions statistiques, etc.). Je peux vous assurer que si vous avez beaucoup de données avec un comportement isotrope en utilisant le krigeage, c'est une perte de temps. Vous pouvez obtenir les mêmes résultats en utilisant toute autre méthode qui, en nécessitant moins d'informations, est plus rapide à exécuter.
la source
Pour les ingénieurs, il est important:
Les processus gaussiens répondent à toutes ces exigences.
De plus, souvent les ensembles de données d'ingénierie et de géostatistique ne sont pas si gros ou ont une structure de grille spécifique permettant une inférence rapide.
la source
Les avantages du modèle gaussien.
Le PDF gaussien ne dépend que de ses moments de premier et de second ordre. Un processus gaussien stationnaire au sens large est également un processus stationnaire au sens strict et vice versa.
Les fichiers PDF gaussiens peuvent modéliser la distribution de nombreux processus, y compris certaines classes importantes de signaux et de bruit. La somme de nombreux processus aléatoires indépendants a une distribution gaussienne (théorème central limite).
Les processus non gaussiens peuvent être approximés par une combinaison pondérée (c'est-à-dire un mélange) d'un certain nombre de pdfs gaussiens de moyennes et de variances appropriées.
Les méthodes d'estimation optimales basées sur des modèles gaussiens aboutissent souvent à des solutions linéaires et mathématiquement exploitables.
la source