J'essaie de générer des ensembles de variables aléatoires liées de manière causale et j'ai commencé à le faire avec une approche de monte carlo.
La ligne de base est un histogramme mesuré en 2 dimensions à partir duquel je tire des valeurs aléatoires.
Dans mes exemples concrets, ces variables sont l'accélération et la vitesse - donc évidemment doit tenir.
Mon approche naïve actuelle est la suivante:
Je commence par un peu de . Ensuite, je génère un aléatoire en fonction de la probabilité mesurée de pour la valeur de . En utilisant je peux calculer et toute la procédure recommence.
Donc, quand je vérifie les accélérations générées dans des bacs de tout va bien. Mais évidemment, cela ne respecte pas du tout la distribution marginale de .
Je suis un peu familier avec les méthodes de base de monte carlo, bien que manquant d'un peu de fond théorique comme vous pouvez le deviner. Je serais bien si les deux variables étaient juste connectées par une matrice de corrélation, mais la connexion causale entre les deux me donne des maux de tête.
Je n'ai pas réussi à trouver un exemple pour ce genre de problème quelque part - je suis peut-être en train de googler les mauvais termes. Je serais satisfait si quelqu'un pouvait m'indiquer une littérature / un exemple ou une méthode prometteuse pour mettre la main dessus.
(Ou dites-moi que ce n'est pas vraiment possible compte tenu de mes entrées - c'est ce que je suppose de temps en temps ...)
ÉDITER:
Le but réel de toute cette procédure: j'ai un ensemble de mesures et , représentées dans un histogramme bidimensionnel . Compte tenu de cette entrée, je voudrais générer des ensembles de et qui reproduisent la distribution mesurée.
la source
Réponses:
Il semble que pour reproduire la distribution conjointe , vous devez sélectionner nouveau non seulement basé sur , mais également basé sur l'ancien :ρ(a,v) a v a
La question (à laquelle je ne connais pas encore la réponse) est de savoir comment trouver qui produit .ρ′ ρ
UPD: Vous devez résoudre l'équation intégrale suivante:
En approximant la fonction avec un histogramme, vous la transformez en un système d'équations linéaires:ρ
Ce système est sous-déterminé. Vous pouvez appliquer une pénalité de douceur pour obtenir une solution.
la source
Les données GPS ne contiennent-elles pas la position ? J'aurais pensé que non seulement dépend de et mais serait également dépendant de . Considérez: dans tout réseau routier, il y a des goulots d'étranglement, des limites de vitesse, des signaux, des intersections, des pentes abruptes, etc. qui sont géolocalisés. Donc, quelque chose comme un ensemble (distribution) défini par:p vi+1 vi ai ai+1 pi
Pour un tel ensemble, la difficulté réside dans la nature des données. Il est probable que la vraie population sera asymétrique, non linéaire (par morceaux) et ne pourra pas avoir de moments définis. Ces caractéristiques peuvent ne pas être évidentes dans l'échantillon dont vous disposez.
Comme l'a déclaré @whuber, le problème, c'est-à-dire exactement ce que vous cherchez à produire, ne semble pas encore complètement et clairement défini. Il n'est pas clair si vous êtes intéressé par l'ensemble ou plus encore par les individus.
la source