que veut-on dire par intégration numérique est trop cher?

12

Je lis sur l'inférence bayésienne et je suis tombé sur l'expression "l'intégration numérique de la probabilité marginale est trop chère"

Je n'ai pas de formation en mathématiques et je me demandais ce que signifie exactement cher ici? Est-ce juste en termes de puissance de calcul ou y a-t-il quelque chose de plus.

discretetimeisnice
la source
6
Cela signifie qu'il faut trop de puissance de calcul, probablement en termes de temps CPU (car toutes les ressources informatiques sont toutes essentiellement de la mémoire ou du CPU).
Sycorax dit Réintégrer Monica
3
En fait, la bande passante de communication peut parfois devenir un problème (par exemple entre le cache / la RAM / le disque en série, ou entre les nœuds de calcul en parallèle).
GeoMatt22
Cela signifie qu'il faut trop de temps, pour un seul ordinateur, ou pour un réseau d'ordinateurs, pour effectuer le calcul.
Jack Maddington
2
Et si la probabilité marginale est nécessaire à l'intérieur d'une boucle, ce qui compte comme trop cher est beaucoup moins. Par exemple. une routine d'intégration de 1 seconde semble rapide, mais elle peut être "trop ​​chère" si vous devez le faire 1 million de fois ...
Matthew Gunn
Cher en termes d'effort de calcul, car il faut plus d'efforts pour le calculer que vous ne pouvez vous le permettre, car cela prend trop de temps ou nécessite trop de processeurs pour le faire dans un délai raisonnable.
user253751

Réponses:

16

Dans le contexte des problèmes de calcul, y compris les méthodes numériques pour l'inférence bayésienne, l'expression "trop ​​cher" pourrait généralement se référer à deux questions

  1. un problème particulier est trop "grand" pour être calculé pour un " budget " particulier
  2. une approche générale évolue mal, c'est-à-dire a une grande complexité de calcul

Dans les deux cas, les ressources de calcul constituant le «budget» peuvent être constituées de choses comme des cycles CPU ( complexité temporelle ), de la mémoire ( complexité spatiale ) ou de la bande passante de communication (à l' intérieur ou entre les nœuds de calcul). Dans le deuxième cas, «trop cher» signifierait insoluble .

Dans le contexte du calcul bayésien, la citation fait probablement référence à des problèmes de marginalisation sur un grand nombre de variables .

Par exemple, le résumé de ce récent article commence

L'intégration est affectée par la malédiction de la dimensionnalité et devient rapidement insoluble à mesure que la dimensionnalité du problème augmente.

et continue en disant

Nous proposons un algorithme randomisé qui ... peut à son tour être utilisé, par exemple, pour le calcul marginal ou la sélection de modèle.

(À titre de comparaison, ce récent chapitre de livre traite des méthodes considérées comme "pas trop chères".)

GeoMatt22
la source
4
C'est une excellente réponse. J'ajouterai simplement, cependant, que le terme «cher» peut de plus en plus être pris à la lettre. - on peut augmenter sa puissance de calcul et son stockage de façon spectaculaire (jusqu'au niveau du supercalculateur, aussi longtemps qu'il le faut), très facilement de nos jours (et à peu de frais) ... mais pour les gros problèmes, cela restera trop cher - - en ce que cela coûtera littéralement plus d'argent réel que ce dont vous disposez.
Glen_b -Reinstate Monica
1
@Glen_b c'est un bon point! J'imagine que cette signification est moins courante dans la littérature publiée ... mais plus courante dans les propositions (et leurs critiques!)
GeoMatt22
@ GeoMatt22 C'est en fait une autre façon de dire le même sens, si vous y réfléchissez.
user253751
@ GeoMatt22 Merci! Je comprends maintenant parfaitement ce que signifie cher dans un contexte bayésien.
discretetimeisnice
10

Je vais vous donner un exemple sur cas discret pour montrer pourquoi l'intégration / la somme est très chère.

Supposons que nous ayons variables aléatoires binaires et que nous ayons la distribution conjointe . (En fait, il est impossible de stocker la distribution conjointe dans une table, car il y a valeurs. Supposons que nous l'avons maintenant dans la table et dans la RAM.)P ( X 1 , X 2 , , X 100 ) 2 100100P(X1,X2,,X100)2100

Pour obtenir une distribution marginale sur , nous devons additionner d'autres variables aléatoires. (Dans le cas continu, il est terminé.)P(X1)

P(X1)=X2X3X100P(X1,X2,,X100)

Nous sommons plus de variables. Par conséquent, il y a un nombre d'exponentiation d'opérations, dans ce cas, c'est , ce qui est un nombre énorme que tous les ordinateurs de la terre ne pourront pas faire.2 9999299

Dans la littérature sur les modèles graphiques probabilistes , une telle façon de calculer la distribution marginale est appelée approche de «force brute» pour effectuer une «inférence». Par son nom, nous savons peut-être que cela coûte cher. Et les gens utilisent de nombreuses autres façons d'effectuer l'inférence, par exemple, en obtenant efficacement la distribution marginale. "Autres moyens", y compris l' inférence approximative , etc.

Haitao Du
la source
3
Peut-être pourriez-vous également expliquer pourquoi l'approche bayésienne est utile ici, comme la question soulevée dans ce contexte.
Tim
5

Habituellement, lors de l'inférence bayésienne, il est facile de rencontrer une forte intégration sur des variables nuisibles, par exemple. Un autre exemple peut être un échantillonnage numérique comme dans ce cas à partir d'une fonction de vraisemblance, ce qui signifie effectuer un échantillonnage aléatoire à partir d'une distribution donnée. À mesure que le nombre de paramètres du modèle augmente, cet échantillonnage devient extrêmement lourd et diverses méthodes de calcul ont été développées pour accélérer la procédure et permettre des implémentations très rapides, en gardant bien sûr un haut niveau de précision. Ces techniques sont par exemple MC, MCMC, Metropolis ecc. Jetez un coup d'œil à l'analyse des données bayésiennes par Gelman et. il devrait vous donner une large introduction! bonne chance

Lcol
la source
3
Cette réponse ne semble pas répondre à la question principale du PO concernant la signification de «cher» dans ce contexte. Ou du moins pas très clairement.
Shufflepants
La courte explication est d'initier le lecteur à la signification de la demande de calcul lors de l'exécution d'une analyse spécifique en statistique bayésienne, car elle a déclaré ne pas être un mathématicien. En tout cas j'espère que c'était clair pour quelqu'un
Lcol