J'écris actuellement un algorithme de confidentialité différentielle en utilisant le mécanisme de Laplace.
Malheureusement, je n'ai aucune expérience en statistique, donc beaucoup de termes me sont inconnus. Alors maintenant, je trébuche sur le terme: bruit de Laplace . Pour rendre un différentiel de jeu de données privé, tous les articles parlent simplement d'ajouter du bruit de Laplace selon la distribution de Laplace aux valeurs de la fonction.
(k est la valeur privée différentielle, f la valeur renvoyée par la fonction d'évaluation et Y le bruit de Laplace)
Est-ce à dire que je crée des variables aléatoires à partir de la distribution de Laplace selon cette fonction que j'ai de wikipedia https://en.wikipedia.org/wiki/Laplace_distribution ?
MISE À JOUR: J'ai tracé jusqu'à 100 variables aléatoires tirées de la fonction ci-dessus, mais cela ne me donne pas une distribution de Laplace (même pas proche). Mais je pense que cela devrait modéliser une distribution Laplace.
MISE À JOUR2:
Ce sont les définitions que j'ai:
(Le mécanisme de Laplace). Étant donné n'importe quelle fonction , le mécanisme de Laplace est défini comme: où Y sont iid des variables aléatoires tirées de
Aussi bien que:
Pour générer Y (X), un choix courant consiste à utiliser une distribution de Laplace avec une moyenne nulle et un paramètre d'échelle Δ (f) / ε
Réponses:
Vous avez raison, l'ajout de bruit de Laplace signifie qu'à votre variable vous ajoutez la variable qui suit la distribution de Laplace . Il y a plusieurs raisons pour lesquelles il est appelé bruit . Tout d'abord, pensez au traitement du signal, où le message est envoyé sur un canal et en raison de la nature imparfaite du canal, le signal reçu est bruyant, vous devez donc isoler le signal du bruit. Deuxièmement, en cryptographie, nous parlons également de bruit pseudo-aléatoire et la confidentialité différentielle est liée à la cryptographie. Troisièmement, dans les statistiques et l'apprentissage automatique, nous pouvons également parler de bruit statistique , les modèles statistiques incluent le bruit ou les termes d'erreur, etc. (il y a même un livre sur les noms de prévisionX Oui Signal et le bruit de Nate Silver). Nous utilisons donc le bruit comme synonyme plus précis de l' aléatoire ambigu .
En ce qui concerne la génération aléatoire, il existe plusieurs façons de dessiner des valeurs aléatoires après la distribution de Laplace, par exemple:
Sur les graphiques ci-dessous, vous pouvez voir la distribution de échantillons tirés en utilisant chacune des fonctions avec la densité de Laplace qui l'accompagne (ligne rouge).dix5
Pour simplifier les exemples, j'utilise la distribution standard de Laplace avec scale = 1, mais vous pouvez facilement changer les résultats en multipliant les résultats en utilisant différents facteurs d'échelle.
la source
La distribution exponentielle de Laplace ou double chute exponentiellement vers la gauche et la droite autour d'une moyenne. C'est essentiellement l'exponentielle reflétée de l'autre côté.
Si vous voulez la vraisemblance, utilisez la vraisemblance de l'exponentielle et ajoutez un abs () à la valeur observée. La probabilité logarithmique est simplement l'abs () des résidus, multiplié par le taux de l'exponentielle.
Pour échantillonner, le plus simple est de tirer de -1,1 et de multiplier par un tirage de la distribution exponentielle, disponible dans la plupart des langages de programmation. Alternativement, comme indiqué ci-dessus, vous trouverez également des implémentations directes de Laplace, mais cela peut nécessiter un peu plus de recherche.
la source