Qu'est-ce qui se cache derrière l'API Google Prediction?

L'API Google Prediction est un service cloud où l'utilisateur peut soumettre des données de formation pour former un classificateur mystérieux et lui demander plus tard de classer les données entrantes, par exemple pour mettre en œuvre des filtres anti-spam ou prédire les préférences de l'utilisateur.

Mais qu'est-ce qui se cache dans les coulisses?

machine-learning
la source

Je soupçonne qu'ils espèrent garder cela commercialement confidentiel!

onestop

Cela peut être vrai, mais la vidéo (de l'été 2010) suggère qu'ils avaient encore expérimenté à cette époque; j'ai donc posté ce Q en espérant que des fuites soient apparues depuis lors.

Il existe "plusieurs" algorithmes parmi lesquels l'API Prediction peut choisir lors de la formation / prévision de vos données. Le moteur choisit celui qu'il décide le mieux. Certains utilisateurs ont demandé un peu plus de contrôle sur cette sélection, goo.gl/mod/5EoA , même si l'algorithme est inconnu. Les redditors ont spéculé sur les tripes ici, reddit.com/r/MachineLearning/comments/evdxb/… , mais le discours est perdu pour moi.

hyperslug

@hyperslug Postez-le comme réponse, il est très utile donc je voudrais l'accepter.

Réponses:

Google utilise différentes techniques d'apprentissage automatique et algorithme pour la formation et la prévision. Les stratégies pour un apprentissage supervisé à grande échelle: 1. Sous-échantillon 2. Parallèlement embarrassant à certains algorithmes 3. Descente de gradient distribuée 4. Vote majoritaire 5. Mélange de paramètres 6. Mélange de paramètres itératifs

Ils doivent former et prédire le modèle avec les différentes techniques d'apprentissage automatique et en utilisant un algorithme pour décider du meilleur modèle et de la meilleure prévision à retourner.

Le sous-échantillonnage offre des performances inférieures
Le mélange des paramètres s'améliore, mais pas aussi bien que toutes les données
Les algorithmes distribués renvoient plus rapidement de meilleurs classificateurs
Le mélange de paramètres itératifs atteint aussi bien que toutes les données

Mais bien sûr, ce n'est pas vraiment clair dans la documentation de l'API.

404Dreamer_ML
la source