API de prédiction Google: quelles méthodes de formation / prédiction l'API Google Prediction utilise-t-elle?

9

Les détails de l'API Google Prediction sont sur cette page , mais je ne trouve aucun détail sur les algorithmes de prédiction exécutés derrière l'API.

Jusqu'à présent, j'ai compris qu'ils vous permettaient de fournir vos étapes de prétraitement au format PMML.

Tahir Akhtar
la source

Réponses:

6

Si vous regardez les spécifications de PMML que vous pouvez trouver ici, vous pouvez voir dans le menu de gauche les options dont vous disposez (comme ModelTree, NaiveBayes, Neural Nets, etc.).

rapaio
la source
5

Une variété de méthodes sont disponibles pour l'utilisateur. La documentation de support fournit des procédures pas à pas et des conseils sur le moment où l'un ou l'autre modèle est le plus approprié.

Cette page présente les méthodes d'apprentissage suivantes:

  • "AssociationModel"
  • "ClusteringModel"
  • "GeneralRegressionModel"
  • "MiningModel"
  • "NaiveBayesModel"
  • "Réseau neuronal"
  • "Modèle de régression"
  • "RuleSetModel"
  • "SequenceModel"
  • "SupportVectorMachineModel"
  • "TextModel"
  • "TimeSeriesModel"
  • "TreeModel"

EDIT: Je ne vois cependant aucune information spécifique sur les algorithmes. Par exemple, le modèle d'arbre utilise-t-il le gain d'informations ou l'index gini pour les divisions?

Brent Blazek
la source
3

Google ne publie pas les modèles qu'ils utilisent, mais ils ne prennent pas spécifiquement en charge les modèles de la spécification PMML.

Si vous examinez attentivement la documentation de cette page , vous remarquerez que la sélection de modèle dans le schéma est grisée, indiquant qu'il s'agit d'une fonctionnalité non prise en charge du schéma.

La documentation précise que, par défaut, elle utilisera un modèle de régression pour les données de formation contenant des réponses numériques et un modèle de catégorisation non spécifié pour les données de formation qui aboutit à des réponses textuelles.

L'API Google Prediction prend également en charge les modèles hébergés (bien que seuls quelques modèles de démonstration soient actuellement disponibles) et les modèles spécifiés avec une transformation PMML. La documentation contient un exemple de modèle défini par une transformation PMML . (Il y a également une note sur cette page indiquant que les éléments PMML ... Model ne sont pas pris en charge).

La norme PMML prise en charge partiellement par Google est la version 4.0.1 .

Steve Kallestad
la source