J'essaie d'apprendre un peu Python et Sklearn, mais pour mon travail, j'ai besoin d'exécuter des régressions qui utilisent des distributions d'erreur des familles Poisson, Gamma et surtout Tweedie.
Je ne vois rien dans la documentation à leur sujet, mais ils se trouvent dans plusieurs parties de la distribution R, donc je me demandais si quelqu'un avait vu des implémentations quelque part pour Python. Ce serait super cool si vous pouvez me diriger vers les implémentations SGD de la distribution Tweedie!
Réponses:
Il y a du mouvement pour implémenter des modèles linéaires généralisés avec des distributions d'erreur de Poisson, gamma et Tweedie dans scikit-learn.
Statsmodels possède des implémentations de modèles linéaires généralisés avec des distributions d'erreur de Poisson, Tweedie et gamma.
Pendant que je mets à jour cette réponse, Spark ML prend également en charge (expérimentalement) les distributions de Poisson, Tweedie et gamma.
la source
H2O a généralisé les modèles linéaires .
Cependant, ils utilisent des cadres H2O, vous ne pouvez donc pas utiliser Pandas / Numpy directement.
la source