Interprétation de l'estimation d'erreur hors du sac pour RandomForestRegressor

9

J'utilise le régresseur RandomForest sur mes données et j'ai pu voir que le score oob a été obtenu à 0,83. Je ne sais pas comment ça s'est passé comme ça. Je veux dire que mes cibles sont des valeurs élevées de l'ordre de 10 ^ 7. Donc, si c'est MSE, il aurait dû être beaucoup plus élevé. Je ne comprends pas ce que 0,83 signifie ici.

J'utilise RandomForestRegressor de python de la boîte à outils sklearn.

je fais

model = RandomForestRegressor (max_depth = 7, n_estimators = 100, oob_score = True, n_jobs = -1) model.fit (trainX, trainY)

Ensuite, je vois model.oob_score_ et j'obtiens des valeurs comme 0,83809026152005295

user34790
la source
@Momo. J'utilise RandomForestRegressor de sklearn.ensemble de python. J'utilise juste le modèle comme
user34790

Réponses:

6

R2

self.oob_score_ = 0.0
for k in xrange(self.n_outputs_):
    self.oob_score_ += r2_score(y[:, k], predictions[:, k])
self.oob_score_ /= self.n_outputs_

r2_score()calcule le coefficient de détermination aka. R2 , dont le meilleur score possible est de 1,0, et les valeurs inférieures sont pires.

Pour info:

Franck Dernoncourt
la source