Quelle est la différence entre l'apprentissage par renforcement sans modèle et basé sur le modèle?

Quelle est la différence entre l'apprentissage par renforcement sans modèle et basé sur le modèle? Il me semble que tout apprenant sans modèle, apprenant par essais et erreurs, pourrait être recadré comme basé sur un modèle. Dans ce cas, quand les apprenants sans modèle seraient-ils...