J'essayais de créer des données de test pour la régression logistique et j'ai trouvé ce post Comment simuler des données artificielles pour la régression logistique?
C'est une bonne réponse mais elle ne crée que des variables continues. Qu'en est-il d'une variable catégorielle x3 à 5 niveaux (ABCDE) associée à y pour le même exemple que dans le lien?
r
logistic
simulation
user1301295
la source
la source
Réponses:
Le modèle
Génération de données dans R
(une)
Le
x
vecteur a desn
composants (un pour chaque individu). Chaque composant est soit "A", "B", "C", "D" ou "E". Chacun de "A", "B", "C", "D" et "E" est également probable.b)
dummy(x)
n
(c)
Les probabilités de réussite découlent du modèle logistique:
(ré)
pi[i]
Quelques simulations rapides pour vérifier que c'est OK
la source