Je suis médecin, alors soyez gentil avec moi et ma compréhension de base des statistiques.
J'ai un ensemble de données composé de patients et de leurs visites et j'ai étiqueté la présence d'un type spécifique de taupe dans leur main gauche et / ou droite avec {0,1} valeurs (0 = pas présent et 1 = présent). L'ensemble de données ressemble à ceci:
** Je l'ai supprimé car les réponses sont fournies; Je peux l'envoyer sur nouvelle demande
Donc, cela signifie que le patient A1-001 a eu 6 visites sans présence de taupe dans sa main droite lors de toutes les visites et présent de taupe dans sa main gauche dans toutes les visites sauf la première.
Je suis intéressé à trouver la probabilité qu'une main développe une taupe uniquement parmi les patients qui ont développé une taupe dans une main et à trouver la probabilité de développer une taupe dans l'autre main (étant donné que le patient avait déjà une taupe dans l'autre main) .
De plus, je veux savoir quelle est la probabilité de développer un grain de beauté au cours des visites parmi les patients qui ont développé un grain de beauté à un moment donné dans les deux mains
Pourriez-vous m'aider à modéliser ces questions simples?
Réponses:
Je pense personnellement que cela se prête bien à une analyse de survie.
Vous avez des personnes sans grains de beauté dans une certaine main au début de la période (votre population à risque); vous pouvez les sélectionner, et vous avez des points de temps pour le suivi et s'ils ont été censurés ou non (développé une taupe). Cela vous donne un risque pour la cohorte que vous avez sélectionnée.
Vous pouvez ensuite calculer un rapport de risque (par exemple pour développer un grain de beauté droit chez les personnes ayant un grain de beauté gauche au départ, par rapport à celles qui n'en ont pas). Cela pourrait être exprimé sur un graphique de Kaplan-Meier et sera accompagné d'un intervalle de confiance.
la source
Il n'y a pas de modélisation à faire ici, toutes vos questions sont de simples probabilités conditionnelles.
D'accord, puisque les gens n'ont pas apprécié cette réponse, vous devez clarifier deux ou trois choses.
Voulez-vous dire par visite? Ou qu'ils n'ont jamais développé de grain de beauté? De votre exemple:
Les patients 1 et 3 ont développé une taupe d'une part. Par contre, le patient 1 n'a jamais développé de grain de beauté, contrairement au patient 3, vous pouvez donc affirmer que la réponse à votre question est de 50%. Maintenant, vous pouvez également affirmer que le patient 1 a eu 4 examens avec 1 mole et non de l'autre et que le patient 3 a eu 0 examens avec 1 mole et pas l'autre, de sorte que la probabilité pourrait être de 1/5 = 20%. Cela dépend de la façon dont vous définissez votre question.
la source
Personnellement, je pense que vous pouvez commencer par étudier les modèles linéaires généralisés de multicovariance : https://cran.r-project.org/web/packages/mcglm/index.html
https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html
http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)
Ces modèles sont appropriés lorsque vous avez plus d'une variable de réponse et qu'ils ne sont pas gaussiens, et c'est votre cas, car vous avez deux variables binaires (taupe ou non taupe dans chaque main). En outre, la méthode vous permet de gérer les dépendances intra-individuelles, ce qui est donné par la structure longitudinale. Ici, longitudinal signifie des mesures répétées pour le même individu au cours du temps.
Je pense que les liens ci-dessus vous aideront à avoir une bonne idée de ces techniques, et ils fournissent également l'implémentation informatique dans R.
la source