Science des données

8
Comment construire un moteur de recherche textuel?

J'ai une chaîne HTML et je veux savoir si un mot que je fournis est pertinent dans cette chaîne. La pertinence pourrait être mesurée en fonction de la fréquence dans le texte. Un exemple pour illustrer mon problème: this is an awesome bike store bikes can be purchased online. the bikes we own rock....

8
Groupement d'unions dans les graphes bipartis?

J'essaie de trouver une bonne (et rapide) solution au problème suivant: J'ai deux modèles avec lesquels je travaille, appelons-les joueurs et équipes. Un joueur peut appartenir à plusieurs équipes et une équipe peut avoir plusieurs joueurs). Je travaille sur la création d'un élément d'interface...

8
Tutoriels sur les modèles de sujet et LDA

J'aimerais savoir si vous avez de bons tutoriels (rapides et simples) sur les modèles de sujet et LDA, enseignant intuitivement comment définir certains paramètres, ce qu'ils signifient et si possible, avec de vrais

8
Chunking complexe avec NLTK

J'essaie de comprendre comment utiliser le chunker en cascade de NLTK conformément au chapitre 7 du livre NLTK . Malheureusement, je rencontre quelques problèmes lors de l'exécution de mesures de segmentation non triviales. Commençons par cette phrase: "adventure movies between 2000 and 2015...

8
visualiser une boîte à moustaches horizontale dans R

J'ai un ensemble de données comme celui-ci. Les données ont été collectées via un questionnaire et je vais faire une analyse exploratoire des données. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <-...