Je suis tombé sur un article qui utilise la détection d'anomalie de lien pour prédire les sujets à la mode et je l'ai trouvé extrêmement intriguant: Cet article s'intitule "Découvrir les sujets émergents dans les flux sociaux via la détection d'anomalie de lien" .
J'adorerais le reproduire sur un jeu de données différent, mais je ne connais pas suffisamment les méthodes pour savoir comment les utiliser. Disons que j'ai une série d'instantanés du réseau de nœuds sur une période de six mois. Les nœuds ont une distribution en degrés longue distance, la plupart n'ayant que peu de connexions, mais certains en ont beaucoup. De nouveaux nœuds apparaissent au cours de cette période.
Comment pourrais-je mettre en œuvre des calculs de vraisemblance maximale normalisée séquentiellement actualisés utilisés dans le document pour détecter des liens anormaux qui, selon moi, pourraient être des précurseurs d'une rafale? Y a-t-il d'autres méthodes qui seraient plus appropriées?
Je demande à la fois théoriquement et pratiquement. Si quelqu'un pouvait m'indiquer un moyen d'implémenter cela en python ou en R, ce serait très utile.
N'importe qui? Je sais que vous, les gens intelligents, avez des idées de départ pour une réponse,
Réponses:
Vous devriez d’abord définir votre score d’anomalie pour un nouveau nœud (voir section 3.1, 3.2). Heureusement, la correspondance entre une nouvelle publication (dans leur cas) et un nouveau nœud (dans votre cas) est presque un pour un, car nous ne sommes intéressés que par l'ensemble des nœuds (utilisateurs) que le nœud (post) est. relatif à.
Si vous avez des difficultés à suivre les étapes décrites dans la sous-section 3.4., Où SDNML est appliqué, demandez-lui davantage.
la source