Détection d'anomalie de lien dans un réseau temporel

32

Je suis tombé sur un article qui utilise la détection d'anomalie de lien pour prédire les sujets à la mode et je l'ai trouvé extrêmement intriguant: Cet article s'intitule "Découvrir les sujets émergents dans les flux sociaux via la détection d'anomalie de lien" .

J'adorerais le reproduire sur un jeu de données différent, mais je ne connais pas suffisamment les méthodes pour savoir comment les utiliser. Disons que j'ai une série d'instantanés du réseau de nœuds sur une période de six mois. Les nœuds ont une distribution en degrés longue distance, la plupart n'ayant que peu de connexions, mais certains en ont beaucoup. De nouveaux nœuds apparaissent au cours de cette période.

Comment pourrais-je mettre en œuvre des calculs de vraisemblance maximale normalisée séquentiellement actualisés utilisés dans le document pour détecter des liens anormaux qui, selon moi, pourraient être des précurseurs d'une rafale? Y a-t-il d'autres méthodes qui seraient plus appropriées?

Je demande à la fois théoriquement et pratiquement. Si quelqu'un pouvait m'indiquer un moyen d'implémenter cela en python ou en R, ce serait très utile.

N'importe qui? Je sais que vous, les gens intelligents, avez des idées de départ pour une réponse,

Olga Mu
la source
1
Si cela ne vous dérange pas d'assouplir la préférence R / python, mon travail peut-il vous aider? goo.gl/l7SLlB Certains des avantages de cette méthode sont que vous n'avez pas à vous soucier des types de fonctionnalités, des normalisations, etc.
arielf
1
À moins que je ne comprenne mal la question, vous devriez pouvoir appliquer la méthode à partir du papier de la même manière que les auteurs du papier ont mis en œuvre la méthode. Si la méthode ne peut pas être reproduite à partir du document, vous devez contacter les auteurs. Les auteurs peuvent également être disposés à fournir leur code. Si vous avez des questions théoriques spécifiques ou des questions de programmation, vous devez les poser séparément.
Nat

Réponses:

0

Vous devriez d’abord définir votre score d’anomalie pour un nouveau nœud (voir section 3.1, 3.2). Heureusement, la correspondance entre une nouvelle publication (dans leur cas) et un nouveau nœud (dans votre cas) est presque un pour un, car nous ne sommes intéressés que par l'ensemble des nœuds (utilisateurs) que le nœud (post) est. relatif à.

γ

Si vous avez des difficultés à suivre les étapes décrites dans la sous-section 3.4., Où SDNML est appliqué, demandez-lui davantage.

sdd
la source