J'ai une liste de ~ 1000 tweets d'un utilisateur que je contrôle. J'aimerais pouvoir savoir combien de mentions utilisateur uniques (c.-à-d. Apparences de @anyUserName
) se trouvent dans les chaînes.
Chaque tweet est stocké dans une seule cellule. Je veux pouvoir extraire la chaîne de longueur variable @ de la cellule.
Cela fait quelques jours que je serais ravi de vous aider.
Merci
microsoft-excel
Adam
la source
la source
@
apparaît et les caractères qui le suivent jusqu'à ce que vous rencontriez un espace . Ensuite, vous voulez les lister et compter les uniques? Et chaque interpolation est dans une seule cellule dans une colonne spécifique? Où es-tu coincé?Réponses:
Maintenant, en voyant vos données, si vous voulez extraire plusieurs @ par tweet, vous devez avoir une colonne par instance que vous recherchez:
=IFERROR(MID($A2,FIND("|",SUBSTITUTE($A2,"@","|",B$1)),IFERROR(FIND(" ",$A2,FIND("|",SUBSTITUTE($A2,"@","|",B$1))),LEN($A2)+1)-FIND("|",SUBSTITUTE($A2,"@","|",B$1))),"")
Mettez ceci en B2, et copiez-le et plus.
Cela semble accablant, mais la temporarité remplace la nième instance de @ par un caractère différent (un caractère qui ne sera probablement pas utilisé dans un tweet, un tuyau "|"), puis trouvera cet emplacement et l'espace suivant après. S'il n'y a pas d'espace après, le nom est la dernière chose dans le tweet.
Dans cet exemple, vos tweets sont dans la colonne A à partir de la ligne 2 (supposez que l'en-tête est la ligne 1). Vous pouvez mettre cette formule en B2 et la copier à droite pour autant de colonnes que nécessaire. Il s'attend à ce que votre en-tête soit quel nom extraire. Comme ça:
la source
Voici une solution VBA. Il suffit de coller le code suivant dans un module (Appuyez sur Alt+ F11et allez à
Insert
>>Module
). Sélectionnez votre liste de tweets et exécutez-le (en appuyant sur F5dans la fenêtre de l'éditeur VBA).Ce code utilise des objets d'expression régulière et de script de dictionnaire. Il trouvera les mentions de l'utilisateur dans chaque tweet et les stockera dans un dictionnaire. Le dictionnaire est utilisé pour assurer l'unicité. Enfin, les mentions utilisateur uniques sont imprimées dans la colonne A sur une nouvelle feuille.
la source