Identifier des communautés et cartographier des relations sur Twitter avec NodeXL

7 novembre 2009 par Mathieu Bertolo Laisser une réponse »


2009 – November – NodeXL – Demo – Mapping Twitter Social Networks « Digg » from Marc Smith on Vimeo.

Voici une petit tutoriel très bien fait qui détaille comment exploiter et analyser des données récupérées depuis Twitter, qui seront ensuite traitées et visualisées dans un seul module : NodeXL. Ce tutoriel à été réalisé par son principal contributeur Marc Smith himself. Pour rappel,  il s’agit d’un outil open source très puissant (issu d’un projet Microsoft Research) dédié à la visualisation de graphes au sens classique du terme, c’est-à-dire des ensembles de points tout ou partie connectés entre eux. Ces graphes peuvent être réalisés à partir de toutes sortes de données (certains spécialistes s’amusent même à comparer des données extraites de différents contextes afin de déceler ce qui est structurant, cela donne des systèmes complexes). Dans l’exemple utilisé, l’intérêt est plus simplement de visualiser les relations des personnes ayant mentionné un terme particulier « digg » dans leur tweets, afin d’identifier la communauté, si tant est qu’elle existe, ainsi que sa nature (taille, densité, etc.) et celle de ses membres.

Dans un graphe social, c’est à dire un graphe qui exploite des données extraites du Web social, chaque personne est représentée par un point et chaque lien correspond à une relation sociale, ou bien à une relation entre une personne est une donnée. Exploiter ces graphes et identifier des communautés (des clusters) et leur forme c’est précisément ce à quoi sert ce type d’outil.

Il en existe une multitude pour scanner le web relationnel, chacun possède des caractéristiques, des fonctionnalités qui lui sont propres. A ce propos, je vous invite à lire le billet de Psy & geek ;-) pour avoir un petit aperçu des solutions disponibles et se renseigner sur la façon de les utiliser. Il semblerait que NodeXL soit la plus complète. J’ai pu assister à une démo de Navicrawler qui à l’air tout aussi remarquable, peut être plus simple d’utilisation, mais je n’ai encore pu tester. Pour les personnes qui s’intéressent au Web social, comme les community managers, les digital planners ou simplement les curieux désireux de parfaire leur SMO [Social Media Optimization], utiliser ces outils afin de trouver de nouveaux indicateurs peut s’avérer très utile. En tout cas beaucoup plus qu’en se basant sur le seul critère du grand nombre de followers d’une personne, pour décréter de l’influence de son compte. Il n’est pas rare d’observer de faibles taux de clics de liens postés sur Twitter à partir de ces comptes influents, comparativement au nombre de followers, et inversement.

Quoi qu’il en soit, avec NodeXL il devient relativement simple d’identifier et affiner la perception que l’on peut avoir des communautés sur Twitter (la partie visualisation semble incroyablement au point). De plus, comme le montre le tutoriel, il est très facile d’ajuster les variables (nombres de followers, mentions, etc.) et modifier les critère de visualisation afin d’observer les dynamiques relationnelles entre des personnes qui échangent des mots, des liens, des relations dans cet écosystème.

A travers l’exemple Twitter / Digg, on voit clairement les formes des groupes ou encore les différents profils utilisateurs, se dessiner au gré des variables sélectionnées dans le tableau dédié (nombres de followers, tweets, etc.). Notons que Twitter limite volontairement la taille des échantillons (à 1000 comptes si j’ai bien compris). Dans l’image ci-dessous, apparaissent clairement (grâce aux différents filtres d’opacité par exemple) les comptes des utilisateurs qui ont tagué « digg« , qui ont le plus grand nombre de followers et qui sont en même temps reliés entre eux.

NodeFX-1

De même, il devient plus facile d’identifier et de distinguer au sein d’une communauté les membres centraux (les plus connectés entre eux), des périphériques.

NodeFx 2

Si l’on souhaite approfondir la visualisation, il est possible d’identifier et isoler la visualisation du noyau dur des membres de telle ou telle communauté, c’est à dire l’ensemble des membres qui sont tous connectés les uns aux autres.

NodeFX 3

Vous l’aurez compris les possibilités semblent illimitées et les résultats peuvent véritablement être probants, selon les variables et les « layouts » que vous sélectionnerez. Compte tenu de l’importance des médias sociaux et des caractéristiques de Twitter, il me paraît pertinent de se plonger dans ce genre de recherches plutôt pointilleuses. Peut-être n’est-ce pas forcément nécessaire pour tous les usages de la plateforme de microblogging. Mais pour des organisations telles que les groupes médias, les grands comptes, les marques et autres collectivités ou partis politiques cela peut aider. Non seulement à déceler des semantic key users, voire d’autres profils divers, mais surtout à apporter plus de précisions sur ses cibles lorsque l’on à un message à adresser à une ou plusieurs communautés. Enfin, au fil de la croissance du nombre  d’utilisateurs des médias sociaux, cela peut être utile, essentiel, pour saisir les formes communautaires, au regard de leur densité, de leur diversité. Également dans un second temps, afin que les messages en question, les idées circulent mieux et les échanges se fluidifient encore un peu plus, dans Twitter puis vers la toile.

Publicité

3 commentaires

  1. Marc SmithNo Gravatar dit :

    Thank you for the interest in NodeXL!

    Please send any bug reports or feature suggestions to the discussion board on the project web site: http://www.codeplex.com/nodexl

    Regards,

    Marc Smith (for Team NodeXL)

  2. Mathieu BertoloNo Gravatar dit :

    it’s my pleasure :-D thank you for your work. It is a remarkable tool. Sure, I’ll give you my feedback soon.

    Regards,

    Math

Laisser un commentaire