Vidéo: Cluster of Wainner | Cervical Radicular Syndrome 2024
Les gens ont tendance à former des communautés - des groupes d'autres personnes qui ont des idées et des sentiments. En étudiant ces groupes, il devient plus facile d'attribuer certains comportements au groupe dans son ensemble (bien que l'attribution du comportement à un individu soit à la fois dangereuse et peu fiable).
L'idée derrière l'étude des grappes est que si une connexion existe entre les gens, ils ont souvent un ensemble commun d'idées et d'objectifs. En trouvant des groupes, vous pouvez déterminer ces idées en inspectant l'appartenance à un groupe. Par exemple, il est courant d'essayer de trouver des groupes de personnes dans la détection de fraude d'assurance et l'inspection fiscale. Des groupes inattendus de personnes pourraient soulever des soupçons sur le fait qu'ils font partie d'un groupe de fraudeurs ou d'escrocs fiscaux parce qu'ils n'ont pas les raisons habituelles pour que les gens se rassemblent dans de telles circonstances.
Les graphiques d'amitié peuvent représenter la façon dont les gens se connectent les uns aux autres. Les sommets représentent les individus et les bords représentent leurs connexions, telles que les relations familiales, les contacts professionnels ou les liens d'amitié. Généralement, les graphiques d'amitié sont non dirigés parce qu'ils représentent des relations mutuelles, et parfois ils sont pondérés pour représenter la force du lien entre deux personnes.
De nombreuses études se concentrent sur les graphes non orientés qui se concentrent uniquement sur les associations. Vous pouvez également utiliser des graphes orientés pour montrer que la personne A connaît la personne B, mais que la personne B ne sait même pas que la personne A existe. Dans ce cas, vous avez réellement 16 types de triades à considérer.
Lorsque vous recherchez des grappes dans un graphe d'amitié, les connexions entre les noeuds de ces grappes dépendent de triades, essentiellement des triangles spéciaux. Les connexions entre trois personnes peuvent tomber dans ces catégories:
- Fermé: Les trois personnes se connaissent. Pensez à un cadre familial dans ce cas, où tout le monde connaît tout le monde.
- Ouvrir: Une personne connaît deux autres personnes, mais les deux autres personnes ne se connaissent pas. Pensez à une personne qui connaît une personne au travail et une autre personne à la maison, mais la personne au travail ne sait rien de l'individu à la maison.
- Paire connectée: Une personne connaît l'une des autres personnes d'une triade mais ne connaît pas la troisième personne. Cette situation implique deux personnes qui connaissent quelque chose l'une à l'autre et rencontrent quelqu'un de nouveau - quelqu'un qui veut potentiellement faire partie du groupe.
- Non connecté: La triade forme un groupe, mais personne dans le groupe ne se connaît. Ce dernier peut sembler un peu étrange, mais pensez à une convention ou à un séminaire.Les gens de ces événements forment un groupe, mais ils peuvent ne rien savoir l'un de l'autre. Cependant, parce qu'ils ont des intérêts similaires, vous pouvez utiliser le clustering pour comprendre le comportement du groupe.
Les triades se produisent naturellement dans les relations, et de nombreux réseaux sociaux sur Internet ont exploité cette idée pour accélérer les connexions entre les participants. La densité des connexions est importante pour tout type de réseau social, car un réseau connecté peut diffuser des informations et partager du contenu plus facilement. Par exemple, lorsque LinkedIn, le réseau social professionnel, a décidé d'augmenter la densité de connexion de son réseau, il a commencé par rechercher des triades ouvertes et essayer de les fermer en invitant les gens à se connecter. La clôture des triades est à la base de l'algorithme de suggestion de connexion de LinkedIn. Vous pouvez en découvrir plus sur la façon dont cela fonctionne en lisant la réponse de Quora.
L'exemple ici repose sur le graphe d'échantillon du Zachary's Karate Club. C'est un petit graphique qui vous permet de voir comment fonctionnent les réseaux sans passer beaucoup de temps à charger un grand ensemble de données. Heureusement, cet ensemble de données apparaît dans le paquet
networkx
. Le réseau Zachary's Karate Club représente les relations amicales entre 34 membres d'un club de karaté de 1970 à 1972. Le sociologue Wayne W. Zachary l'a utilisé comme sujet d'étude. Il a écrit un article intitulé «Un modèle de flux d'information pour les conflits et la fission dans les petits groupes. "Le fait intéressant à propos de ce graphique et de son article est que dans ces années, un conflit a surgi dans le club entre l'un des instructeurs de karaté (numéro de noeud 0) et le président du club (numéro de noeud 33). En groupant le graphique, vous pouvez presque parfaitement prédire la division du club en deux groupes peu après l'événement.
Comme cet exemple dessine également un graphique montrant les groupes (pour que vous puissiez les visualiser plus facilement), vous devez également utiliser le paquet
matplotlib
. Le code suivant montre comment représenter graphiquement les noeuds et les arêtes de l'ensemble de données.
import réseaux comme nx
import matplotlib. pyplot comme plt
% matplotlib inline
graphe = nx. karate_club_graph ()
pos = nx. spring_layout (graphique)
nx. draw (graph, pos, with_labels = Vrai)
plt. show ()
Pour afficher le graphique à l'écran, vous devez également fournir une disposition qui détermine comment positionner les nœuds à l'écran. Cet exemple utilise l'algorithme dirigé par la force de Fruchterman-Reingold (l'appel à
nx. Spring_layout
). La figure montre la sortie de l'exemple. (Votre sortie peut être légèrement différente.)
L'algorithme dirigé par la force de Fruchterman-Reingold pour générer des mises en page automatiques de graphes crée des mises en page compréhensibles avec des nœuds et des arêtes séparés qui tendent à ne pas se croiser en imitant ce qui se passe en physique. En regardant la sortie du graphique, vous pouvez voir que certains nœuds ont une seule connexion, deux ou deux.Les bords forment des triades, comme mentionné précédemment. Cependant, la considération la plus importante est que la figure montre clairement le regroupement qui se produit dans un réseau social.