Accueil Finances personnelles Clustering Réseaux sociaux dans les groupes - dummies

Clustering Réseaux sociaux dans les groupes - dummies

Vidéo: Cluster of Wainner | Cervical Radicular Syndrome 2024

Vidéo: Cluster of Wainner | Cervical Radicular Syndrome 2024
Anonim

Les gens ont tendance à former des communautés - des groupes d'autres personnes qui ont des idées et des sentiments. En étudiant ces groupes, il devient plus facile d'attribuer certains comportements au groupe dans son ensemble (bien que l'attribution du comportement à un individu soit à la fois dangereuse et peu fiable).

L'idée derrière l'étude des grappes est que si une connexion existe entre les gens, ils ont souvent un ensemble commun d'idées et d'objectifs. En trouvant des groupes, vous pouvez déterminer ces idées en inspectant l'appartenance à un groupe. Par exemple, il est courant d'essayer de trouver des groupes de personnes dans la détection de fraude d'assurance et l'inspection fiscale. Des groupes inattendus de personnes pourraient soulever des soupçons sur le fait qu'ils font partie d'un groupe de fraudeurs ou d'escrocs fiscaux parce qu'ils n'ont pas les raisons habituelles pour que les gens se rassemblent dans de telles circonstances.

Les graphiques d'amitié peuvent représenter la façon dont les gens se connectent les uns aux autres. Les sommets représentent les individus et les bords représentent leurs connexions, telles que les relations familiales, les contacts professionnels ou les liens d'amitié. Généralement, les graphiques d'amitié sont non dirigés parce qu'ils représentent des relations mutuelles, et parfois ils sont pondérés pour représenter la force du lien entre deux personnes.

De nombreuses études se concentrent sur les graphes non orientés qui se concentrent uniquement sur les associations. Vous pouvez également utiliser des graphes orientés pour montrer que la personne A connaît la personne B, mais que la personne B ne sait même pas que la personne A existe. Dans ce cas, vous avez réellement 16 types de triades à considérer.

Lorsque vous recherchez des grappes dans un graphe d'amitié, les connexions entre les noeuds de ces grappes dépendent de triades, essentiellement des triangles spéciaux. Les connexions entre trois personnes peuvent tomber dans ces catégories:

  • Fermé: Les trois personnes se connaissent. Pensez à un cadre familial dans ce cas, où tout le monde connaît tout le monde.
  • Ouvrir: Une personne connaît deux autres personnes, mais les deux autres personnes ne se connaissent pas. Pensez à une personne qui connaît une personne au travail et une autre personne à la maison, mais la personne au travail ne sait rien de l'individu à la maison.
  • Paire connectée: Une personne connaît l'une des autres personnes d'une triade mais ne connaît pas la troisième personne. Cette situation implique deux personnes qui connaissent quelque chose l'une à l'autre et rencontrent quelqu'un de nouveau - quelqu'un qui veut potentiellement faire partie du groupe.
  • Non connecté: La triade forme un groupe, mais personne dans le groupe ne se connaît. Ce dernier peut sembler un peu étrange, mais pensez à une convention ou à un séminaire.Les gens de ces événements forment un groupe, mais ils peuvent ne rien savoir l'un de l'autre. Cependant, parce qu'ils ont des intérêts similaires, vous pouvez utiliser le clustering pour comprendre le comportement du groupe.

Les triades se produisent naturellement dans les relations, et de nombreux réseaux sociaux sur Internet ont exploité cette idée pour accélérer les connexions entre les participants. La densité des connexions est importante pour tout type de réseau social, car un réseau connecté peut diffuser des informations et partager du contenu plus facilement. Par exemple, lorsque LinkedIn, le réseau social professionnel, a décidé d'augmenter la densité de connexion de son réseau, il a commencé par rechercher des triades ouvertes et essayer de les fermer en invitant les gens à se connecter. La clôture des triades est à la base de l'algorithme de suggestion de connexion de LinkedIn. Vous pouvez en découvrir plus sur la façon dont cela fonctionne en lisant la réponse de Quora.

L'exemple ici repose sur le graphe d'échantillon du Zachary's Karate Club. C'est un petit graphique qui vous permet de voir comment fonctionnent les réseaux sans passer beaucoup de temps à charger un grand ensemble de données. Heureusement, cet ensemble de données apparaît dans le paquet networkx . Le réseau Zachary's Karate Club représente les relations amicales entre 34 membres d'un club de karaté de 1970 à 1972. Le sociologue Wayne W. Zachary l'a utilisé comme sujet d'étude. Il a écrit un article intitulé «Un modèle de flux d'information pour les conflits et la fission dans les petits groupes. "Le fait intéressant à propos de ce graphique et de son article est que dans ces années, un conflit a surgi dans le club entre l'un des instructeurs de karaté (numéro de noeud 0) et le président du club (numéro de noeud 33). En groupant le graphique, vous pouvez presque parfaitement prédire la division du club en deux groupes peu après l'événement.

Comme cet exemple dessine également un graphique montrant les groupes (pour que vous puissiez les visualiser plus facilement), vous devez également utiliser le paquet matplotlib . Le code suivant montre comment représenter graphiquement les noeuds et les arêtes de l'ensemble de données.

import réseaux comme nx

import matplotlib. pyplot comme plt

% matplotlib inline

graphe = nx. karate_club_graph ()

pos = nx. spring_layout (graphique)

nx. draw (graph, pos, with_labels = Vrai)

plt. show ()

Pour afficher le graphique à l'écran, vous devez également fournir une disposition qui détermine comment positionner les nœuds à l'écran. Cet exemple utilise l'algorithme dirigé par la force de Fruchterman-Reingold (l'appel à nx. Spring_layout ). La figure montre la sortie de l'exemple. (Votre sortie peut être légèrement différente.)

Un graphique montrant les grappes réseau de relations entre amis.

L'algorithme dirigé par la force de Fruchterman-Reingold pour générer des mises en page automatiques de graphes crée des mises en page compréhensibles avec des nœuds et des arêtes séparés qui tendent à ne pas se croiser en imitant ce qui se passe en physique. En regardant la sortie du graphique, vous pouvez voir que certains nœuds ont une seule connexion, deux ou deux.Les bords forment des triades, comme mentionné précédemment. Cependant, la considération la plus importante est que la figure montre clairement le regroupement qui se produit dans un réseau social.

Clustering Réseaux sociaux dans les groupes - dummies

Le choix des éditeurs

Tableaux et pointeurs en C ++ - le nom du tableau des mannequins

Tableaux et pointeurs en C ++ - le nom du tableau des mannequins

Est un pointeur sur le tableau lui-même. Le tableau est une séquence de variables stockée en mémoire. Le nom du tableau pointe vers le premier élément. C'est une question intéressante sur les pointeurs: Pouvez-vous avoir un en-tête de fonction, comme la ligne suivante, et juste utiliser sizeof pour déterminer comment ...

Boost Bibliothèques et C ++ - mannequins

Boost Bibliothèques et C ++ - mannequins

De nombreux développeurs utilisent les bibliothèques Boost car elles fournissent un code de haute qualité une partie de Boost est en train d'être normalisée pour être incluse dans la bibliothèque standard. L'une des meilleures choses à propos de Boost est que la bibliothèque elle-même est gratuite. Le site Web de Boost tient à faire savoir aux développeurs qu'ils ne ...

Casser les programmes Mis à part C ++ - les mannequins

Casser les programmes Mis à part C ++ - les mannequins

Le programmeur peut casser un seul programme en fichiers sources distincts généralement appelés modules. Ces modules sont compilés séparément dans le code machine par le compilateur C ++, puis combinés au cours du processus de génération pour générer un seul programme. Ces modules sont également connus par les geeks du compilateur en tant qu'unités de traduction C ++. Le processus de combinaison ...

Le choix des éditeurs

Comment régler les paramètres via l'affichage d'informations sur votre Nikon D5200 - mannequins

Comment régler les paramètres via l'affichage d'informations sur votre Nikon D5200 - mannequins

L'information l'affichage ne sert pas uniquement à vérifier les paramètres de prise de vue actuels; Cela vous donne également un accès rapide à certains des paramètres les plus critiques. La touche de cette fonction est le bouton Information Edit, situé à l'arrière de l'appareil photo, à droite du viseur. Voici comment cela fonctionne: Afficher les informations ...

Met en surbrillance le mode d'affichage sur votre Nikon D7100 - mannequins

Met en surbrillance le mode d'affichage sur votre Nikon D7100 - mannequins

En mode d'affichage hautes lumières sur votre Nikon D7100 pense que l'appareil photo peut être surexposé clignoter dans le moniteur de l'appareil photo. L'un des problèmes de photo les plus difficiles à corriger dans un programme de retouche photo est connu sous le nom de surbrillance dans certains cercles et de surbrillance dans d'autres. Les deux termes signifient que les zones les plus claires de ...

Comment régler les paramètres via la bande de contrôle Nikon D3300 - les tétines

Comment régler les paramètres via la bande de contrôle Nikon D3300 - les tétines

Présentes en bas à gauche Au coin du Nikon D3300, le bouton i active une bande de contrôle qui vous donne un accès rapide à certains paramètres de prise de vue critiques. Voici comment utiliser la bande de contrôle pour la photographie dans le viseur: Affichez l'écran d'informations. Vous pouvez le faire en appuyant sur le bouton Info. Appuyez sur le bouton i. Le haut ...

Le choix des éditeurs

Comment imprimer vos diapositives et notes Keynote - Les tétines

Comment imprimer vos diapositives et notes Keynote - Les tétines

Lorsque vous créez une présentation dans Snow Leopard Application Keynote, vous ne pouvez pas toujours vouloir imprimer des documents. Cependant, si vous présentez un long diaporama avec beaucoup d'informations que vous aimeriez que votre public se souvienne, rien ne vaut les documents qui incluent des images réduites de vos diapositives (et, facultativement, les notes de votre présentateur). Vous pouvez ...

Comment réorganiser ou supprimer les signets - les mannequins

Comment réorganiser ou supprimer les signets - les mannequins

Safari enregistre vos signets et vos dossiers de signets dans l'ordre dans lequel vous les créez, en les ajoutant au bas d'une liste toujours croissante. Si vous continuez à ajouter des marque-pages au menu Signets sans les placer dans des dossiers, vous pouvez constater que vous avez un nombre de signets gazillion indiqué bon gré mal gré et que vous ne vous en souvenez plus ...

Pour ouvrir et utiliser l'iDisk de Snow Leopard - les mannequins

Pour ouvrir et utiliser l'iDisk de Snow Leopard - les mannequins

Avec un compte MobileMe actif, iDisk est disponible et vous fournit un espace de stockage supplémentaire. Pour connaître l'espace de stockage utilisé et pour configurer l'accès à votre dossier Public, ouvrez les Préférences Système, cliquez sur l'icône MobileMe, puis sur le bouton iDisk pour afficher les paramètres. Vos paramètres iDisk sont disponibles dans les Préférences Système. Le ...