Accueil Finances personnelles Clustering Réseaux sociaux dans les groupes - dummies

Clustering Réseaux sociaux dans les groupes - dummies

Vidéo: Cluster of Wainner | Cervical Radicular Syndrome 2025

Vidéo: Cluster of Wainner | Cervical Radicular Syndrome 2025
Anonim

Les gens ont tendance à former des communautés - des groupes d'autres personnes qui ont des idées et des sentiments. En étudiant ces groupes, il devient plus facile d'attribuer certains comportements au groupe dans son ensemble (bien que l'attribution du comportement à un individu soit à la fois dangereuse et peu fiable).

L'idée derrière l'étude des grappes est que si une connexion existe entre les gens, ils ont souvent un ensemble commun d'idées et d'objectifs. En trouvant des groupes, vous pouvez déterminer ces idées en inspectant l'appartenance à un groupe. Par exemple, il est courant d'essayer de trouver des groupes de personnes dans la détection de fraude d'assurance et l'inspection fiscale. Des groupes inattendus de personnes pourraient soulever des soupçons sur le fait qu'ils font partie d'un groupe de fraudeurs ou d'escrocs fiscaux parce qu'ils n'ont pas les raisons habituelles pour que les gens se rassemblent dans de telles circonstances.

Les graphiques d'amitié peuvent représenter la façon dont les gens se connectent les uns aux autres. Les sommets représentent les individus et les bords représentent leurs connexions, telles que les relations familiales, les contacts professionnels ou les liens d'amitié. Généralement, les graphiques d'amitié sont non dirigés parce qu'ils représentent des relations mutuelles, et parfois ils sont pondérés pour représenter la force du lien entre deux personnes.

De nombreuses études se concentrent sur les graphes non orientés qui se concentrent uniquement sur les associations. Vous pouvez également utiliser des graphes orientés pour montrer que la personne A connaît la personne B, mais que la personne B ne sait même pas que la personne A existe. Dans ce cas, vous avez réellement 16 types de triades à considérer.

Lorsque vous recherchez des grappes dans un graphe d'amitié, les connexions entre les noeuds de ces grappes dépendent de triades, essentiellement des triangles spéciaux. Les connexions entre trois personnes peuvent tomber dans ces catégories:

  • Fermé: Les trois personnes se connaissent. Pensez à un cadre familial dans ce cas, où tout le monde connaît tout le monde.
  • Ouvrir: Une personne connaît deux autres personnes, mais les deux autres personnes ne se connaissent pas. Pensez à une personne qui connaît une personne au travail et une autre personne à la maison, mais la personne au travail ne sait rien de l'individu à la maison.
  • Paire connectée: Une personne connaît l'une des autres personnes d'une triade mais ne connaît pas la troisième personne. Cette situation implique deux personnes qui connaissent quelque chose l'une à l'autre et rencontrent quelqu'un de nouveau - quelqu'un qui veut potentiellement faire partie du groupe.
  • Non connecté: La triade forme un groupe, mais personne dans le groupe ne se connaît. Ce dernier peut sembler un peu étrange, mais pensez à une convention ou à un séminaire.Les gens de ces événements forment un groupe, mais ils peuvent ne rien savoir l'un de l'autre. Cependant, parce qu'ils ont des intérêts similaires, vous pouvez utiliser le clustering pour comprendre le comportement du groupe.

Les triades se produisent naturellement dans les relations, et de nombreux réseaux sociaux sur Internet ont exploité cette idée pour accélérer les connexions entre les participants. La densité des connexions est importante pour tout type de réseau social, car un réseau connecté peut diffuser des informations et partager du contenu plus facilement. Par exemple, lorsque LinkedIn, le réseau social professionnel, a décidé d'augmenter la densité de connexion de son réseau, il a commencé par rechercher des triades ouvertes et essayer de les fermer en invitant les gens à se connecter. La clôture des triades est à la base de l'algorithme de suggestion de connexion de LinkedIn. Vous pouvez en découvrir plus sur la façon dont cela fonctionne en lisant la réponse de Quora.

L'exemple ici repose sur le graphe d'échantillon du Zachary's Karate Club. C'est un petit graphique qui vous permet de voir comment fonctionnent les réseaux sans passer beaucoup de temps à charger un grand ensemble de données. Heureusement, cet ensemble de données apparaît dans le paquet networkx . Le réseau Zachary's Karate Club représente les relations amicales entre 34 membres d'un club de karaté de 1970 à 1972. Le sociologue Wayne W. Zachary l'a utilisé comme sujet d'étude. Il a écrit un article intitulé «Un modèle de flux d'information pour les conflits et la fission dans les petits groupes. "Le fait intéressant à propos de ce graphique et de son article est que dans ces années, un conflit a surgi dans le club entre l'un des instructeurs de karaté (numéro de noeud 0) et le président du club (numéro de noeud 33). En groupant le graphique, vous pouvez presque parfaitement prédire la division du club en deux groupes peu après l'événement.

Comme cet exemple dessine également un graphique montrant les groupes (pour que vous puissiez les visualiser plus facilement), vous devez également utiliser le paquet matplotlib . Le code suivant montre comment représenter graphiquement les noeuds et les arêtes de l'ensemble de données.

import réseaux comme nx

import matplotlib. pyplot comme plt

% matplotlib inline

graphe = nx. karate_club_graph ()

pos = nx. spring_layout (graphique)

nx. draw (graph, pos, with_labels = Vrai)

plt. show ()

Pour afficher le graphique à l'écran, vous devez également fournir une disposition qui détermine comment positionner les nœuds à l'écran. Cet exemple utilise l'algorithme dirigé par la force de Fruchterman-Reingold (l'appel à nx. Spring_layout ). La figure montre la sortie de l'exemple. (Votre sortie peut être légèrement différente.)

Un graphique montrant les grappes réseau de relations entre amis.

L'algorithme dirigé par la force de Fruchterman-Reingold pour générer des mises en page automatiques de graphes crée des mises en page compréhensibles avec des nœuds et des arêtes séparés qui tendent à ne pas se croiser en imitant ce qui se passe en physique. En regardant la sortie du graphique, vous pouvez voir que certains nœuds ont une seule connexion, deux ou deux.Les bords forment des triades, comme mentionné précédemment. Cependant, la considération la plus importante est que la figure montre clairement le regroupement qui se produit dans un réseau social.

Clustering Réseaux sociaux dans les groupes - dummies

Le choix des éditeurs

Magasin de données ou entrepôt de données? - les mannequins

Magasin de données ou entrepôt de données? - les mannequins

L'idée d'un dépôt de données n'est guère révolutionnaire, malgré ce que vous pourriez lire sur les blogs et dans la presse spécialisée, et ce que vous pourriez entendre lors de conférences ou de séminaires. Un magasin de données est simplement un entrepôt de données réduit - c'est tout. Les vendeurs font de leur mieux pour définir des ...

Classer Votre Entrepôt de données - mannequins

Classer Votre Entrepôt de données - mannequins

Bien que vous devez vous assurer que votre entrepôt de données correspond à vos besoins uniques, certaines directives peuvent vous aider. vous déterminez la complexité probable de son environnement et de sa structure. Une bonne configuration consiste à utiliser une classification à trois niveaux pour la planification d'un entrepôt de données. En déterminant une catégorie probable pour une mise en œuvre, vous pouvez avoir ...

Business Intelligence Architecture et Data Warehousing - Mannequins

Business Intelligence Architecture et Data Warehousing - Mannequins

Les débuts du Business Intelligence (toute variété sauf data mining) avait une forte saveur client / serveur de première génération à deux niveaux. (Certains environnements d'intelligence d'affaires qui étaient hébergés sur un mainframe et qui effectuaient des requêtes et des rapports étaient construits avec une architecture centralisée.) Conceptuellement, les premières architectures d'intelligence d'affaires avaient du sens, compte tenu de l'état de l'art ...

Le choix des éditeurs

Câblage réseau pour l'examen de certification Cisco ICND1 - mannequins

Câblage réseau pour l'examen de certification Cisco ICND1 - mannequins

L'examen de certification ICND1 vous teste sur les différents types de câblage utilisé dans différents scénarios de réseau. Voici quelques points clés à retenir sur le câblage réseau. Rollover Cable: Un câble de survol est aussi connu comme un câble de console et obtient le nom rollover parce que l'ordre des fils d'un ...

Pour la certification compTIA A + - mannequins

Pour la certification compTIA A + - mannequins

Les examens A +, y compris le réseau local (LAN) et le réseau étendu (WAN): LAN: Un réseau local (LAN) est un réseau qui implique généralement un immeuble de bureaux ou peut-être même des systèmes en réseau sur un étage. Le principal point à retenir lors de l'identification ...

Outils de dépannage réseau - nuls

Outils de dépannage réseau - nuls

Voici une liste d'outils de dépannage courants que vous devriez connaître pour les examens A +. L'un des défis des réseaux de soutien aujourd'hui est de savoir comment les résoudre. Vous trouvez tellement d'aspects du réseau qu'il est difficile de savoir par où commencer votre dépannage. Crimper: A ...

Le choix des éditeurs

En sélectionnant Logiciel de blog hébergé - duos

En sélectionnant Logiciel de blog hébergé - duos

Lorsque vous choisissez de bloguer en utilisant un service de blog hébergé, vous n'avez pas besoin de s'inquiéter de la technologie du logiciel du tout. Vous pouvez vous concentrer sur le sujet de votre prochain article de blog plutôt que sur la manière de configurer un serveur Web. Pour utiliser un logiciel de blog hébergé, connectez-vous à l'outil d'édition, écrivez un ...

Sélectionnant l'hébergement Web pour votre blog WordPress - les nuls

Sélectionnant l'hébergement Web pour votre blog WordPress - les nuls

Après avoir choisi un domaine approprié pour votre blog, vous besoin d'un endroit pour votre installation de WordPress à vivre. N'oubliez pas que vous pouvez également demander à d'autres blogueurs quel hôte ils utilisent et quelle a été leur expérience. Les logiciels Web tels que WordPress ont certaines exigences techniques. Les exigences pour WordPress sont PHP 5. 6 ou plus ...

ÉVolutivité et Mom Blogging - mannequins

ÉVolutivité et Mom Blogging - mannequins

L'évolutivité est l'un de ces mots de jargon MBA-ish absolument ennuyeux que vous n'auriez probablement jamais pense que cela s'appliquerait à un blogueur maman. Mais ce que l'évolutivité signifie vraiment, c'est qu'une entreprise doit avoir une structure en place qui lui permet de croître. Bien sûr, vous voulez augmenter votre revenu - mais vous ...