Accueil Finances personnelles Comment travailler avec des tables de recherche dans R - des variables

Comment travailler avec des tables de recherche dans R - des variables

Table des matières:

Vidéo: Rechercher et supprimer les doublons sur Access 2025

Vidéo: Rechercher et supprimer les doublons sur Access 2025
Anonim

Parfois, faire une fusion complète des données dans R n'est pas exactement ce que vous voulez. Dans ces cas, il peut être plus approprié de faire correspondre les valeurs dans une table de recherche. Pour ce faire, vous pouvez utiliser la fonction match () ou% in%.

Comment trouver une correspondance

La fonction match () renvoie les positions correspondantes de deux vecteurs ou, plus précisément, les positions des premières correspondances d'un vecteur dans le second vecteur. Par exemple, pour trouver quels grands états se produisent également dans la trame de données froide. états, vous pouvez faire ce qui suit:

>> index index [1] 1 4 NA NA 5 6 SO NA NA NA NA
Comme vous le voyez, le résultat est un vecteur qui indique que des correspondances ont été trouvées aux positions un, quatre, cinq et six. Vous pouvez utiliser ce résultat comme index pour trouver tous les grands états qui sont aussi des états froids.

Gardez à l'esprit que vous devez d'abord supprimer les valeurs NA, en utilisant na. omettre (): >> grand. états [na. omit (index),] Nom Zone 2 Alaska 566432 6 Colorado 103766 26 Montana 145587 28 Nevada 109889

Comment donner un sens à% in%


Une alternative très pratique à match () est la fonction% in%, qui retourne un vecteur logique indiquant s'il y a une correspondance.

La fonction% in% est un type spécial de fonction appelé opérateur binaire

Cela signifie que vous l'utilisez en le plaçant entre deux vecteurs, contrairement à la plupart des autres fonctions où les arguments sont entre parenthèses: >> index index [1] TRUE TRUE FALSE FALSE TRUE TRUE FAUX FAUX FAUX FAUX FAUX Si vous comparez cela au résultat de match (), vous voyez que vous avez une valeur TRUE pour chaque valeur non manquante dans le résultat de match (). Ou, pour le mettre en code R, l'opérateur% in% fait la même chose que le code suivant:

>>! est. na (match (cold, états $ nom, grand.table $ nom)) [1] TRUE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE

La fonction match () renvoie les indices des correspondances dans le

deuxième argument

pour les valeurs de l'argument
premier

. D'un autre côté,% in% renvoie TRUE pour chaque valeur de l'argument first qui correspond à une valeur dans l'argument second . L'ordre des arguments est important ici. Parce que% in% renvoie un vecteur logique, vous pouvez l'utiliser directement pour indexer des valeurs dans un vecteur. >> froid. states [index,] Nom Frost 2 Alaska 152 6 Colorado 166 26 Montana 155 28 Nevada 188 Comme mentionné précédemment, la fonction% in% est un exemple d'opérateur binaire dans R. Cela signifie que la fonction est utilisée en mettant entre deux valeurs, comme pour les autres opérateurs, tels que + (plus) et - (moins). Dans le même temps,% in% est dans l'opérateur infixe . Un opérateur infixe dans R est identifiable par les signes de pourcentage autour du nom de la fonction.

Si vous voulez savoir comment% en% est défini, regardez la section détails de sa page d'aide. Mais notez que vous devez placer des guillemets autour du nom de la fonction pour obtenir la page d'aide, comme ceci:? "%dans%".

Comment travailler avec des tables de recherche dans R - des variables

Le choix des éditeurs

Comment adapter les normes journalistiques aux blogs de maman - Les nuls

Comment adapter les normes journalistiques aux blogs de maman - Les nuls

Alors que les standards journalistiques sont légèrement différents Diffusion, et les organisations en ligne, ils partagent des éléments communs de véracité, la précision, l'objectivité, l'impartialité, l'équité et la responsabilité publique (c'est une citation adaptée de Wikipedia). Surtout, les standards journalistiques établissent une séparation entre les départements qui génèrent des revenus (ventes de publicité et de sponsoring) et les départements qui développent ...

Comment accepter les commentaires des membres de la communauté en ligne - mannequins

Comment accepter les commentaires des membres de la communauté en ligne - mannequins

Comme gestionnaire de communauté en ligne, vous ne pouvez pas avoir peur pour demander des commentaires parce que vous ne voulez pas entendre de mauvaises nouvelles. La réalité est qu'il n'y a pas de mauvaises réactions. Pourtant, lorsque les commentaires négatifs viennent, parfois vous ne pouvez pas vous empêcher de le prendre personnellement. Vous passez tellement de temps à cultiver votre communauté et à promouvoir ...

Comment ajouter NoFollow Tag - mannequins

Comment ajouter NoFollow Tag - mannequins

La balise NoFollow a été créée comme un moyen de divulguer aux moteurs de recherche que, bien que votre site de blogging maman ajoute un lien vers une destination particulière, il n'approuve pas le site de destination. Initialement utilisé pour les commentaires de blog pour lutter contre les spams de commentaires, il protégeait les blogs de se connecter par inadvertance aux ...

Le choix des éditeurs

Ce qu'il faut faire et ne pas faire pour vos tableaux de bord et rapports Excel - les nuls

Ce qu'il faut faire et ne pas faire pour vos tableaux de bord et rapports Excel - les nuls

Les concepts les plus courants utilisés dans les tableaux de bord et les rapports Excel sont le concept de tendances. Une tendance est une mesure de la variance sur un intervalle défini, généralement des périodes telles que des jours, des mois ou des années. Mais construire des composants tendance pour vos tableaux de bord a quelques choses à faire et à ne pas faire. Utilisez les types de graphiques appropriés pour ...

Emplacements de confiance et macros Excel - mannequins

Emplacements de confiance et macros Excel - mannequins

Si l'idée d'un message Macro Excel à venir (même une fois) désorganise vous, configurez un emplacement de confiance pour vos fichiers. Un emplacement approuvé est un répertoire considéré comme une zone sûre dans laquelle seuls les classeurs approuvés sont placés. Un emplacement de confiance vous permet, à vous et à vos clients, d'exécuter un classeur compatible avec les ...

Transformez une colonne de données en deux dans Excel 2016 - des nuls

Transformez une colonne de données en deux dans Excel 2016 - des nuls

Dans une feuille Excel 2016 que vous devez transformer une colonne de données en deux colonnes. Dans le cas des noms, par exemple, il peut être nécessaire de transformer une colonne de noms en deux colonnes, l'une appelée prénom et l'autre nom de famille. Suivez ces étapes dans un fichier Excel ...

Le choix des éditeurs

Dix domaines à couvrir avec les fournisseurs d'entrepôts de données - les nuls

Dix domaines à couvrir avec les fournisseurs d'entrepôts de données - les nuls

Sont dix domaines que vous devriez Discutez avec n'importe quel fournisseur de produits d'entreposage de données, quelle que soit la catégorie de produit (outil d'aide à la décision, outil de middleware ou SGBDR, par exemple) que vous envisagez d'acheter. Il y a aussi une question spécifique que vous pourriez vouloir poser. Toutes ces questions sont quelque peu bizarres car elles ont peu à voir avec ...

L'avenir des entrepôts de données à l'ère du Big Data - mannequins

L'avenir des entrepôts de données à l'ère du Big Data - mannequins

Commencé à changer et à évoluer avec l'avènement du Big Data. Dans le passé, il n'était tout simplement pas rentable pour les entreprises de stocker l'énorme quantité de données provenant d'un grand nombre de systèmes d'enregistrement. Le manque d'architectures de calcul réparties rentables et pratiques a fait que les données ...

Les catégories principales de Business Intelligence - les nuls

Les catégories principales de Business Intelligence - les nuls

Au début de votre projet d'entreposage de données, ne vous concentrez pas sur le type d'outils dont vous avez besoin - pour le moment. Au lieu de cela, concentrez-vous sur les types de questions que les utilisateurs poseront concernant le contenu de l'entrepôt de données, les types de rapports qui seront exécutés et à quelles fins, et les modèles généraux de traitement qui ...