Accueil Finances personnelles Comment utiliser Fréquences ou Densités avec vos données dans R - variables

Comment utiliser Fréquences ou Densités avec vos données dans R - variables

Table des matières:

Vidéo: Tutoriel 10 R - Histogramme fréquence et densité avec R 2025

Vidéo: Tutoriel 10 R - Histogramme fréquence et densité avec R 2025
Anonim

En divisant vos données par intervalles dans R, vous perdez encore quelques informations. Cependant, la façon la plus complète de décrire vos données est d'estimer la densité de probabilité (PDF) ou densité de votre variable.

Si ce concept ne vous est pas familier, ne vous inquiétez pas. N'oubliez pas que la densité est proportionnelle à la probabilité que toute valeur de vos données soit approximativement égale à cette valeur. En effet, pour un histogramme, la densité est calculée à partir des comptages, donc la seule différence entre un histogramme à fréquences et une avec densités est l'échelle de l'axe y . Pour le reste, ils ont exactement la même apparence.

Comment créer un diagramme de densité

Vous pouvez estimer la fonction de densité d'une variable à l'aide de la fonction density (). La sortie de cette fonction elle-même ne vous dit pas grand-chose, mais vous pouvez facilement l'utiliser dans un complot. Par exemple, vous pouvez obtenir la densité de la variable de kilométrage mpg comme ceci: >> mpgdens <- densité (voitures $ mpg)

L'objet que vous obtenez de cette façon est une liste contenant beaucoup d'informations que vous n'avez pas vraiment besoin de regarder. Mais cette liste rend le calcul de la densité aussi facile que de dire «tracer la densité»:

plot (mpgdens)
L'intrigue semble un peu rude sur les bords, mais l'important est de voir comment vos données sortent. L'objet densité est représenté sous la forme d'une ligne, avec les valeurs réelles de vos données sur l'axe

x et la densité sur l'axe y . L'objet liste mpgdens contient, entre autres, un élément appelé x et un élément appelé y. Ceux-ci représentent les coordonnées

x - et y pour tracer la densité. Lorsque R calcule la densité, la fonction density () divise vos données en plusieurs petits intervalles et calcule la densité du milieu de chaque intervalle. Ces points médians sont les valeurs de x et les densités calculées sont les valeurs de y.

Comment tracer les densités dans un histogramme

Rappelez-vous que la fonction hist () renvoie les nombres pour chaque intervalle. Maintenant, la probabilité qu'une valeur se situe dans un certain intervalle est directement proportionnelle aux comptages. Plus vous avez de valeurs dans un certain intervalle, plus grande est la probabilité que toute valeur que vous avez choisie se trouve dans cet intervalle.

Ainsi, au lieu de tracer les comptages dans l'histogramme, vous pouvez tout aussi bien tracer les densités. R fait tous les calculs pour vous - la seule chose que vous devez faire est de mettre l'argument freq de hist () à FALSE, comme ceci:

hist (cars $ mpg, col = "gray", freq = FALSE)

Maintenant, l'intrigue sera exactement la même qu'avant; seules les valeurs sur l'axe

y sont différentes.L'échelle sur l'axe y est définie de telle sorte que vous pouvez ajouter le diagramme de densité sur l'histogramme. Pour cela, vous utilisez la fonction lines () avec l'objet density comme argument. Vous pouvez, par exemple, ajouter un peu plus loin à l'histogramme précédent en ajoutant la densité estimée en utilisant le code suivant immédiatement après la commande précédente: >> lignes (mpgdens)

Vous voyez le résultat de ces deux commandes sur le côté droit. Rappelez-vous que lines () utilise les éléments x et y de l'objet densité mpgdens pour tracer la ligne.

Comment utiliser Fréquences ou Densités avec vos données dans R - variables

Le choix des éditeurs

Comment adapter les normes journalistiques aux blogs de maman - Les nuls

Comment adapter les normes journalistiques aux blogs de maman - Les nuls

Alors que les standards journalistiques sont légèrement différents Diffusion, et les organisations en ligne, ils partagent des éléments communs de véracité, la précision, l'objectivité, l'impartialité, l'équité et la responsabilité publique (c'est une citation adaptée de Wikipedia). Surtout, les standards journalistiques établissent une séparation entre les départements qui génèrent des revenus (ventes de publicité et de sponsoring) et les départements qui développent ...

Comment accepter les commentaires des membres de la communauté en ligne - mannequins

Comment accepter les commentaires des membres de la communauté en ligne - mannequins

Comme gestionnaire de communauté en ligne, vous ne pouvez pas avoir peur pour demander des commentaires parce que vous ne voulez pas entendre de mauvaises nouvelles. La réalité est qu'il n'y a pas de mauvaises réactions. Pourtant, lorsque les commentaires négatifs viennent, parfois vous ne pouvez pas vous empêcher de le prendre personnellement. Vous passez tellement de temps à cultiver votre communauté et à promouvoir ...

Comment ajouter NoFollow Tag - mannequins

Comment ajouter NoFollow Tag - mannequins

La balise NoFollow a été créée comme un moyen de divulguer aux moteurs de recherche que, bien que votre site de blogging maman ajoute un lien vers une destination particulière, il n'approuve pas le site de destination. Initialement utilisé pour les commentaires de blog pour lutter contre les spams de commentaires, il protégeait les blogs de se connecter par inadvertance aux ...

Le choix des éditeurs

Ce qu'il faut faire et ne pas faire pour vos tableaux de bord et rapports Excel - les nuls

Ce qu'il faut faire et ne pas faire pour vos tableaux de bord et rapports Excel - les nuls

Les concepts les plus courants utilisés dans les tableaux de bord et les rapports Excel sont le concept de tendances. Une tendance est une mesure de la variance sur un intervalle défini, généralement des périodes telles que des jours, des mois ou des années. Mais construire des composants tendance pour vos tableaux de bord a quelques choses à faire et à ne pas faire. Utilisez les types de graphiques appropriés pour ...

Emplacements de confiance et macros Excel - mannequins

Emplacements de confiance et macros Excel - mannequins

Si l'idée d'un message Macro Excel à venir (même une fois) désorganise vous, configurez un emplacement de confiance pour vos fichiers. Un emplacement approuvé est un répertoire considéré comme une zone sûre dans laquelle seuls les classeurs approuvés sont placés. Un emplacement de confiance vous permet, à vous et à vos clients, d'exécuter un classeur compatible avec les ...

Transformez une colonne de données en deux dans Excel 2016 - des nuls

Transformez une colonne de données en deux dans Excel 2016 - des nuls

Dans une feuille Excel 2016 que vous devez transformer une colonne de données en deux colonnes. Dans le cas des noms, par exemple, il peut être nécessaire de transformer une colonne de noms en deux colonnes, l'une appelée prénom et l'autre nom de famille. Suivez ces étapes dans un fichier Excel ...

Le choix des éditeurs

Dix domaines à couvrir avec les fournisseurs d'entrepôts de données - les nuls

Dix domaines à couvrir avec les fournisseurs d'entrepôts de données - les nuls

Sont dix domaines que vous devriez Discutez avec n'importe quel fournisseur de produits d'entreposage de données, quelle que soit la catégorie de produit (outil d'aide à la décision, outil de middleware ou SGBDR, par exemple) que vous envisagez d'acheter. Il y a aussi une question spécifique que vous pourriez vouloir poser. Toutes ces questions sont quelque peu bizarres car elles ont peu à voir avec ...

L'avenir des entrepôts de données à l'ère du Big Data - mannequins

L'avenir des entrepôts de données à l'ère du Big Data - mannequins

Commencé à changer et à évoluer avec l'avènement du Big Data. Dans le passé, il n'était tout simplement pas rentable pour les entreprises de stocker l'énorme quantité de données provenant d'un grand nombre de systèmes d'enregistrement. Le manque d'architectures de calcul réparties rentables et pratiques a fait que les données ...

Les catégories principales de Business Intelligence - les nuls

Les catégories principales de Business Intelligence - les nuls

Au début de votre projet d'entreposage de données, ne vous concentrez pas sur le type d'outils dont vous avez besoin - pour le moment. Au lieu de cela, concentrez-vous sur les types de questions que les utilisateurs poseront concernant le contenu de l'entrepôt de données, les types de rapports qui seront exécutés et à quelles fins, et les modèles généraux de traitement qui ...