Table des matières:
Vidéo: R Pour La Data Science 2024
R est un langage de programmation écrit à l'origine pour les statisticiens afin d'effectuer des analyses statistiques, y compris des analyses prédictives. C'est un logiciel open-source, largement utilisé dans le milieu universitaire pour enseigner des disciplines telles que les statistiques, la bio-informatique et l'économie. Depuis ses humbles débuts, il a depuis été étendu à la modélisation de données, à l'exploration de données et à l'analyse prédictive.
R a une communauté très active; les contributions de code libre sont faites constamment et régulièrement. L'un des avantages de l'utilisation d'un outil open-source tel que R est que la plupart des analyses de données que vous voulez faire ont déjà été effectuées par quelqu'un. Les échantillons de code sont affichés sur de nombreux forums et par les universités.
Si vous êtes bloqué avec un code problématique, postez simplement une question sur un forum (comme un échange de pile ou un débordement de pile) et vous aurez une réponse en un rien de temps.
Parce que R est gratuit, c'est l'outil parfait pour construire un prototype rapide afin de montrer à la direction les avantages de l'analyse prédictive. Vous n'avez pas à demander à la direction d'acheter quoi que ce soit pour commencer tout de suite. N'importe lequel de vos scientifiques de données, analystes d'affaires, statisticiens, ou ingénieurs de logiciel peut faire le prototype sans n'importe quel investissement supplémentaire dans le logiciel.
R peut donc être un moyen peu coûteux d'expérimenter l'analyse prédictive sans avoir à acheter de logiciels d'entreprise. Une fois que vous avez prouvé que l'analyse prédictive peut ajouter (ou ajouter) de la valeur, vous devriez être en mesure de convaincre la direction d'envisager d'obtenir un outil de qualité commerciale pour votre équipe informatique nouvellement créée.
Comment installer R
Installer R est un processus facile qui prend moins de trente minutes. La plupart des paramètres par défaut peuvent être acceptés pendant le processus d'installation. Vous pouvez installer R en téléchargeant le programme d'installation pour Windows et d'autres systèmes d'exploitation à partir du site Web R.
Après avoir accédé au site Web de R, vous pouvez rechercher le lien de téléchargement pour obtenir le fichier. Après avoir téléchargé le fichier, double-cliquez dessus pour commencer le processus d'installation.
Comment installer RStudio
Après avoir terminé le processus d'installation de R, vous pouvez installer RStudio. L'installation de l'IDE RStudio est aussi simple que l'installation de R. Vous pouvez télécharger RStudio Desktop depuis leur site web. Vous devrez installer la version de bureau appropriée pour votre système d'exploitation (par exemple, RStudio version 0. 97. 551 pour Windows). Après avoir téléchargé le fichier, double-cliquez dessus pour commencer le processus d'installation.
Voici un lien direct pour votre commodité.
Principes de base de l'environnement R
RStudio est une interface utilisateur graphique pour le développement de programmes R. L'interface par défaut (telle qu'elle apparaît lorsque vous démarrez le programme pour la première fois) comporte quatre fenêtres. Vous utiliserez tous les quatre fréquemment.
-
La fenêtre en haut à gauche est votre fenêtre de script.
C'est ici que vous pouvez copier et coller le code R. Vous pouvez exécuter le code ligne par ligne ou en morceaux en mettant en surbrillance les lignes que vous souhaitez exécuter. La fenêtre de script est également où vous pouvez voir les valeurs des trames de données. Lorsque vous cliquez sur un bloc de données dans le volet de l'espace de travail, un nouvel onglet s'ouvre dans le volet de script avec les valeurs du bloc de données.
-
La fenêtre en bas à gauche est la fenêtre de votre console.
C'est là que vous tapez votre code R une ligne à la fois. La sortie (s'il y en a) est imprimée sur la ligne suivante juste après la fin de l'exécution de la commande.
-
La fenêtre en haut à droite est votre espace de travail et votre fenêtre d'historique.
Il comporte deux onglets:
-
L'onglet Historique stocke l'historique de tout le code que vous avez exécuté dans la session en cours.
-
L'onglet Espace de travail répertorie toutes les variables de la mémoire. Ici, vous pouvez cliquer sur les variables pour voir leurs valeurs et (si vous le souhaitez) charger les jeux de données de manière interactive.
-
-
La fenêtre en bas à droite est l'endroit où vous trouverez quatre onglets d'intérêt:
-
Un onglet Aide propose de la documentation telle que la description des fonctions.
-
L'onglet Packages affiche tous les packages installés et disponibles pour être chargés par votre programme. Les paquets vérifiés sont ceux qui ont été chargés pour votre programme à utiliser. Vous pouvez rechercher et installer de nouveaux paquets ici.
-
L'onglet Tracés est l'endroit où la sortie des tracés apparaîtra.
-
L'onglet Fichiers est votre explorateur de fichiers dans RStudio.
-