Table des matières:
- Accéder aux données ouvertes via Open Knowledge
- Trouver des données gratuites sur les données ouvertes de la Banque mondiale
- Données spatiales libres d'OpenStreetMap
- Données. gov est une source formidable si vous recherchez des données gratuites sur les affaires, l'environnement, la santé publique et la recherche et développement (R & D) aux États-Unis. Les données. gov est génial car, en plus des jeux de données tabulaires standard, il offre également des sources de données spatiales que vous pouvez télécharger et utiliser pour l'analyse dans le SIG.
- Les langages de programmation data-friendly, comme R et Python, sont open source et libres d'utilisation pour l'analyse ou le développement d'applications. Les deux langues sont idéales pour l'analyse et la visualisation des données. R a l'avantage d'offrir des capacités plus sophistiquées de visualisation statistique et de données, alors que l'avantage de Python est qu'il est beaucoup plus facile à apprendre que R.
- Si vous ne voulez pas Utilisez du code pour écrire des routines personnalisées pour votre analyse, alors vous pouvez choisir d'utiliser une application Web gratuite à la place. Data Applied offre des fonctionnalités robustes pour créer des tableaux croisés dynamiques, des cartes arborescentes et des prévisions prédictives. Il dispose également de fonctionnalités que vous pouvez utiliser pour la corrélation, les valeurs aberrantes et l'analyse d'association.
- Geocommons est une application de cartographie Web gratuite. Sa caractéristique la plus saillante est l'intégration de graphiques associés et de fonctionnalités Google Earth. Avec Geocommons, vous pouvez télécharger des données et géocoder automatiquement vos identifiants. Vous avez le choix de visualiser des données à l'aide d'un chloroplaste (pour lequel vous pouvez concevoir plusieurs schémas de coloration automatiques ou manuels) ou de visualiser des données à l'aide de bulles et de marqueurs (comme des drapeaux et des gouttelettes).
- Datawrapper est un outil gratuit et open-source que vous pouvez utiliser pour créer des visualisations simples. .Il a deux caractéristiques non trouvées ailleurs - un graphique de données Elut Donut qui ressemble à la disposition de différentes chambres du parlement ou congrès, et une fonctionnalité de mise en évidence facile que vous pouvez utiliser pour souligner la signification fondamentale d'une visualisation de données en mettant en évidence un seul point de données dans un graphique . Datawrapper offre les choix suivants dans le type de graphique de données: Diagrammes à colonnes, Diagrammes à secteurs, Diagrammes de donut, Diagrammes de donut d'élection, Cartes et Diagrammes à barres.
- Infoactif. co est une application de conception de visualisation de données basée sur le Web et à faible coût. Il offre un modèle attrayant mettant en évidence ces textes et visualisations minimalistes de «design plat» qui font fureur ces jours-ci. L'application dispose de fonctionnalités pour ajouter des événements souris, des filtres de données et même des connexions de données à la mise à jour en direct, des sources en ligne telles que Google Sheets.
- ChartBuilder est incroyable car il est encore plus facile de créer des graphiques dans l'application ChartBuilder que dans Microsoft Excel. De plus, les graphiques de ChartBuilder peuvent être plus attrayants et professionnels que ceux conçus dans l'application Excel standard. Vous pouvez utiliser ChartBuilder gratuitement pour créer des graphiques en courbes, des histogrammes, des histogrammes et des diagrammes de dispersion.
Vidéo: Le bagage minimum pour faire de la Data Science 2024
Une excellente chose à propos de la science des données, c'est que vous n'avez pas besoin de dépenser beaucoup d'argent pour les applications et les données sources afin de commencer à en tirer profit. Vous pouvez simplement commencer avec vos propres données et commencer à utiliser des applications open source ou des langages de programmation afin de commencer à obtenir des informations précieuses.
Même des données contextuelles peuvent être collectées gratuitement à partir de sources de données ouvertes. Il est probable que vous obtiendrez de meilleurs résultats plus précis (avec moins d'effort) si vous avez de l'argent à dépenser sur des outils coûteux et des sources de données ciblées avec précision, mais ce n'est absolument pas une exigence absolue.
La plupart des ressources présentées ici sont disponibles dans le cadre de la contribution de l'organisation donatrice au mouvement ouvert - un mouvement qui prône le libre échange de la propriété intellectuelle dans les domaines de l'art, l'éducation, les logiciels, les données et la technologie, entre autres. Les trois principales composantes du mouvement ouvert sont les données ouvertes, l'open source et les connaissances ouvertes.
Les initiatives Open data partent du principe que les données doivent être librement accessibles et accessibles au grand public pour utilisation, réutilisation et republication. Les données ouvertes peuvent être émises en vertu d'une sorte de licence ouverte, mais elles sont généralement libres de droits d'auteur et de restrictions de brevets.
Le mouvement logiciel open source a débuté à la fin des années 1970 et part du principe que les utilisateurs de logiciels devraient pouvoir partager librement des logiciels. Le mouvement de l'open source préconise également que les développeurs devraient être autorisés à créer des œuvres dérivées open-source ou exclusives.
Enfin, le mouvement de la connaissance ouverte s'est positionné au-dessus des autres mouvements ouverts et met en avant l'idée que la connaissance sous toutes ses formes devrait être librement et ouvertement accessible au grand public. Le mouvement de la connaissance ouverte préconise également que les gens devraient être libres d'utiliser, réutiliser, partager et republier ces connaissances.
Accéder aux données ouvertes via Open Knowledge
Le principal promoteur du mouvement des connaissances ouvertes est l'organisation à but non lucratif Open Knowledge. Cette organisation définit les connaissances ouvertes comme des informations utiles, significatives et précieuses dérivées de sources de données ouvertes. Le site Web Open Knowledge est une excellente source de rencontres et de collaboration avec les amateurs de données ouvertes et de science des données.
Trouver des données gratuites sur les données ouvertes de la Banque mondiale
Les données ouvertes de la Banque mondiale constituent une source incroyablement solide de données et de données démographiques sur les pays en développement. Les sujets abordés comprennent la santé, les infrastructures, la pauvreté, le commerce, le développement urbain, l'agriculture et le développement rural, et l'environnement, entre autres.Les données sur les indicateurs de la Banque mondiale sont également rendues publiques. Ce sont de bonnes bases pour faire une analyse comparative entre les pays en développement.
Données spatiales libres d'OpenStreetMap
OpenStreetMap (OSM) est une excellente source de données géographiques libres et ouvertes que vous pouvez utiliser pour analyser des données dans des systèmes d'information géographique (SIG) ou pour développer des applications Web géolocalisées. Sur la page Exportation OSM, vous pouvez télécharger l'intégralité de la base de données (massive) des données spatiales OSM. (Pour télécharger des extraits de données provenant uniquement des continents, pays et villes que vous souhaitez, utilisez l'option Téléchargements Geofabrik, vous pouvez également utiliser la fonction Extraits Metro d'OSM pour télécharger des données métropolitaines sur les plus grandes villes du monde). données gouvernementales provenant des données. gov
Données. gov est une source formidable si vous recherchez des données gratuites sur les affaires, l'environnement, la santé publique et la recherche et développement (R & D) aux États-Unis. Les données. gov est génial car, en plus des jeux de données tabulaires standard, il offre également des sources de données spatiales que vous pouvez télécharger et utiliser pour l'analyse dans le SIG.
Calculer avec des langages nés du mouvement open source
Les langages de programmation data-friendly, comme R et Python, sont open source et libres d'utilisation pour l'analyse ou le développement d'applications. Les deux langues sont idéales pour l'analyse et la visualisation des données. R a l'avantage d'offrir des capacités plus sophistiquées de visualisation statistique et de données, alors que l'avantage de Python est qu'il est beaucoup plus facile à apprendre que R.
Analyser les données gratuitement avec l'application Data Applied
Si vous ne voulez pas Utilisez du code pour écrire des routines personnalisées pour votre analyse, alors vous pouvez choisir d'utiliser une application Web gratuite à la place. Data Applied offre des fonctionnalités robustes pour créer des tableaux croisés dynamiques, des cartes arborescentes et des prévisions prédictives. Il dispose également de fonctionnalités que vous pouvez utiliser pour la corrélation, les valeurs aberrantes et l'analyse d'association.
Créer des cartes avec Geocommons
Geocommons est une application de cartographie Web gratuite. Sa caractéristique la plus saillante est l'intégration de graphiques associés et de fonctionnalités Google Earth. Avec Geocommons, vous pouvez télécharger des données et géocoder automatiquement vos identifiants. Vous avez le choix de visualiser des données à l'aide d'un chloroplaste (pour lequel vous pouvez concevoir plusieurs schémas de coloration automatiques ou manuels) ou de visualiser des données à l'aide de bulles et de marqueurs (comme des drapeaux et des gouttelettes).
Geocommons vous permet également d'insérer un simple graphique linéaire, graphique à barres, diagramme à colonnes ou nuage de points (généralement pas quelque chose de facile à faire sur une carte) pour montrer la relation entre deux variables quantitatives. Enfin, Geocommons intègre des visualisations de zones ou de zones avec Google Earth afin que vous puissiez visualiser vos données spatiales sur une représentation sphérique, rotative et zoomable de la planète. (Notez que, pour utiliser cette fonctionnalité, vous devez installer le plug-in Google Earth.)
Créer des maps avec Datawrapper
Datawrapper est un outil gratuit et open-source que vous pouvez utiliser pour créer des visualisations simples..Il a deux caractéristiques non trouvées ailleurs - un graphique de données Elut Donut qui ressemble à la disposition de différentes chambres du parlement ou congrès, et une fonctionnalité de mise en évidence facile que vous pouvez utiliser pour souligner la signification fondamentale d'une visualisation de données en mettant en évidence un seul point de données dans un graphique. Datawrapper offre les choix suivants dans le type de graphique de données: Diagrammes à colonnes, Diagrammes à secteurs, Diagrammes de donut, Diagrammes de donut d'élection, Cartes et Diagrammes à barres.
Créez de superbes infographies interactives avec Infoactive. co
Infoactif. co est une application de conception de visualisation de données basée sur le Web et à faible coût. Il offre un modèle attrayant mettant en évidence ces textes et visualisations minimalistes de «design plat» qui font fureur ces jours-ci. L'application dispose de fonctionnalités pour ajouter des événements souris, des filtres de données et même des connexions de données à la mise à jour en direct, des sources en ligne telles que Google Sheets.
Connexion de votre Infoactive. La co-infographie vers des données stockées dans une feuille Google peut produire des résultats dynamiques. Chaque fois que la feuille de calcul est mise à jour, la visualisation Infoactive est mise à jour en même temps.
Infoactif. co offre de nombreux choix dans le type de graphique de données - y compris les graphiques à colonnes, les camemberts, les diagrammes en anneau, les icônes en pourcentage, les graphiques en courbes, les graphiques en aires, les cartes et les diagrammes à barres. Aussi, juste un petit mot sur Infoactive. co - le démarrage est né à la suite d'une campagne réussie Kickstarter! ! Cela montre que vous ne pouvez jamais prédire d'où viendra le succès.
Graphique avec ChartBuilder
ChartBuilder est incroyable car il est encore plus facile de créer des graphiques dans l'application ChartBuilder que dans Microsoft Excel. De plus, les graphiques de ChartBuilder peuvent être plus attrayants et professionnels que ceux conçus dans l'application Excel standard. Vous pouvez utiliser ChartBuilder gratuitement pour créer des graphiques en courbes, des histogrammes, des histogrammes et des diagrammes de dispersion.
De plus, l'application vous permet de faire des opérations simples de copier-coller pour importer vos données et ensuite générer des résultats utilisables en quelques secondes. Bien que le site n'offre pas de fonctionnalités de stockage de données, vos visualisations peuvent être téléchargées en un seul clic, sous la forme d'images bitmap ou de graphiques vectoriels SVG.