Les données


Globe terrestre par Delamarche, 1808 - BnF

L’information géographique est la représentation d’un objet ou d’un phénomène réel ou imaginaire, présent, passé ou futur, localisé dans l’espace à un moment donné (on parle de géolocalisation).

Elle contient une information liée à sa position sur le globe (ou plus généralement dans l’espace) : sa géométrie et des informations descriptives sémantiques qui indiquent sa nature, son aspect, ses propriétés, etc. On parle d’attributs.
Dans certains cas, elle peut également contenir des relations avec d’autres objets : c’est le niveau topologique (le sens de parcours, la communication ou non dans un réseau, etc.). Certaines de ces relations peuvent se déduire de la géométrie des objets (inclusions, adjacences, etc.), d’autres nécessitent un encodage particulier.

On parlera de données vecteur pour les distinguer des données image (ou raster).

La géométrie

Points, lignes et surfaces sont les trois possibilités d’implémentation sur un espace en deux dimensions.
Ce sont des figurés polysémiques qu’on interprète tantôt comme la représentation des objets dans l’espace réel (forme), tantôt comme la variable qui exprime les rapports de ces objets entre eux (position).


Barre d’outils de saisie de la géométrie dans Ma carte

Suivant l’échelle ou le degré d’abstraction, l’une ou l’autre de ces implémentations pourra être utilisée pour un même objet. Ainsi, un point peut représenter une maison, un îlot urbain, une agglomération, etc. suivant l’échelle de la carte. Selon le point de vue, une route va être vue comme une surface par le cantonnier qui doit la goudronner ou par une ligne reliant deux villes pour l’automobiliste qui la parcourt.

le point

Le point traduit aussi bien un objet concret localisé, qu’un objet conçu intellectuellement. Il définit les coordonnées géographiques mais peut aussi exprimer une dynamique (pôle de dispersion ou d’attraction).
Si on introduit une quatrième dimension (le temps) le point peut être l’emplacement d’un évènement le long d’une ligne à un temps ou une distance donnée (pointeur kilométrique).
Il peut être déduit d’une surface (barycentre ou centroïde) pour en simplifier la représentation à certaines échelles.

la ligne

La ligne peut représenter un axe qui relie deux ou plusieurs points. C’est la représentation d’objets géographiques trop étroits pour être décrits sous forme de surfaces (axe de route, cours d’eau). Elle peut figurer une frontière entre deux surfaces, une limite entre des ensembles. Elle peut aussi être la représentation de flux.

Lorsque les lignes sont reliées entre elles, elles peuvent former un réseau (hydrographique, routier) avec de nouvelles particularités (relation topologie en particulier).

la surface

La surface (ou polygone) apparaît sur la carte comme une unité distinctive d’un ensemble (fleuve, mer, lac), comme une zone étendue ayant un ensemble de propriétés homogènes (même occupation du sol, même réglementation urbaine, etc.).

Les surfaces peuvent être trouées (cas d’une clairière dans une forêt) ou constituées de plusieurs polygones (cas d’un territoire avec une enclave ou une île).

l’annotation

En cartographie, on peut ajouter l’annotation à cette liste. Généralement associée à une des géométrie précédemment citée, elle se caractérise par le fait qu’elle est représentée sur la carte par un texte et non par la géométrie qu’elle supporte. Elle peut désigner un nom de lieu ou de région (toponyme) ou une valeur de l’objet qu’elle représente (cote, température). Suivant l’objet qu’elle désigne, elle va prendre la taille, la forme ou la direction de celui-ci pour le caractériser au mieux (toponyme de forêt ou de mer, nom des routes).


Philémon - Le Naufragé du A, Fred 1965, ed. Dargaud

Elle peut avoir une représentation distincte de l’objet qu’elle désigne et avoir une géométrie différente (ligne dans une surface), pour des raisons de lisibilité ou pour permettre de la manipuler différemment de l’objet qu’elle représente (afficher/masquer, faire apparaître à partir d’un certain zoom, etc.).


L’annotation du bassin de Thau sur la carte IGN s’appuie sur une géométrie linéaire, alors qu’il désigne une surface, pour en figurer l’extension.

les attributs

Les attributs stockent le descriptif des objets géographiques, par exemple, le numéro d’une parcelle, le nom d’une route ou le nombre d’habitants d’une localité.

Ils se déclinent en trois types de données : descriptives (qui décrivent l’objet en propre), qualitatives (qui décrivent des qualités ou catégories d’un objet) et quantitatives (qui mesurent un phénomène).

les données descriptives

Ce sont des données propres à l’objet, son nom, un code INSEE, etc. et non partagées avec les autres objets. Elles vont permettre de qualifier l’objet et de le distinguer des autres en apportant une information à l’utilisateur.

les données qualitatives

Ce type de données indique l’affectation d’une information à une nomenclature (typologie, classe). Il peut s’agir de données chiffrées (classe) ou de données non numériques (qualité).
Elle doit être partagée avec d’autres objets ce qui va permettre de qualifier et regrouper les objets entre eux.

On distingue les données qualitatives nominales, qui n’ont pas de notion d’ordre (l’occupation ou la nature du sol, le type de service ou de commerce) et les données qualitatives ordinales, que l’on peut classer par ordre croissant ou décroissant (petit / moyen / grand, hameau / commune / préfecture / capitale, etc.)

Données nominales

Point Ligne Surface

Données ordinales

Point Ligne Surface

les données quantitatives

Les données quantitatives expriment une information issue d’une mesure (superficie) ou d’un dénombrement (population).

Données quantitatives

Point Ligne Surface
production
écoulement
précipitations

On distingue les données quantitatives absolues (population, nombre de commerces) et relatives qui représentent un rapport d’une donnée absolue sur un référentiel (densité, taux).

la discrétisation

Principalement utilisée en statistiques, la discrétisation est une réduction de l’information pour apporter une simplification dans le but, généralement, d’améliorer la lisibilité. Cela va permettre de découper une série statistique en classes ou transformer une variable continue en variable discrète plus facilement interprétable.

Le choix des classes (regroupement), séries (combinaisons de données) ou seuils (limites entre deux classes) est primordial et est nécessairement un compromis entre la rigueur mathématique et la représentation cartographique.

les couches

Les données géographiques (géométrie et attributs) sont regroupées dans des couches pour en faciliter la gestion. Pour des raisons de commodité, celles-ci forment un regroupement thématique ou organisationnel qui permet de manipuler d’un bloc l’ensemble les données qu’elles contiennent (afficher, changer l’ordre d’affichage, appliquer une symbolisation, etc.).
Une couche peut parfois se limiter à un type de géométrie spécifique (couche de point, couche d’annotations) et avoir un ensemble d’attributs ou de règles de représentation spécifiques et imposées.

Les couches de référence ou de dessin sont disponibles dans le gestionnaire de couche (pour en modifier l’ordre, la visibilité ou la transparence par exemple). Elles sont parfois appelées “calques” par analogie au papier calque qu’on superpose dans un processus de reproduction pour former une image.


Gestionnaire de couche de Ma carte

Où trouver des données ?

Si on peut saisir des objets à la main dans les éditeurs cartographiques, la question qui se pose assez rapidement est « Où trouver des données ? »
C’est d’autant plus légitime qu’avec l’ouverture des données (mouvement open data) le nombre d’organismes et de plateformes proposant de télécharger des données s’est multiplié sur le web.
En dehors des flux cartographiques mis à disposition que nous avons vus précédemment, il est aujourd’hui possible de télécharger directement des données à caractère géographique via des fichiers diffusés sur le net. On distinguera les formats de données géographiques, exploitables directement, qui contiennent la représentation géométrique des objets et les données attributaires qui demanderont un traitement préalable pour être affichés sur une carte.

Les données géographiques

Ces données contenant toute l’information nécessaire à la géographique, il suffit généralement de glisser-déposer le fichier sur l’éditeur de cartes pour les voir s’afficher sur la carte.

A l’inverse, vous pouvez exporter les données saisies dans Ma carte dans le dialogue de configuration de la couche ( dans le gestionnaire de calques) en cliquant sur l’icône d’export .

le GPX

Le format GPX, acronyme de GPS eXchange Format, est le format de prédilection des GPS et autres appareils permettant d’enregistrer votre localisation.
Le fichier GPX enregistre la liste des points de cheminement (latitude, longitude, altitude et éventuellement un horodatage) et conviendra pour échanger des points de rendez-vous ou des parcours.

Il peut contenir des points (waypoint) ou des lignes, sous forme d’itinéraires (routes) ou de traces (tracks). Il ne peut pas contenir de surfaces.

le KML

Le format KML, pour Keyhole Markup Language, est destiné à la gestion de l’affichage de données géospatiales. Il permet de stocker toutes les données géospatiales ainsi que des informations sur le style (couleur, largeur de ligne, etc.).
Initialement développé par la société Keyhole Inc. (rachetée par Google en 2004), il est, depuis 2008, normalisé par l’Open Geospatial Consortium.

le GeoJSON

Le GeoJSON (litt. JSON géographique) est le format ouvert par excellence des données géospatiales sur le web. Extensible, il peut décrire tout type d’information géographique et, lorsque vous en avez la possibilité, c’est le format à privilégier.

le format shape

Le Shapefile (litt. fichier de formes) est un format de fichier pour les systèmes d’informations géographiques (SIG). Initialement développé par ESRI pour ses logiciels commerciaux, ce format est désormais devenu un standard de facto, dont les spécifications sont ouvertes.

Si son extension est classiquement SHP, il est en fait constitué de plusieurs fichiers dont un fichier qui stocke la donnée attributaire (dbf) et la géométrie (shx), ce qui complique son utilisation dans des outils web.

Il n’est pas reconnu par Ma carte et il faudra passer par une application tierce pour le transformer en GeoJSON par exemple.

les Géopackages

Le GeoPackage (litt. geo-paquet) est un format de fichier pour les systèmes d’informations géographiques (SIG). Un GeoPackage (*.gpkg) est construit comme un fichier de base de données SQLite qui contient les tables de données. Spécialement conçu pour être aussi léger que possible, il se présente sous la forme d’un fichier unique, ce qui le rend particulièrement efficace.

Il n’est pas reconnu par Ma carte.

les flux WFS

Ce ne sont pas à proprement parlé des fichiers de données (puisque ce sont des flux) mais, comme ils intègrent des données vecteurs, on peut y récupérer de l’information utile dans Ma carte. Pour cela, il vous suffira d’ajouter la couche WFS à la carte, de sélectionner le ou les objets qui vous intéressent et de les copier-coller dans votre couche de dessin. Ils seront accessibles comme des objets standards et vous pourrez les modifier à votre guise (et supprimer la couche WFS quand vous n’en aurez plus l’utilité).

le format carte

Utilisé par Ma carte, ce type de fichier permet de stocker l’ensemble des informations d’une carte (configuration, couches, etc.), ce qui peut s’avérer pratique pour le transmettre à d’autres ou faire une sauvegarde.
Lors d’un glisser-déposer dans l’éditeur de ce type de fichier, vous pouvez recharger toute la carte ou seulement une couche ou la légende ou la bibliothèque de symbole.

Les données attributaires

Contrairement aux données précédentes, celles-ci ne contiennent pas la géométrie des objets qu’elles décrivent, mais seulement une référence à ces objets. Ce sont par exemple des données tabulaires de l’INSEE ou un fichier d’adresse de clients.
Ce sont généralement des fichiers de type tableur dans des formats CSV ou XLS.

Il faudra donc une opération supplémentaire pour associer ces données à l’objet géographique qu’elles désignent. Pour cela, ils doivent contenir une référence à celui-ci sous forme d’un identifiant (code INSEE d’une commune ou d’un département) ou d’une adresse. Dans le premier cas, on fera un appariement (assortir par paires) avec un référentiel existant en utilisant l’identifiant comme clé. Dans le second il faut effectuer un géocodage pour retrouver la position donnée par l’adresse.

apparier des données

L’appariement de données peut se faire au travers de l’outil statistique de Ma carte. Celui-ci permet entre autres d’associer des données tableur sur un certain nombre de référentiels comme les communes françaises (sur le code INSEE), sur les départements (21 = Côte d’or), régions, IRIS, pays (fr = France), etc.

Le principe est d’aller chercher l’objet qui a le code spécifié dans le fichier attributaire dans un référentiel et d’utiliser la géométrie de celui-ci avec les attributs du fichier d’origine. Du fait du changement

géocoder des données

Le géocodage consiste à affecter des coordonnées géographiques (longitude/latitude) à une adresse postale.
Ma carte propose un outil de géocodage qui va permettre de rechercher la position d’une adresse pour l’ajouter aux données issues d’un fichier attributaire.

Attention cependant, cette opération n’est pas magique et l’adresse contenue dans le fichier d’origine doit être suffisamment précise et bien rédigée pour ne pas provoquer une ambiguïté dans la recherche.

Le géocodeur de Ma carte permet de lister et corriger manuellement les adresses trouvées en proposant une qualité de géocodage et des adresses alternatives lorsqu’il y a ambiguïté.

L’outil de Ma carte ne permet que de traiter des adresses situées en France…

Open data et cætera

Les données ouvertes (ou open data) sont des données accessibles au public (entreprises, citoyens, médias, consommateurs, etc.) et peuvent provenir d’institutions publiques (SNCF), de collectivités (régions, communes) ou d’acteurs privés (Airbnb, Uber).
Cela touche des secteurs comme la mobilité, la culture, les commerces, les finances et la politique publique, l’urbanisme, etc.

Ces données pourront vous servir à enrichir vos cartes et vos analyses.

Des sites comme insee.fr ou l’IGN proposent des données géographiques ou statistiques et des référentiels indispensables pour l’analyse de données et la compréhension du territoire national.

Le site data.gouv.fr recense et référence un grand nombre de données à composante géographique.