XML

Déroulement du projet

Ici on présente nos choix, méthodes et problèmes de réalisation du projet.

Choix

Méthodes

Problèmes

Sources des données

Nos données viennent du site www.data.gouv.fr. On a choisi deux differents sets de données: Le premier, "Base de données accidents corporels de la circulation", au format CSV et le deuxième, "Chiffres départementaux mensuels relatifs aux crimes et délits enregistrés par les services de police et de gendarmerie depuis janvier 1996", au format XLSX.

open data

accidents de voiture

2e set 1er set

Fichier combiné

Ici, nous avons tenté de combiner les deux datasets en un seul. Afin de diminuer la quantité de données et de faciliter les traitements, nous avons décidé de diviser le résultats par départements. Les datasets pour chaque département ont donc été combinées dans un fichier xml pivot par département. Les fichiers peuvent être téléchargés en cliquant les boutons ci-dessus.

XML

Dpt 19 Dpt 13

Définitions

Dans cette étape nous avons écrit les grammaires du xml pivot au format DTD et RelaxNG. Ces fichiers permettent de valider de façon formelle nos résultats.

DTD

RelaxNG

RelaxNG DTD

Manipulations des données

Cette étape a consisté à écrire des logiques de transformations au format XSLT afin d'exporter nos résultats dans des formats autres que XML. Le processeur XSLT prend ce fichier de conversion, un fichier XML de résultats à transformer et crée des fichiers au format CSV, HTML et CSS nécessaires pour la suite de notre étude.

XSLT

Cartes et graphes

Enfin, nous avons tenté d'obtenir une représentation visuelle de nos résultats. Pour ce faire, nous avons utilisé les résultats convertis via le fichier XSLT de l'étape précédente afin d'obtenir un format compatible et profiter d'outils déjà existants, (ex: carte avec Google Maps).

Cartes et graphes

Nous sommes des étudiants en deuxième année de Master en Traitement Automatique des Langues à l'Institut National des Langues et Civilisations Orientales (INALCO) à Paris, en France. Vous pouvez trouver toutes les informations sur notre cursus ici.

INALCO

PluriTAL

Genevieve Bienvenue Alexandre Cavalcante Virginie Poadey

XML

Genevieve Bienvenue & Alexandre Cavalcante & Virginie Poadey