5,5 M
Réponses
178 000
Répondants
90
Questions
7920
Localités

Origine des données

Les données traitées sur cette plateforme proviennent des réponses déposées dans l’espace « propositions » du Grand Débat National. Ces données sont les données les plus récentes, pour les quatre thématiques, qui sont mises à disposition sur le site du Grand Débat.

Les données issues des réunions locales n’ont pas été ajoutées pour l’instant. La diversité des formats des comptes rendus rend l’ajout particulièrement complexe. De plus, du fait du nombre plus réduit de réunions locales (<10000), le besoin d’un moteur de recherche est moins pressant que pour les contributions individuelles, bien plus nombreuses. Elles pourront toutefois être ajoutées si les citoyens, élus et journalistes estiment cet ajout nécessaire et prioritaire. De la même manière, les données du « Vrai Débat » pourront être ajoutées.

Nous avons également intégré à la plateforme les annotations recueillies via le dispositif La Grande Annotation.

Pré-traitement des données

Suppression des doublons

Le cœur de la philosophie de democratie.app est de donner un accès personnalisé aux réponses des Français, sans les dénaturer. De ce fait, les retraitements sur les données ont été réduits à l’essentiel. Nous avons simplement supprimé les multiples envois de leur formulaire de réponses que certains auteurs ont pu faire, en ne conservant que le dernier envoi.

Enrichissement des données géographiques

L’unique information géographique à disposition dans les données du Grand Débat est le code postal de l’auteur. Ce choix crée des difficultés, pour réassocier le code postal à une ville, pour plusieurs raisons :
- Un code postal peut être associé à plusieurs communes
- Certaines communes comptent plusieurs codes postaux

De ce fait, quand un code postal est associé à plusieurs communes, nous avons décidé arbitrairement de l’associer à l’une d’entre elles, et ce pour éviter des doublons en cas de multiple association. Une fois une commune associée à une contribution, nous récupérons la latitude et la longitude de la commune à partir d’une base accessible en open data que nous avons retraitée pour la mettre à jour.

Pour la constitution de l’espace élus, la problématique est plus complexe encore, puisque certains codes postaux sont associés à plusieurs circonscriptions. Dans ce cas, à la demande des députés qui privilégient l’exhaustivité, nous avons associé la contribution à l’ensemble des circonscriptions auxquelles elle était susceptible d’appartenir du fait de son code postal.

Analyse de sentiments

L’analyse de positivité des différentes réponses est faite à partir de l’algorithme TextBlob.

Nuage de thèmes

Lors d’une recherche, le nuage de thème fait apparaître les mots qui sont sur-représentés dans les réponses à la requête, par rapport à l’ensemble de la base des contributions au Grand Débat.

Contributions affichées

Les contributions affichées sont celles qui font figurer les termes de la recherche, moyennant quelques modifications, ayant pour objectif d’améliorer la pertinence des résultats :
- Suppression des « stop-words », ces mots de liaison extrêmement fréquents dans la base qui n’ajoutent pas de sens dans le cadre de ce type de requête (« ils », « elles », « que », « à », etc.)
- Prise en compte des synonymes (« très » sera considéré comme équivalent à « beaucoup »)

Licences

L'ensemble des données téléchargeables sur le site democratie.app sont placées sous licence ouverte Etalab.