Titre Page Corpus

Le projet Trésors de la Parole

Le site "Trésors de la parole" est le fruit d'un partenariat entre le ministère de la Culture (DGLFLF), le CNRS (TGIR Huma-num) et la BNF. Il met à disposition de tous les publics un fonds unique de plus de 2000 heures d'enregistrements sonores et audiovisuels dans plus de 40 langues présentes sur le territoire national, que ce soit des langues régionales comme le breton ou l'occitan, ou des langues non territoriales comme la langue des signes.

Le projet de site internet " Trésors de la parole" a débuté en 2015 dans le cadre des projets expérimentaux du ministère de la Culture. Il fait suite à l'expérimentation "Joconde Lab" et est, comme celle-ci, axée sur les innovations et bénéfices que l'on peut tirer du web sémantique dans le domaine culturel.

Il propose une interface d'exploration et de recherche intuitive et innovante autour des données inédites proposées par le corpus. Ces ressources permettront au grand public de découvrir et d'entendre de nombreuses langues régionales, aux chercheurs d'étudier au plus près chacune des langues présentées sur le "Trésors de la Parole".

Une partie importante des enregistrements présents sur le site sont sous-titrés dans la langue parlée ainsi qu'en français, ce qui permet de comprendre les extraits proposés et d'appréhender leur forme écrite. Le site " Trésors de la Parole" présente par ailleurs de nombreuses informations sur chaque langue présente sur le territoire national hexagonal et de l'outre-mer.

Projet résolument innovant, le site Trésors de la Parole s'appuie sur une toute nouvelle architecture des données, fortement orientée vers les standards du Web sémantique : les données décrivant le corpus, mises au format RDF, sont notamment hébergées dans un entrepôt dit "triple store", librement moissonable (via des requêtes SPARQL), interconnecté aux référentiels VIAF de la BNF et au référentiel Géonames pour la géolocalisation des ressources. Les données sonores et audiovisuelles proprement dites sont quant à elles hébergées sur la plate-forme CoCoon (https://cocoon.huma-num.fr)

Cette expérimentation a été réalisée par l'institut de recherche et d'innovation du Centre Pompidou, partenaire de développement, sous la conduite de la Délégation générale à la langue française et aux langues de France du ministère de la Culture, avec la participation active de la TGIR Huma-Num et de la BNF.  Le site internet est hébergé par les services du ministère de la Culture.

 

Thématiques
Enregistrements
Discours
Mosaïque des langues
Cartographie