Cristal collectif | Plateforme COCOON, Collection de Corpus Oraux Numériques

Distinctions Sciences humaines & sociales

Hébergée par l’infrastructure Huma-Num et coordonnée par le Laboratoire Ligérien de Linguistique (LLL) et le laboratoire Langues et Civilisations à Tradition Orale (LACITO), la plateforme COCOON - pour « COllections de COrpus Oraux Numériques » - offre aux chercheurs un accompagnement complet, de la collecte des données jusqu’à leur archivage. Son ambition : préserver la mémoire orale en garantissant la pérennité et l’accessibilité des enregistrements audio ou vidéo.

Comment conserver et valoriser du patrimoine humain que représentent les corpus oraux ? Depuis 2006, COCOON répond à ce besoin d’archivage pérenne et de diffusion des archives de la parole. Inscrite dans une démarche de science ouverte, la plateforme repose sur une collaboration étroite entre ingénieurs, techniciens et chercheurs. A travers à des événements comme les "Datathons de la parole", l’équipe de COCOON encourage ainsi le dépôt, la citation et la réutilisation des corpus, faisant travailler ensemble autour de données réelles, des agents aux fonctions, disciplines et métiers différents. Aujourd’hui, la plateforme conserve plus de 50 collections et 17 500 enregistrements, soit près de 6 750 heures d’écoute dans 310 langues dont des collections emblématiques comme l’Enquête Sociolinguistique à Orléans (ESLO) offrant 700 heures de témoignages, ou encore la collection Pangloss, archive ouverte de langues rares. Les données sont conservées temporairement au Centre Informatique National de l’Enseignement supérieur avant leur transfert aux Archives nationales.

Sur la scène européenne, COCOON est aussi l’un des correspondants de l’infrastructure de recherche CLARIN, qui facilite l’accès des chercheurs aux ressources linguistiques numériques à travers l’Europe. Son rayonnement international est aussi avéré à travers, par exemple, l’intégration de la collection Pangloss au réseau DELAMAN regroupant les acteurs majeurs du domaine des langues en danger. Durant ses 18 ans de fonctionnement, la plateforme COCOON a vu ses corpus, ses déposants et ses utilisateurs croître régulièrement. Parallèlement, elle s’est adaptée aux changements technologiques tout optimisant ses fonctionnalités. « Ce travail collectif illustre les apports que seul le décloisonnement entre les laboratoires ainsi qu’entre les institutions du monde de la culture et de la recherche a rendu possible » souligne l’équipe. Grâce à l’engagement et l’expertise de son équipe, COCOON est ainsi devenue un acteur incontournable dans la préservation et la valorisation des langues et cultures, fournissant aux chercheurs des ressources inestimables pour les générations futures.