Collection Pangloss | Qui sommes-nous ?

Une réalisation du laboratoire CNRS-LACITO

Depuis 1976, le LACITO explore la diversité des langues et des civilisations à tradition orale. Le laboratoire a lancé en 1995 un projet d'archivage des données orales recueillies. Ce projet a adopté en 2012 le nom "collection Pangloss".

Une archive ouverte pour la sauvegarde du patrimoine linguistique mondial

Il y a plus d'une manière pour la voix humaine de nous prendre – de nous tenir en suspens, pour quelques instants l'oreille miraculeusement contre la porte, sur le seuil d'un monde où tout se passe d'une autre sorte, où le temps revient, où le cours même des choses se livre à volonté, et dont elle nous apporterait le pressentiment dans la pure vibration. (Julien Gracq, La Maison, Paris : éditions Corti, 2023, p. 28.)

La collection Pangloss rassemble des enregistrements de langues rares. Les documents que le visiteur peut librement consulter (et télécharger) ici sont le fruit du travail patient de linguistes professionnels qui œuvrent à la collecte, l’étude et la sauvegarde d'un patrimoine linguistique mondial. Cette tâche présente un caractère d'urgence, car la diversité des langues connaît un déclin rapide, parallèle au déclin de la biodiversité. Chaque langue qui disparaît emporte avec elle un univers de connaissances. Comme la biodiversité, la diversité linguistique est une richesse à préserver et entretenir pour répondre aux défis du présent.

Dans le cas le plus typique, la langue est étudiée sur le terrain, là où elle coule de source : dans son contexte géographique et social. On pourrait dire, détournant le mot du dialectologue selon lequel chaque mot a son histoire particulière (Jaberg 1908: 6), que chaque document hébergé dans la collection Pangloss a son histoire. Il naît d’une rencontre entre le visiteur-enquêteur et l’auteur du document (le locuteur), dans le cadre de relations de collaboration qui s’étendent souvent sur de nombreuses années. Ainsi, Georges Dumézil désignait le dernier locuteur de la langue oubykh, dont on peut écouter la voix dans la collection Pangloss, comme "mon maître et ami Tevfik Esenç".

La collection Pangloss est le fruit de plus de vingt ans de travaux de chercheurs et d'ingénieurs spécialisés du CNRS. Elle s'agrandit au fil des ans, par des contributions provenant de centres de recherche français et de leurs partenaires dans de nombreux lieux dans le monde.

Une archive ouverte au sein d'un Internet libre et décentralisé

Et pourtant, l’Internet libre et décentralisé porte haut ses couleurs. (La Quadrature du Net)

Pour consulter le site Pangloss, il n’est pas nécessaire d’accepter de conditions d’utilisation spécifiques. Le site n’utilise pas de cookies et n'enregistre pas l’activité de ses visiteurs. En effet, en cohérence avec son engagement pour une Science ouverte, la collection Pangloss suit les principes fondamentaux que sont la transparence, l’absence d’intrusion dans la vie privée des utilisateurs, et la libre orientation de l’attention.

Transparence et respect de la vie privée : aujourd’hui, les grands acteurs d’Internet recueillent des données concernant le comportement de leur utilisateur et les exploitent pour diverses utilisations dont l’utilisateur n’est pas informé. (Voir une vidéo à ce sujet.) Rien de tel sur le site Pangloss : votre parcours n’est pas enregistré. Vos choix au fil de la visite ne fournissent pas matière à un profilage (commercial, politique...).
Libre orientation de l'attention : hormis une mise en avant de quelques ressources en page d’accueil, l’interface est neutre, et permet de choisir sur la carte la région qui vous intéresse et le type de documents qu’on souhaite consulter. Dans le même esprit, le mode « pro », destiné aux linguistes et informaticiens, est accessible à qui veut (bouton en haut à droite), sans accréditation ni identification.

Mais le respect pour nos utilisateurs ne signifie évidemment pas que vos commentaires, vos avis, et le cas échéant vos contributions ne nous intéressent pas ! N’hésitez pas à nous contacter.

D'où vient le nom 'Pangloss' ?

Pangloss vient du grec pan πᾶν ‘tout’ et glossa γλῶσσα ‘langue’, ce qui signifie ‘toutes les langues’. La partie -gloss évoque aussi glossing (interprétation), une des activités du linguiste qui consiste à essayer de rendre le sens original d'un mot dans une langue inconnue.

Le nom fait également penser au personnage de Voltaire, maître Pangloss, dans le conte philosophique Candide ou l'Optimisme, dont la conclusion est « Il faut cultiver notre jardin ». Pour un⸱e linguiste, mettre en ordre ses données de terrain et les déposer dans la collection Pangloss, c'est cultiver son jardin, et c'est contribuer à la croissance d'une archive ouverte à vocation universelle.

Combien de langues sont représentées sur Pangloss ?

En 2001, la collection Pangloss comptait une centaine de documents (tous transcrits) dans une vingtaine de langues. En 2024, la collection Pangloss dépasse 5 710 enregistrements dans 252 langues (plus de 1 180 heures d'écoute). Près de la moitié des enregistrements (2 567 sur 5 714) sont transcrits et annotés, permettant à tous les auditeurs de comprendre ce qu'ils écoutent. Le choix des langues de traduction utilisées est laissé à l'appréciation des déposants. Si vous souhaitez proposer une traduction supplémentaire (par exemple, traduire en français l'histoire oubykh La chèvre et le mouton, qui n'a pour l'instant qu'une traduction en anglais), nous vous encourageons à nous contacter. Toutes les contributions sont mentionnées dans la fiche du document (ses métadonnées).

Graphique représentant la croissance du nombre de langues représentées dans la collection Pangloss au fil du temps — Croissance de la collection Pangloss : nombre de corpus

Graphique représentant la croissance du nombre de documents de la collection Pangloss au fil du temps — Croissance de la collection Pangloss : nombre de documents

Mise à jour le 15 janvier 2024

Afin d'encourager les dépôts, la collection Pangloss accepte les documents audio et vidéo ne disposant pas encore d'une transcription.

Que contient la collection Pangloss ?

La collection Pangloss contient des ressources multimédia, le plus souvent des enregistrements audio ou vidéo effectués sur le terrain par des linguistes. Ces enregistrements sont conservés, solidairement des informations qui s'y rapportent (leurs métadonnées), accessibles depuis la page de consultation de l'enregistrement.

La plupart de nos enregistrements audio sont des histoires orales (exemple de Nouvelle Calédonie ici). Une petite partie sont des listes de mots ou autre type d'élicitation (exemple de Chine ici). Un certain nombre de nos ressources sont de nature musicale (exemple du Vanuatu ici).

L'ensemble des ressources de la Collection sont archivées et rendues accessibles à toutes et tous, même en l'absence de transcription ou de traduction (voir ici un exemple de Guyane). Environ un tiers des ressources sont accompagnées de textes, appelés annotations. Selon ce que la déposante a été en mesure de fournir à ce stade, le texte annoté peut contenir :

une transcription brute de l'enregistrement en langue vernaculaire, sans traduction (exemple en japhug)
une transcription accompagnée d'une traduction libre dans une ou plusieurs langues (exemple du Yémen)
une transcription synchronisée, des gloses interlinéaires, et une traduction libre dans une ou plusieurs langues (exemple avec traductions en français; en français & anglais; en anglais; en anglais, italien & allemand; en anglais, français & grec; en chinois mandarin; etc.).

En plus de ces corpus audio annotés, la Collection Pangloss accueille une collection de dictionaires en ligne.

Qui a recueilli les documents ?

Les enregistrements audio et vidéo archivés et diffusés via la collection Pangloss ont été recueillis par des chercheuses et chercheurs (linguistes et ethnologues/anthropologues) et leurs collaboratrices et collaborateurs. La collection Pangloss accueille des corpus de chercheuses de diverses institutions, de France et d'autres pays (Canada, Etats-Unis, Allemagne, Pays-Bas, Vietnam, Chine, Singapour, Turquie...).

Référence citée :

Jaberg, Karl. 1908. Sprachgeographie: Beitrag zum Verständnis des Atlas linguistique de la France. Vol. 1. Sauerländer.