Une réalisation du laboratoire LACITO-CNRS

Depuis 1976, le LACITO explore la diversité des langues et des civilisations à tradition orale. Le laboratoire a lancé en 1995 un projet d'archivage des données orales recueillies. Ce projet a adopté en 2012 le nom "collection Pangloss".

Une archive ouverte pour la sauvegarde du patrimoine linguistique mondial

Ici aussi le contemporain est un chantier. Mais on y travaille avec des figures et des outils sans âge. Peu de machines. Le monde fait à la main. (Jean-Michel Maulpoix, Au pays de l'eau et du lézard blanc / Xứ sở của nước và thạch sùng, Hà Nội: Nhà xuất bản Thanh Niên, 1999.)

La collection Pangloss rassemble des enregistrements de langues rares. Les documents que le visiteurs peut librement consulter (et télécharger) ici sont le fruit du travail patient de linguistes professionnels qui œuvrent à la collecte, l’étude et la sauvegarde d'un patrimoine linguistique mondial. Cette tâche présente un caractère d'urgence, car la diversité des langues connaît un déclin rapide, parallèle au déclin de la biodiversité.

Dans le cas le plus typique, la langue est étudiée sur le terrain, là où elle coule de source : dans son contexte géographique et social. On pourrait dire, détournant le mot du dialectologue selon lequel chaque mot a son histoire particulière (Jaberg 1908: 6), que chaque document hébergé dans la collection Pangloss a son histoire. Il naît d’une rencontre entre le visiteur-enquêteur et l’auteur du document (le locuteur), dans le cadre de relations de collaboration qui s’étendent souvent sur de nombreuses années. Ainsi, Georges Dumézil désignait le dernier locuteur de la langue oubykh, dont on peut écouter la voix dans la collection Pangloss, comme "mon maître et ami Tevfik Esenç".

La collection Pangloss est le fruit de plus de vingt ans de travaux de chercheurs et d'ingénieurs spécialisés du CNRS. Elle s'agrandit au fil des ans, par des contributions provenant de centres de recherche français et de leurs partenaires dans de nombreux lieux dans le monde.

En 2020, la collection contient environ 780 heures d'écoute dans plus de 170 langues. Environ la moitié des enregistrements (1530 sur 3600) sont transcrits et annotés, permettant à tous les auditeurs de comprendre ce qu'ils écoutent. Le choix des langues de traduction utilisées est laissé à l'appréciation des déposants. Si vous souhaitez proposer une traduction supplémentaire (par exemple, traduire en français l'histoire oubykh La chèvre et le mouton, qui n'a pour l'instant qu'une traduction en anglais), nous vous encourageons à nous contacter. Toutes les contributions sont mentionnées dans la fiche du document (ses métadonnées).

Une archive ouverte au sein d'un Internet libre et décentralisé

Et pourtant, l’Internet libre et décentralisé porte haut ses couleurs.

La Quadrature du Net

Pour consulter le site Pangloss, il n’est pas nécessaire d’accepter de conditions d’utilisation spécifiques. Le site n’utilise pas de cookies et n'enregistre pas l’activité de ses visiteurs. En effet, en cohérence avec son engagement pour une Science ouverte, la collection Pangloss suit les principes fondamentaux que sont la transparence, l’absence d’intrusion dans la vie privée des utilisateurs, et la libre orientation de l’attention.

  • Transparence et respect de la vie privée : aujourd’hui, les grands acteurs d’Internet recueillent des données concernant le comportement de leur utilisateur et les exploitent pour diverses utilisations dont l’utilisateur n’est pas informé. (Voir une vidéo à ce sujet.) Rien de tel sur le site Pangloss : votre parcours n’est pas enregistré. Vos choix au fil de la visite ne fournissent pas matière à un profilage (commercial, politique...).
  • Libre orientation de l'attention : hormis une mise en avant de quelques ressources en page d’accueil, l’interface est neutre, et permet de choisir sur la carte la région qui vous intéresse et le type de documents qu’on souhaite consulter. Dans le même esprit, le mode « pro », destiné aux linguistes et informaticiens, est accessible à qui veut (bouton en haut à droite), sans accréditation ni identification. 

Mais le respect pour nos utilisateurs ne signifie évidemment pas que vos commentaires, vos avis, et le cas échéant vos contributions ne nous intéressent pas ! N’hésitez pas à nous contacter.

D'où vient le nom 'Pangloss' ?

Pangloss vient du grec pan πᾶν ‘tout’ et glossa γλῶσσα ‘langue’, ce qui signifie ‘toutes les langues’. La partie -gloss évoque aussi glossing (interprétation), une des activités du linguiste qui consiste à essayer de rendre le sens original d'un mot dans une langue inconnue.

Le nom fait également penser au personnage de Voltaire, maître Pangloss, dans le conte philosophique Candide ou l'Optimisme, dont la conclusion est « Il faut cultiver notre jardin ». Pour un⸱e linguiste, mettre en ordre ses données de terrain et les déposer dans la collection Pangloss, c'est cultiver son jardin, et c'est contribuer à la croissance d'une archive ouverte à vocation universelle. 

Combien de langues sont représentées sur Pangloss ?

En 2001, la collection Pangloss comptait une centaine de documents (tous transcrits) dans une vingtaine de langues. En 2020, la collection Pangloss dépassait 3600 enregistrements en 170 langues.

Afin d'encourager les dépôts, la collection Pangloss accepte les documents audio et vidéo ne disposant pas encore d'une transcription. La proportion de documents transcrits s'établit autour de 30%.

Que contient la collection Pangloss ?

La collection Pangloss contient des ressources multimédia, le plus souvent des enregistrements audio ou vidéo effectués sur le terrain par des linguistes. Ces enregistrements sont conservés, solidairement des informations qui s'y rapportent (leurs métadonnées), accessibles depuis la page de consultation de l'enregistrement.

La plupart de nos enregistrements audio sont des histoires orales (exemple de Nouvelle Calédonie ici). Une petite partie sont des listes de mots ou autre type d'élicitation (exemple de Chine ici). Un certain nombre de nos ressources sont de nature musicale (exemple du Vanuatu ici). 

L'ensemble des ressources de la Collection sont archivées et rendues accessibles à toutes et tous, même en l'absence de transcription ou de traduction (voir ici un exemple de Guyane). Environ un tiers des ressources sont accompagnées de textes, appelés annotations. Selon ce que la déposante a été en mesure de fournir à ce stade, le texte annoté peut contenir :

En plus de ces corpus audio annotés, la Collection Pangloss accueille une collection de dictionaires en ligne.

Qui a recueilli les documents ?

Les enregistrements audio et vidéo archivés et diffusés via la collection Pangloss ont été recueillis par des chercheuses et chercheurs (linguistes et ethnologues/anthropologues) et leurs collaboratrices et collaborateurs. La collection Pangloss accueille des corpus de chercheuses de diverses institutions, de France et d'autres pays (Canada, Etats-Unis, Allemagne, Pays-Bas, Vietnam, Chine, Singapour, Turquie...).

Référence citée :

Jaberg, Karl. 1908. Sprachgeographie: Beitrag zum Verständnis des Atlas linguistique de la France. Vol. 1. Sauerländer.