Mon collègue James Lyle parlait récemment des langues en danger sur l’autre blog de notre équipe il y a quelques jours. Je viens de terminer la lecture du nouveau livre de David Harrison, intitulé “When Languages Die – The Extinction of the World’s Languages and the Erosion of Human Knowledge”, que j’ai découvert via le blog de Michael Kaplan. Cet essai fascinant décrit l’extinction graduelle de milliers de langues qui disparaissent petit à petit au profit des langues de plus grande diffusion qui ont tendance à les remplacer. On estime qu’environ 6900 langues différentes étaient parlées sur terre il y a six ans. Harrison nous annonce qu’à la fin du 21e siècle, seule la moitié de ces langues seront encore parlées. Les locuteurs des autres les auront probablement abandonnées en faveur de langues plus connues, plus prestigieuses, plus dominantes. Harrison nous offre une démonstration brillante de ce que représente réellement l’extinction d’une langue. Il décrit de façon approfondie les trésors de connaissances qui seront bientôt perdus et explore les divers systèmes cognitifs (qu’il s’agisse des phases de la lune, des taxonomies populaires, des connaissances nichées au sein des calendriers et des systèmes de mesure du temps traditionnels, des systèmes de dénomination topographique…) et nous montre comment les connaissances culturelles sont intimement liées aux langues et ne pourront plus être transmises lorsque les locuteurs de ces langues auront cessé de les parler. J’ai trouvé la discussion concernant les systèmes de numérotation absolument passionnante. Comme le fait remarquer Harrison, l’étude des systèmes de comptage nous permet de mieux comprendre les mécanismes cognitifs humains et le passage à un système décimal, tout pratique qu’il soit, représente une immense perte de savoir. La démonstration est tout simplement superbe. Harrison conclut qu’il est urgent de documenter les langues et de faire tout notre possible pour les préserver et encourager leurs locuteurs à ne pas les abandonner.

Tout le monde doit jouer son rôle. En tant qu’éditeur de logiciels, nous avons mis sur pied un certain nombre d’initiatives destinées à aider les communautés linguistiques. Ainsi, le Microsoft Local Language Program permet d’offrir les “Language Interface Packs” (packs linguistiques LIPs) pour un nombre croissant de langues. Les glossaires communautaires (community glossaries) de termes informatiques sont également créés par des réseaux locaux de volontaires dans le but d’aider les groupements locaux à promouvoir et à préserver leurs langues.  J’ai parlé tout récemment sur ce blog d’un nouveau correcteur breton pour Office 2007 créé par un volontaire Breton qui, aidé de quelques bénévoles, consacre son temps et son énergie à la défense et à la préservation de sa langue. Je parle régulièrement sur ce blog des outils de vérification linguistique. La création de listes de mots, de lexiques pour les correcteurs orthographiques et pour les dictionnaires de synonymes ainsi que pour les « word-breakers » (segmenteurs de mots et lemmatiseurs) utilisés par les moteurs de recherche est une tâche qui doit absolument être effectuée si l’on souhaite aider les communautés linguistiques à accéder aux technologies de l’information dans leur langue.

Dans une certaine mesure, il me semble que David Harrison et un groupe tel que le mien (ainsi que d’autres groupes chez Microsoft, bien sûr) partagent une passion certaine pour les langues et un but commun : “what scientists can do is to capture an accurate record in the form of recordings and analyses”, écrit-il. Notre technologie peut certainement aider et j’espère que nous pourrons en faire encore plus à l’avenir pour aider les communautés à préserver leurs langues. Harrison souligne toutefois que personne d’autre que les locuteurs de ces langues en danger ne peut les préserver, puisque, par définition, il n’existe pas de langue vivante sans locuteur de cette langue. Mon vœu le plus sincère est de pouvoir participer à la mise en place des synergies nécessaires à la préservation de la diversité linguistique. Peut-être parviendrons-nous ainsi à empêcher l’extinction de certaines de ces langues. Entretemps, je vous encourage vivement à lire le livre de David Harrison. Vous ne le regretterez pas.

Thierry Fontenelle (Microsoft Natural Language Group)

[Une version en anglais de ce billet est également disponible sur le blog du Microsoft Natural Language Group, où l’on trouve d’autres informations relatives aux technologies linguistiques fournies par quelques collègues et votre serviteur]