[English version here]

Deux collègues de mon groupe (Nick Cipollone and Andrea Jessee) viennent tout récemment de développer un outil de translittération. Cet outil, appelé Microsoft Transliteration Utility vous permet de convertir des caractères d’une langue naturelle vers un autre jeu de caractères, par exemple le serbe en caractères latins vers le serbe en caractères cyrilliques, ou les caractères latins vers l’inuktitut. L’outil utilise un langage simple mais puissant basé sur des règles. Il peut être utilisé pour créer, éditer, déboguer et tester vos propres modules de translittération afin de convertir un jeu de graphèmes en un autre alphabet.

Vous pouvez utiliser l’outil en:

   1. Tapant votre texte selon un alphabet donné dans une fenêtre et l’outil le convertira instantanément;

   2. Copiant et en collant un texte dans une fenêtre où il sera converti automatiquement;

   3. Lui donnant un texte au format Unicode qu’il convertira;

   4. Convertissant une liste de fichiers Unicode à l’aide de l’interface offrant une ligne de commande.

Une des fonctionnalités les plus intéressantes de cet outil est sa console de développement de modules, qui permet à tout un chacun de créer, d’éditer et/ou de tester des modules de translittération nouveaux ou existants.

L’utilitaire de translittération (Microsoft Transliteration Utility) est mis gratuitement à votre disposition. Vous pouvez le télécharger à l’adresse suivante : http://www.microsoft.com/globaldev/tools/translit.mspx.

Il est livré avec 9 modules prêts à l’emploi (vous pouvez bien sûr en créer d’autres):

Bosniaque cyrillique vers alphabet latin

Bosniaque latin vers alphabet cyrillique 

Serbe cyrillique vers alphabet latin

Serbe latin vers alphabet cyrillique

Hangul (coréen) vers romanisation

Inuktitut vers romanisation

Romanisation vers inuktitut

Malayalam vers romanisation

Romanisation vers malayalam

 

Vraiment un outil génial ou, si on veut utiliser les caractères malayalam pour le dire, വ്രൈമെന്റ് ഉന്ഒഉറ്റില്ഗെനിഅല്‍, ou encore, pour le dire en caractères cyrilliques, враимент ун оутил гениал.

 

Thierry Fontenelle

Microsoft Speech & Natural Language