Lors de la récente conférence PDC 2008 (Professional Developers Conference) où Windows 7, le futur système d’exploitation de Microsoft en cours de développement, a été dévoilé pour la première fois au public, mes collègues du groupe Windows International ont présenté quelques innovations à venir dans le domaine des outils linguistiques. Ils ont entre autres dévoilé le projet ELS (Extended Linguistic Services), qui permet aux développeurs d’utiliser un ensemble d’API pour accéder à des fonctionnalités linguistiques. Ainsi, les développeurs utilisant ces API dans Windows 7 disposeront dorénavant par exemple des fonctionnalités suivantes :

-          Des outils de translittération permettant notamment de convertir le chinois simplifié en chinois traditionnel (et vice versa), ou de passer de l’alphabet cyrillique à l’alphabet latin, etc…

-          Des outils de détection automatique de l’alphabet et de la langue (plus d’une centaine de langues seront ainsi supportées), ce qui permettra aux développeurs de détecter automatiquement la langue de n’importe quel fragment de texte Unicode.

On imagine aisément les applications potentielles de ce genre de fonctionnalités, surtout dans les environnements multilingues (la détection d’un alphabet ou d’une langue est cruciale pour accéder à l’information via un moteur de recherche, par exemple). Mes collègues ont publié un article sur le site « Go Global », qui décrit ce projet dans les grandes lignes et offre même des échantillons de code source : http://msdn.microsoft.com/en-us/goglobal/dd156834.aspx

Vous pouvez également accéder à la vidéo de la présentation (passionnante !) de Yaniv Feinberg et Erik Fortune, intitulée Windows 7 : Writing World-Ready Applications. La première planche - « Language Matters » - nous dit tout sur l’importance de la globalisation en matière de logiciels. La présentation PowerPoint peut être téléchargée ici. La vidéo inclut de belles démonstrations.

Ma collègue Kieran Snyder a déjà commencé à aborder ces thèmes sur son blog. Elle va continuer de nous informer dans les prochaines semaines quant aux développements relatifs à ces Extended Linguistic Services auxquels elle est directement associée.

Thierry Fontenelle

Microsoft Natural Language Group