Mes collègues de Microsoft Research (MSR) viennent tout juste de lancer la version bêta d’un tout nouveau service de traduction automatique (TA) que vous pouvez désormais utiliser à l’adresse suivante, sur le site du moteur de recherche de Windows Live:  http://translator.live.com. Ce service web gratuit vous permet de traduire un texte (jusqu’à 500 mots) ou même une page web. Pour 8 paires de langues, si le texte que vous souhaitez faire traduire a trait à l’informatique, vous pouvez cocher la case “computer-related content” en-dessous de la fenêtre destinée à accueillir le texte source. Le service utilisera alors le système de traduction automatique basé sur les statistiques développé par l’équipe de Microsoft Research (MSR). Ce système “maison” est disponible pour les paires de langues suivantes: anglais vers l’allemand, le français, l’italien, le portugais brésilien, le chinois (traditionnel et simplifié) ainsi que le japonais. Le système de TA de MSR est déjà utilisé pour traduire la collection d’articles de la Base de Connaissances (Knowledge Base) de Microsoft lorsque la traduction humaine n’est pas encore disponible. Il a été entraîné sur d’énormes corpus de textes bilingues. Il  n’est pas parfait, bien sûr (ceux qui connaissent un peu le domaine savent qu’aucun système de traduction automatique n’est parfait), mais je suis heureux de voir que cette technologie de pointe peut maintenant être mise à la disposition de tous.

Pour les textes n’abordant pas des thèmes liés à l’informatique et pour d’autres paires de langues, le Windows Live Translator utilise le système de traduction automatique de Systran, comme d’autres services de traduction automatique sur la Toile. Au total, 26 paires de langues sont actuellement disponibles. Vous pouvez ainsi faire traduire votre texte automatiquement depuis l’anglais, par exemple, vers le français, l’allemand, l’espagnol, le japonais, le chinois, le coréen, le néerlandais, l’italien, le russe, l’arabe ou le portugais. Vous pouvez également traduire vers l’anglais à partir du français, du néerlandais ou du russe, ou encore entre l’allemand et le français.

 

 

Un des aspects les plus innovateurs de ce Windows Live Translator est son interface-utilisateur. Cette interface vous permet d’opter pour l’un des quatre types d’affichage bilingue. Le mode bilingue vous permet de synchroniser le défilement du texte source et du texte cible, ce qui facilite grandement la navigation. Vous pouvez également passer la souris sur une phrase du texte et le passage correspondant dans l’autre langue est automatiquement mis en surbrillance, comme l’illustre la copie d’écran ci-dessous :

 

Si vous ne connaissez pas du tout la langue de départ ou la langue d’arrivée, ce mode d’affichage ne vous sera peut-être pas utile. Mais si vous connaissez quelque peu les deux langues, la navigation en sera facilitée. Vous pouvez même utiliser ce mode bilingue pour améliorer votre connaissance de la langue que vous connaissez moins bien.

Vous pouvez afficher les textes en deux colonnes parallèles, comme ci-dessus, ou l’un au-dessus de l’autre. Vous pouvez aussi utiliser un mode plein écran pour la langue source ou la langue cible et utiliser la souris en la faisant survoler une phrase pour en faire apparaître l’équivalent dans l’autre langue. J’avoue beaucoup aimer la souplesse de cette interface utilisateur.

Je me réjouis de voir l’équipe de Microsoft Research étoffer la liste des paires de langues qui seront offertes et j’espère que ce service attirera l’attention qu’il mérite. J’ai commencé ma carrière dans le domaine de la linguistique informatique il y a une vingtaine d’années, en travaillant sur le projet Eurotra de traduction automatique, avant de collaborer au développement du système de TA METAL de Siemens au début des années 90, puis en travaillant avec les traducteurs de la Commission européenne qui utilisent aussi Systran. Vous pouvez donc imaginer mon enthousiasme devant ces développements. La Toile n’existait pas il y a 20 ans, cette notion de service sur le web était inconcevable. La traduction automatique basée sur des méthodes statistiques n’a pu naître qu’avec l’apparition des énormes corpus de textes informatisés que l’on a pu exploiter pour entraîner ces systèmes et dégager les probabilités de co-occurrence de termes et de syntagmes. Le journal Libération en a parlé il y a quelques mois dans un très bon dossier consacré à la traduction automatique et à son histoire, dont je recommande la lecture. Ce Windows Live Translator est un nouvel élément à ajouter au dossier. Nous vivons une époque passionnante !

Thierry Fontenelle - Microsoft Natural Language Group