Mes collègues de l’équipe du moteur de recherche Live Search viennent d’annoncer la sortie ce vendredi 1er juin de la version beta de Live Search Books. Différentes initiatives sont actuellement en cours, mais c’est la première fois que l’on pourra prendre connaissance du contenu de livres toujours soumis à des droits d’auteurs ainsi que des livres tombés dans le domaine public. Pour les premiers, c’est le fruit d’un partenariat avec les maisons d’édition qui rend ces recherches possibles.

Je me suis immédiatement jeté sur cette version beta. En tapant les mots-clés « computational lexicography » (un de mes thèmes favoris), j’ai ainsi pu obtenir une liste d’environ 150 ouvrages. Il est possible de cliquer sur  la couverture d’un ouvrage pour en découvrir de larges extraits (le pourcentage du contenu que les éditeurs ont permis de visualiser est indiqué) ou même, dans certains cas, pour télécharger l’ouvrage tout entier. Comme on peut le voir ci-dessous, le panneau de gauche présente une reproduction de la couverture, le titre de l’ouvrage et un court résumé permettant de savoir si ce résultat correspond à ce que l’on cherchait. En cliquant sur la couverture, on fait apparaitre dans le panneau de droite un résumé plus complet ainsi que la table des matières. Il est également possible de chercher les occurrences de certains mots-clés dans le livre lui-même, de zoomer sur certaines pages, de parcourir le livre page par page (un compteur indique combien de pages vous pouvez encore consulter, en fonction de la limite déterminée par l’éditeur), d’accéder aux chapitres à partir des hyperliens de la table des matières. Il est même possible d’acheter directement les ouvrages en cliquant sur les liens renvoyant vers les sites des éditeurs ou de distributeurs. J’avoue que j’ai été impressionné par la qualité des images scannées.

 

 

 

Mes collègues ont donné plus de détails sur leur blog (http://blogs.msdn.com/livesearch/archive/2007/06/01/live-search-books-now-with-in-copyright-content.aspx).  Ils donnent notamment la liste des éditeurs qui ont accepté de collaborer à cette très belle initiative (entre autres Oxford University Press, Cambridge University Press, MIT Press et bien d’autres encore). Le respect des droits d’auteurs fait couler beaucoup d’encre ces derniers temps et j’avoue que j’applaudis ce projet qui permet de rendre plus facilement accessibles les publications scientifiques tout en prenant en compte les intérêts des auteurs et des éditeurs.

Un joli outil pour les chercheurs…

Thierry Fontenelle

 Microsoft Natural Language Group - Program Manager