Article d’origine publié le samedi 29 septembre 2012

Présentation rapide :
Je m’appelle Gerhard Schobbe, je suis responsable de programme du groupe de l’équipe au sein de l’organisation SharePoint qui concentre son activité sur les scénarios de recherche pour les travailleurs de l’information dans l’entreprise.

Objectifs de cette version

Abordons au préalable les objectifs de cette version.

Comme pour toute version, nous avons essayé d’améliorer plusieurs domaines. Les trois thèmes suivants figuraient en tête de liste pour cette version d’Office 2013 :
  • passer à une seule plateforme de recherche de contenu d’entreprise ;
  • offrir une réelle avancée aux utilisateurs finaux qui interagissent avec le système de recherche ;
  • établir cette plateforme comme une couche d’accès aux informations plus générale pour les applications, notamment aux autres composants de SharePoint, et naturellement au développement de tiers.
Je détaillerai chacun de ces thèmes et je mettrai en avant les progrès que nous avons accomplis au travers d’exemples. Ce billet d’introduction sera suivi par une série de visites guidées nettement plus détaillées dans les coulisses des divers sous-systèmes, dans les prochaines semaines ou les prochains mois.

Plateforme de recherche unique

Intéressons-nous tout d’abord au premier objectif : comment obtenir une plateforme de recherche unique ? Grâce à l’achat de FAST au milieu de l’année 2008 et la version d’Office 2010 qui a suivi, la gamme de produits Microsoft SharePoint 2010 inclut une offre de recherche à deux couches, lesquels reposent sur des technologiques différentes : SharePoint 2010 comprend un système de recherche de contenu d’entreprise fondé sur un code base développé à Redmond tandis que la couche supérieure est constituée de FAST Search Server 2010, système développé à partir de FAST suite à son acquisition.

Toutefois, il semblait également évident qu’un système capable de conjuguer le meilleur des deux implémentations offrirait un produit de recherche de contenu d’entreprise plus efficace tout en simplifiant les choix des utilisateurs, procurant ainsi entière satisfaction. En outre, ce processus de refonte de l’architecture globale permettait d’offrir la possibilité d’intégrer plusieurs des composants modernes sur lesquels FAST travaillait et qui n’avaient pas encore été largement diffusés, notamment le contenu mis à jour et les infrastructures de traitement des requêtes.

L’aboutissement de cette démarche, à l’issue de plusieurs années d’ingénierie, est un système qui associe le robot et l’infrastructure du connecteur de SharePoint Search aux infrastructures de traitement des requêtes et de traitement du contenu de nouvelle génération de FAST, tous ces éléments travaillant en collaboration avec un noyau de recherche reposant sur FAST Search.

Les expériences utilisateur par défaut destinées aux utilisateurs finaux et aux administrateurs informatiques sont toujours hébergées dans SharePoint, dans lequel l’expérience de l’utilisateur final a été complètement repensée et est basée non plus sur l’approche de rendu de type serveur de la version 2010 mais sur une approche côté client asynchrone (je détaillerai cette démarche plus tard).

En outre, nous avons été en mesure d’intégrer un nouveau moteur d’analyse qui permet d’exécuter un éventail de tâches, parmi lesquelles les algorithmes de classement et les recommandations.
 
À noter qu’un travail important a permis d’héberger la plateforme de recherche dans le nuage ; elle assurera le fonctionnement du service O365 dès lors que la dernière version arrivera en ligne.
 
La figure suivante illustre un schéma récapitulatif (cliquez sur l’image pour l’agrandir).

 

 

Créer une expérience utilisateur novatrice

 

 

Cela nous amène naturellement au deuxième domaine d’investissement, qui offre des améliorations marquantes pour tous les utilisateurs finaux. Généralement, un utilisateur tape un ensemble de termes de recherche dans une page d’accueil du centre de recherche qui sont considérés comme des mots clés et les résultats s’affichent sous la forme d’une liste classée unique de liens proposant des résumés sur trois lignes et quelques métadonnées. Je vais à présent vous décrire comment nous sommes passés au niveau suivant dans chaque cas.
 

La page d’accueil du centre de recherche est le point d’entrée principal :

 

Dans cette version, chaque zone de recherche de chaque site d’équipe offre un accès complet à la recherche à l’échelle de l’entreprise et à la recherche de personnes. Outre la recherche classique de sites déterminés, elle met en œuvre d’autres expériences de recherche spécialisées. Les utilisateurs peuvent accéder à l’étendue souhaitée à partir de la liste déroulante à l’intérieur de la zone de recherche.

Cette fonctionnalité met à la portée de chaque utilisateur travaillant au sein d’un site d’équipe ou au niveau de l’un des nombreux hubs autour de SharePoint, des expériences puissantes de recherche au niveau de l’entreprise. 

Chaque terme est un mot clé :

Une analyse détaillée de plusieurs journaux de requêtes de client, pour lesquels nous disposions d’autorisations, a clairement montré que de nombreuses requêtes sont un mélange de mots clés et de mots de commande, signifiant le type de résultat recherché par l’utilisateur. Une autre classe importante de requêtes comprenait les requêtes de navigation dans le sens où le résultat attendu était un emplacement, qu’il s’agisse d’un site d’équipe, d’autres sites web, d’une bibliothèque de documents, voire d’un document spécifique dont l’utilisateur s’est déjà servi quelques fois.

 

Pour développer le concept de mots de commande, examinons l’exemple « marketing deck » (présentation marketing). L’utilisateur recherche clairement (selon l’œil humain) une présentation marketing, mais aucune des présentations ne contiendra le mot « deck », il s’agit de jargon professionnel. C’est pourquoi il est plus judicieux de classer les termes de la requête en mots clés réels (« marketing » dans ce cas) et les mots de commande qui doivent être transformés en d’autres contraintes dans la requête, par exemple une contrainte de type qui limite le type de résultat à tous les types de fichiers définis comme des présentations. La même idée pourrait s’appliquer à des conseils que l’utilisateur recherche pour un site ou spécifiquement pour des documents qui ne sont pas des pages web. Ce processus de réflexion débouche sur l’utilisation des règles de requête, système évolutif, généralisé pour l’analyse de la requête qui mappe les termes d’une requête en mots clés et permet la transformation des mots de commande en requêtes de propriété. Les règles de requête offrent des fonctionnalités plus avancées, notamment l’exploitation du comportement d’un utilisateur pour créer des blocs de résultats. D’autres billets de blog aborderont de manière nettement plus détaillée tout ce qui peut être accompli avec les règles de requête.

Liste classée unique de résultats :

 

Les règles de requête permettent d’interpréter de plusieurs manières la même requête. Une interprétation peut insister sur une restriction de type comme dans l’exemple ci-dessus, conduisant à un ensemble de documents. Une autre règle peut se déclencher avec une acception particulière du terme « Marketing », à savoir une discipline clairement définie dans un dictionnaire de catégories de fonctions professionnelles dans une société telle que Microsoft, et retourner un ensemble de résultats portant spécifiquement sur le référentiel des ressources humaines de l’entreprise et offrant du contenu soigneusement modéré pour chaque discipline. Mais, on peut aussi avancer que ces deux interprétations sont complètement erronées et que le mot clé classique au regard de l’index avait la meilleure chance d’aboutir aux résultats recherchés par l’utilisateur. En combinant les trois jeux de résultats en une seule page, nous avons abouti au concept de blocs de résultats. Ces derniers permettent d’ajouter à la liste classée unique des résultats individuels les jeux de blocs classés qui sont insérés à divers emplacements, chaque bloc contenant des résultats classés individuellement.

À nouveau, l’intégralité de ce domaine nécessite une explication nettement plus détaillée pour illustrer la puissance des concepts sous-jacents.

La capture d’écran suivante montre un exemple : la page de résultats pour la requête « marketing deck » affiche un bloc avec les « decks » (les présentations) qui correspondent à la requête « marketing », suivie des résultats standard pour la requête intégrale.

 

Liens avec les résumés de trois lignes :

 

Il était clair que les tentatives de faire tenir encore davantage d’informations dans un même espace de pixels à l’écran n’allait pas engendrer des améliorations tangibles pour l’utilisateur en termes d’inspection rapide des résultats à la recherche du meilleur d’entre eux. La solution : un panneau de pointage dont la taille était susceptible de s’accroître pour afficher des aperçus visuels de sites, documents et conversations. C’est ainsi que nous avons également gagné de l’espace et avons pu passer d’une expérience implicitement conçue comme une rue à sens unique pour la lecture d’un document ou d’une page web à un jeu d’actions évolutif que les utilisateurs pourraient effectuer directement sur les résultats de la recherche : par exemple, en suivant un document, en passant en mode d’édition, ou en partageant ou en ouvrant la bibliothèque dans laquelle est stocké le document afin de voir quel autre contenu est disponible, et il ne s’agit là que d’actions par défaut.

Dernier point et non des moindres, au lieu de générer uniquement des résumés textuels, nous avons permis l’extraction de sections sémantiques pour divers types de documents, qui sont affichés comme des « liens profonds » à l’intérieur du panneau de pointage. En effet, il est probable que les titres des diapositives d’une présentation PowerPoint ont été soigneusement conçus par le présentateur pour résumer le contenu de chaque diapositive, même si le nom de fichier n’est pas particulièrement descriptif.

À présent, nous extrayons et affichons les titres des diapositives qui sont retournés grâce aux mots clés. Un utilisateur peut effectuer un zoom sur plus de 100 millions d’éléments dans l’index jusqu’à une seule diapositive dont le titre est pertinent, puis ouvrir la présentation exactement sur cette diapositive, d’un seul clic. Cette fonctionnalité est non seulement disponible pour les sites SharePoint (sous-sites principaux et bibliothèques de documents), mais aussi pour les documents Word et Excel (notamment avec les graphiques et les tables nommées).
 
L’infrastructure de l’interface utilisateur qui prend en charge toutes ces nouvelles fonctionnalités a été également repensée. Elle est fondée sur un jeu de modèles de disposition imbriqués qui sont définis en JavaScript et HTML pour faciliter l’extensibilité. Chaque type de résultats dispose d’un modèle permettant de contrôler la disposition dans la liste des résultats et un modèle de panneau de pointage. Les dispositions des blocs sont contrôlées par un modèle distinct et ensuite, la disposition de tous les résultats est définie par un modèle de groupe : la disposition de la présentation souhaitée peut être appliquée à l’ensemble. Par exemple, la recherche de vidéos qui est incluse par défaut utilise une disposition en grille avec des dispositions de résultats personnalisées afin de présenter les résultats de recherche de vidéos. Une apparence vraiment différente, obtenue en modifiant simplement un modèle et sans modification de code du composant WebPart des résultats de base.

Une fois conjuguées, ces améliorations permettent de créer une expérience utilisateur puissante, offrant de nombreux résultats, et qui est accessible où que vous soyez, dans SharePoint. La requête de l’utilisateur est bien mieux comprise, les résultats sont visuels et offrent un accès direct aux informations les plus détaillées à l’intérieur des sites et des documents. Enfin, les utilisateurs peuvent agir sur les résultats directement dans la page des résultats.

L’image suivante montre un exemple de l’apparence de cette expérience dans le cas d’une présentation PowerPoint : les liens vers les titres de diapositives pertinents à l’intérieur du fichier, un aperçu visuel qui permet à l’utilisateur de faire défiler les pages de la présentation de manière interactive et un jeu de liens d’actions au bas du panneau.



Fonctionnalité de recherche : plateforme d’accès aux informations

Le troisième objectif consistait à transformer la plateforme de recherche en une plateforme d’accès aux informations plus générale.
Un index de recherche de contenu d’entreprise correctement configuré constitue une collection étonnante d’informations disponibles au sein d’une entreprise : il croise les différents silos d’informations de divers systèmes de gestion documentaire et normalise le schéma de métadonnées entre ces systèmes.

L’exposition de toutes ces informations dans le cadre d’une expérience utilisateur interactive reposant sur les mots clés est intéressante, mais pourquoi s’arrêter là ? Il existe de nombreuses expériences liées aux informations qui tireraient parti d’une vision orientée utilisateur qui ne tienne plus compte des limites des silos sous-jacents et qui profiteraient de la classification et de la correspondance par mots clés de contenu pour afficher en premier les éléments les plus pertinents.

À titre d’illustration, je souhaite mentionner certains des exemples qui sont inclus par défaut dans SharePoint 2013 :

  • Dans le site Mon site, les utilisateurs peuvent accéder à une liste de toutes les tâches SharePoint qui leur sont affectées, indépendamment des sites dans lesquels sont stockées les affectations.
  • Chaque bibliothèque de documents dispose désormais d’une zone de recherche dans sa partie supérieure qui permet aux utilisateurs d’effectuer des recherches dans des métadonnées et l’intégralité du texte de ses documents tandis que la liste de résultats est présentée sous la forme d’une vue SharePoint standard plutôt que sous la forme d’une page de résultats.
  • Le fait de cliquer sur un hashtag dans un billet ou une discussion affiche une liste de toutes les conversations concernant cette rubrique à l’échelle de l’entreprise.
Il existe un large éventail d’autres fonctionnalités encore plus intéressantes dans cette version : par exemple, une nouvelle façon de définir des types en fonction de règles (comme un contrat qui devrait être différent d’un fichier générique de type « Word »), une meilleure pertinence prédéfinie qui est réglable dans l’interface utilisateur et via XRANK, eDiscovery qui étend SharePoint et Exchange, l’analyse qui permet d’actualiser le contenu en permanence, des installations qui associent les résultats des clients O365 aux résultats locaux dans des configurations « hybrides » et le système qui offre désormais des API CSOM et RESTful, et bien plus encore.

 

Nous espérons que vous avez apprécié ce billet : inscrivez-vous pour avoir accès à  l’environnement O365 Preview en ligne, ou téléchargez les éléments ici et installez-les sur un ordinateur local.

Dites-nous ce que vous en pensez !
 
G.

Ce billet de blog a été traduit de l’anglais. Vous trouverez l’article original ici : Overview of Search in SharePoint 2013