Panoramas

imprimerenvoyerrecevoir

PANORAMA

Le stockage XML s'adapte aux données non figées

(03/12/2004) - par Aurélie Chandèze

Autre façon d'envisager le stockage de l'information, les bases de données natives XML peuvent sembler inaccessibles pour les PME. Pourtant, la souplesse du XML, qui s'adapte à la structure des données, a su convaincre de petites entreprises.


Notre coeur de métier est la capacité de dialoguer avec les systèmes d'informations de nos partenaires, d'où l'importance pour nous de proposer un format d'échange standard." Ainsi s'exprime Eric Walrave, chef de projet chez ResinFrance. Cette petite entreprise, chargée de gérer le portail de réservation touristique du même nom, utilise une base native XML pour répondre à ce besoin d'interopérabilité. La complexité des technologies XML peut faire peur. Au départ, XML (Extensible Markup Language) est un langage de description de l'information. Norme du consortium W3C, il permet de structurer un document grâce à un système de balises. Chaque bloc d'information constituant le document est délimité par une balise de début et une balise de fin, par exemple : Ceci est un titre. Autour de ce principe simple, de multiples standards et technologies dérivées sont apparues au fil du temps. Alors que les bases relationnelles, orientées données, organisent l'information sous forme de tables, l'apparition de bases XML natives a introduit une autre façon de stocker l'information. Orientées document, ces bases enregistrent l'information de manière arborescente, en fonction de sa sémantique, distinguant par exemple dans un article de presse le titre, les sous-titres, les paragraphes et l'auteur. Dès lors qu'une entreprise est amenée à gérer de gros volumes de documents, le choix d'une base XML native mérite d'être étudié. Le prix élevé des bases natives propriétaires réserve cependant ces solutions aux PME dont l'activité dépend fortement des données stockées. ResinFrance est dans ce cas : "Regrouper l'offre touristique française sur un seul point d'accès, telle est l'idée du site portail ResinFrance", explique Eric Walrave. Les visiteurs consultent les offres d'hébergement disponibles par région, puis ils peuvent réserver leur séjour en ligne.
Soutenu par les collectivités territoriales chargées du tourisme, ce site Internet a été lancé par l'Agence française de l'ingénierie touristique (AFIT). Philippe Demonchy, à la tête du réseau d'agences de voyage Sélectour, préside la petite entreprise, qui se rémunère en prélevant un pourcentage sur les réservations d'hébergement effectuées en ligne. S'adressant aux particuliers comme aux professionnels, le portail donne déjà accès à plus de 13 500 produits touristiques, proposés par les différents partenaires de ResinFrance : hôtels, gîtes, campings ou locations. Des acteurs privés comme Accor rejoignent le projet. Lancée en septembre, la version 3 de ResinFrance repose entièrement sur les services Web et XML, les données étant stockées dans la base native d'Ixiasoft. "Nous récupérons les fiches produits en XML pendant la nuit. Seuls les dates de disponibilité et les tarifs sont récupérés en temps réel au moment de la réservation", précise Eric Walrave. "Les premières versions du site, lancé en 1999, imposaient à nos fournisseurs d'informations de se conformer à notre logique. En passant à XML, nous avons inversé le processus. Désormais, c'est Resin-France qui s'adapte aux logiques de ses partenaires", poursuit-il. Le statut de standard de XML a été déterminant pour le projet. Le choix d'une base XML permet de stocker les descriptifs produits tels qu'ils sont transmis, sans ajouter d'étape supplémentaire de traduction aux formats SQL. "Les modèles relationnels ne sont pas conçus pour évoluer régulièrement. XML, adapté aux données semi-structurées, s'adapte bien plus aisément à la diversité des fiches produits transmises par nos fournisseurs. Accor ne décrit pas ses séjours de la même façon que Pierre et Vacances par exemple." En XML, la création d'un nouveau modèle de document est rapide, il suffit de connaître les différents éléments le constituant et leur organisation. Pour garantir la cohérence des documents, leur syntaxe est modélisée avec les schémas XML, un standard lui-même bâti sur XML. Les DTD (Document Type Definition) sont une autre façon de modéliser la structure d'un document, mais elles sont actuellement en voie d'obsolescence. ResinFrance s'est inspiré du format d'échange TourinFrance, mis au point par l'AFIT, pour construire un modèle de données XML souple, assez général pour correspondre aux différents modèles de données de ses partenaires. La réalisation technique a été prise en charge par Business et Décision et Impleo. L'offre de gestion de contenu d'Impleo, ImpleoCMS contrôle les flux de données. La modélisation en XML a demandé quelques adaptations aux développeurs, plus habitués à concevoir des modèles relationnels. "Chaque fournisseur a un schéma XML différent. Pour éviter d'éclater le modèle générique inspiré de TourinFrance, nous utilisons les transformations XSLT", précise Philippe Audibert, directeur d'Impleo. XSLT est une technologie qui permet de construire un nouveau document XML à la volée à partir d'un document initial. Elle ne doit pas être confondue avec XSL, qui s'occupe uniquement de la mise en forme de l'information, en associant des feuilles de style aux différents éléments constituant le document XML. Des langages de requêtes comme XQL et ses descendants, XPath et XQuery (la norme XQuery n'étant pas encore finalisée), permettent également de manipuler les données et d'interroger les bases XML.
On le voit, de nombreux outils étendent les possibilités du stockage en XML. Parmi les bases existantes, toutes ne supportent pas l'ensemble de ces technologies, les éditeurs choisissant généralement d'en privilégier certaines. De ce fait, chaque base a sa spécificité. "Celle d'Ixiasoft, par exemple, a l'avantage d'accepter également des fichiers non XML, elle peut notamment stocker des images", ajoute Philippe Audibert. Le site ResinFrance pourra donc intégrer d'autres types de contenus en fonction de son évolution. La qualité de service est un autre critère important. Software AG (voir témoignage ci-dessous) et Xyleme ont mis l'accent sur la haute disponibilité et les architectures distribuées, pour les projets où l'information doit être accessible en continu. Des fonctionnalités qui placent les bases XML au même niveau de fiabilité que les bases relationnelles classiques, mais qui ont un coût. Pour les entreprises ne disposant pas d'un budget suffisant, quelques projets Open Source, plus limités selon les technologies supportées, permettent de s'initier en douceur. Il est également intéressant pour une PME de suivre l'évolution des grands éditeurs de SGBD relationnels, Microsoft, Oracle et IBM en tête. De plus en plus séduits par le XML, ils introduisent dans leurs bases des fonctionnalités identiques à celles des bases natives : stockage dans des champs XML, requêtes en XPath et XQuery, ou encore vérification de l'intégrité des documents conformément à un modèle.

Recherche

LMI VIDEOS et PODCASTS
CONFERENCES