Tracking et Notification SMS part1: Intégration des données


I- Etat de l'art 
I-1.) Intégration des données
L'expansion de grands réseaux comme Internet amplifie le besoin de développer des applications tirant partie simultanément de multiples sources, lesquelles peuvent hétérogènes notamment au niveau du moteur du SGBD ou encore des fichiers plats. De nombreuses études ont déjà été menées sur le sujet et ont aboutis à la proposition de deux grandes infrastructures d'intégration, à savoir :
- L'approche par médiateur/adaptateur
- L'approche par entrepôt de données
L'approche médiateur / adaptateur crée en 80 appliquée à un ensemble de sources hétérogènes et distribuées à pour objectif de donner l'impression d'interroger un système centralisé et homogène alors que les sources interrogées sont reparties, autonomes et hétérogènes. Cette approche implique un meilleur rendement pour l'entreprise, sa mise en place intègre les BD existantes sans changer pour autant ou reformater les sources d'origine qui y sont stockées. 
L'approche par entrepôt de données quant à elle revient à construire une très grosse base de données (Datawarehouse). Outre le fait qu'il stocke une énorme quantité d'information en un même endroit (problème lié à la centralisation des données), il est primordial de bien choisir la fréquence de rafraîchissement de l'entrepôt pour que les informations soient les plus à jour et elle assure une dépendance partielle vis à vis des sources.
Une fois l'entrepôt crée, reste donc à l'alimenter automatiquement à partir des sources préalablement choisies. Cette problématique est résolue par les systèmes ETL. 
I-2.) Les Systèmes ETL
Un système ETL (Extract-transform-load) est une technologie intergicielle qui favorise le regroupement massif d'information d'une source vers une autre au travers des connecteurs. Les outils ETL étudiés dans à l'instar de Pentaho Data integrator et Talend Open studio interagissent avec les sources différente (Fichiers, BD, flux xml, etc.) extraient les données, effectuent des transformations sur ces dernières avant de les charger dans la base cible suivant le schéma du mapping mis sur place entre les tables. L'outil Oracle Data Integrator (ODI) à été choisi pour réaliser cette fonction. Dans le souci de minimiser le temps de chargement des données et de ne charger que les nouvelles informations ou celle qui ont changées récemment, le Change Data Capture (CDC) est utilisé par ODI.

Manfouo Mawamba Stève Orlin

Ingénieur de conception
Université de Yaoundé I – Cameroun
Ecole Nationale supérieure Polytechnique
stevorlin2002@yahoo.fr- BP : .8390.


Inscription à la newsletter


0 commentaires :

Enregistrer un commentaire

Powered by AXESS Global Services. Copyright © 2015 Entreprise Internet . All Rights Reserved. Fourni par Blogger.