QLog (Quantized Log)

Modélisation dimensionnelle 1

Classé dans : Aide à la décision — Sebastiao Correia 18 novembre 2006 @ 18:11
Imprimer ce billet Imprimer ce billet

Généralités sur l’entrepôt de données.

  1. L’entrepôt de données doit faciliter l’accès aux données de l’entreprise ou organisation.
  2. Il doit présenter l’information de l’entreprise de manière cohérente.
  3. Il doit être adaptable et résistant aux changements.
  4. Il rassemble une grande richesse informationnelle qui doit être protégée.
  5. Il doit permettre de prendre des décisions.
  6. Un entrepôt de données n’est réussi que s’il est accepté par les utilisateurs.

L’environnement de l’entrepôt de données se compose de 4 parties :

  1. les applications opérationnelles sources, qui capturent les transactions de l’entreprise. Elles sont extérieures à l’entrepôt.
  2. La zone de préparation des données. C’est une zone de stockage et de transformation des données. Elle prépare les données pour être présentée selon les besoins des utilisateurs. Les utilisateurs ne doivent en aucun cas avoir accès à cette zone. La base de données de cette zone n’est pas nécessairement normalisée.
  3. La zone de présentation des données. C’est la base optimisée pour les requêtes des utilisateurs, pour les outils de reporting et autres applications d’analyse. Elle n’est pas normalisée en 3ième forme normale, mais comporte en général une table de faits entourée de tables de dimensions pour former un schéma en étoile. Les données doivent être dimensionnelles, atomiques et doivent adhérer à l’architecture de bus d’entrepôts de données.
  4. Des outils d’accès aux données allant du SQL simple aux outils de reporting genre Business Objects.

Table de faits : C’est la table centrale dans laquelle figure toutes les mesures à un grain donné. Le grain étant la finesse à de la mesure. Les faits sont la plupart du temps numérique et additifs.

Tables de dimension : Elle sont le point d’entrée dans la table des faits. Elles décrivent un axe d’analyse (dimension date, dimension produit, dimension client…). Elles établissent l’interface homme/entrepôt de données.

Les tables de faits doivent contenir les plus petits détails d’une activité. Ce sont les plus grosses tables de l’entrepôt de données. Une ligne de cette table décrit un fait, par ex. le prix en caisse d’un article tel jour, avec telle promotion, dans tel magasin. Le prix est la quantité numérique qui nous intéressent et l’article, la promotion et le magasin sont les dimensions stockées dans leur propre table.

Le marché d’infos sert à présenter en général les données d’un processus de l’entreprise à l’aide du modèle dimensionnel dit en étoile.
La construction d’un modèle en étoile permet de facilement ajouter des dimensions, et la simplicité du schéma relationnel permet d’avoir des requêtes optimisées.

Source : Ralph Kimball et Margy Ross, « Entrepôts de données, guide pratique de modélisation dimensionnelle« , 2ième édition.

Modélisation dimensionnelle 0

Classé dans : Aide à la décision — Sebastiao Correia @ 17:48
Imprimer ce billet Imprimer ce billet

Je me lance dans une série de notes sur la modélisation dimensionnelle. Pour le moment, je suis en phase d’apprentissage, donc pour les experts, je ne vais rien présenter de neuf. Pour ceux qui ne connaissent pas, c’est le moment d’apprendre ; et pour ceux qui ont oublié, c’est le moment de réviser les bases ;-)
Dans cette série, je vais relever les points essentiels de la modélisation dimensionnelle selon Ralph Kimball et Margy Ross dans leur livre « Entrepôts de données, guide pratique de modélisation dimensionnelle« , 2ième édition.