- QLog (Quantized Log) - http://s.correia.free.fr/wordpress -

Modélisation dimensionnelle 10

Posted By Sebastiao Correia On 24 mai 2007 @ 20:47 In Aide à la décision | Comments Disabled

Le chapitre 10 propose de réviser un schéma existant. L’exercice est très instructif. Voici les points sur lesquels il faut être attentif :

  1. Trouver le niveau de granularité le plus bas, ce qui ne signifie pas la recherche des données les plus détaillées de l’entreprise.
  2. Vérifier que tous les faits additifs sont à la granularité définie pour la table de faits. Et éviter les cumuls car non additifs.
  3. Granularité des dimensions : chaque dimension associée à une table de faits doit prendre une seule valeur pour chaque ligne de la table de faits. Chaque attribut de la dimension doit prendre une seule valeur par ligne de dimension. Il faut dénormaliser les hiérarchies à l’intérieur de la dimension.
  4. Dimension Date. Toujours bien préciser son rôle lorsqu’une table date générique est utilisée.
  5. Éviter les colonnes représentant des périodes en dur dans la table de faits. Il vaut mieux avoir 12 lignes et une dimension Mois plutôt que 12 colonnes les représentant.
  6. Rechercher les dimensions qui devraient être dégénérées (cas d’une dimension ayant presque autant de ligne que la table de faits).
  7. Éviter les codes, utiliser des descriptions.
  8. Utiliser des clés artificielles plutôt que les identifiants opérationnels pour toutes les dimensions.
  9. Avoir un nombre de dimensions raisonnable, ni trop, ni trop peu.

La géographie peut être standardisée (adresse, point géographique x, y) et partagée en tant que dimension déportée. Il faut cependant vérifier que le partage de cette table ait un intérêt (en diminuant le nombre de lignes par exemple) et que l’utilisation des différentes vues sur cette dimension déportée restent performantes (cela dépendra du SGBD). Les outils de SIG (Système d’Information Géographique) permettent de tirer un meilleur parti de ces données, en particulier en vue d’une représentation sur une carte (des requêtes de type topologiques existent).

Source : Ralph Kimball et Margy Ross, « Entrepôts de données, guide pratique de modélisation dimensionnelle [1]« , 2ième édition.


Article printed from QLog (Quantized Log): http://s.correia.free.fr/wordpress

URL to article: http://s.correia.free.fr/wordpress/?p=94

URLs in this post:

[1] Entrepôts de données, guide pratique de modélisation dimensionnelle: http://www.amazon.fr/Entrep%C3%B4ts-donn%C3%A9es-pratique-mod%C3%A9lisation-dimensionnelle/dp/2711748111/sr=11-1/qid=1163805213/ref=sr_11_1/403-1083835-8042829