QLog (Quantized Log)

Modélisation dimensionnelle 7

Classé dans : Aide à la décision — Sebastiao Correia 29 mars 2007 @ 22:14
Imprimer ce billet Imprimer ce billet

Ce chapitre porte sur la comptabilité générale.
En général, il faut deux tables de faits pour les transactions et les instantanés périodiques de clôture de période.

Instantané périodique.
Bien que semi-additif, le solde de fin de période doit figurer dans la table de faits pour éviter d’avoir à le recalculer en remontant à l’origine des temps.
Par contre, les totaux sur une période à la date du jour doivent être calculés et non pas stockés dans la table de faits.

Si différentes devises sont utilisées, il faut ajouter la dimension Monnaie et mettre dans la table de faits les montants dans la monnaie locale et dans la monnaie officielle de l’entreprise.

Transactions de journaux de comptabilité générale.
Les faits sont les crédits et débits. Cette table peut avoir besoin de plusieurs calendriers comptables, si les filiales ne se basent pas sur les mêmes périodes comptables par exemple.

Budget.
Pour gérer le budget et pouvoir le comparer avec les dépenses, on créé une table de faits (additifs) donnant le montant budgété net et ses changements (relatifs pour rester additifs) éventuels en cours d’année. Les dimensions peuvent être la Date d’effet, le compte de comptabilité générale, la ligne d’articles de buget, la hiérarchie de l’entreprise…
Le livre « Data Warehouse Design Solutions » (Wiley, 1998) de Chris Adamson et Mike Venerable est recommandé pour son étude complète sur la chaîne budgétaire.

Table de faits consolidés (ou tables de faits de second niveau).
Ces tables de faits permettent de rapprocher des faits différents dans une même table. La contrainte est que la granularité est définie par le plus petit grain commun aux différents faits. De même les dimensions d’une table de faits consolidés doivent être les dimensions communes aux différents faits.
Il ne faut pas chercher à rendre des faits plus fins que prévus, ni à ajouter des dimensions artificielles pour forcer à garder un grain fin. Il peut s’avérer nécessaire d’agréger des données en supprimant des dimensions ou en passant à un grain plus gros.

Pour l’analyse financière, il existe des produits OLAP bien adaptés, mais leur intégration dans un entrepôt de données global nécessite toujours une mise en conformité des dimensions.

Source : Ralph Kimball et Margy Ross, « Entrepôts de données, guide pratique de modélisation dimensionnelle« , 2ième édition.

Nouvelle bannière

Classé dans : Arts — Sebastiao Correia @ 0:02
Imprimer ce billet Imprimer ce billet

Il y a deux jours, j’ai décidé de changer la bannière de mon blog. L’ancienne bannière était celle par défaut du thème.

Maintenant la bannière affichée est celle que j’ai créée avec The Gimp. L’idée qui sous-tend l’image est la superposition quantique : le mot « QLog » se superpose avec son ombre.

La symétrie est également présente puisque « QLog » se lit en mirroir par rapport à son ombre.

La présence de vagues renvoie à l’idée d’onde essentielle en mécanique quantique et le tourbillon central fait plutôt référence à la turbulence et aux phénomènes chaotiques.

Même si cette image est loin de me satisfaire (je n’ai pas spécialement la fibre artistique ni la maîtrise de Gimp), elle reflète un peu plus l’esprit du blog que la précédente et elle reste dans les tons du thème.

A propos des sondages

Classé dans : Société, Statistiques — Sebastiao Correia 26 mars 2007 @ 23:40
Imprimer ce billet Imprimer ce billet

Cette période pré-électorale est propice aux sondages de toutes sortes. Voici un billet dévoilant un peu la face cachée des instituts de sondage. Je retiens en particulier quatre choses qui me paraissent importantes :

  1. Les données brutes des sondages sont difficilement accessibles voire inaccessibles.
  2. Ces données brutes sont redressées (i.e. corrigées…) par certaines méthodes propres aux instituts de sondage.
  3. Il existerait une loi en France qui oblige les sondeurs à dévoiler les méthodes utilisées pour évaluer les chiffres.
  4. Ceux-ci semblent peu enclins à respecter cette loi.

Sans l’accès aux données brutes, il n’est pas possible de vérifier les sondages. Faut-il faire confiance aveuglément dans ces instituts de sondage ?

Outre le fait que l’on ne puisse pas accéder aux données, on ne connaît pas non plus la méthode utilisée pour calculer les statistiques. Or il faut savoir qu’il existe différentes méthodes statistiques (orthodoxes, bayesiennes…) et que toutes ne consuisent pas exactement au même résultat (Je recommande la lecture du livre de E. T. Jaynes) .

En dehors de ces problèmes de méthodes, il y a également d’autres phénomènes statistiques curieux qui semblent liés à la façon dont on interprète les questions posées. Parmi ces paradoxes, il y a l’effet de framing, l’erreur logique de la conjonction…Ces paradoxes nous montrent que la façon de tourner les questions n’est pas innocente et peut changer du tout au tout le résultat des sondages. Nous ne raisonnons pas d’une façon strictement logique lorsque nous répondons à un questionnaire…

A tel point que des physiciens, philosophes et sociologues tentent maintenant d’utiliser le formalisme quantique pour résoudre ces paradoxes.
J’ose espérer quand même que pour ces questions d’élections, les questions sont bien posées… et que les paradoxes seront évités ;-)
Après cette brève digression vers le quantique, je donne le lien sur l’article original qui est accessible ici sur le site de Claire Durand (professeur de sociologie au Canada).

Séminaire AssoMat

Classé dans : Rendez-vous — Sebastiao Correia 25 mars 2007 @ 0:48
Imprimer ce billet Imprimer ce billet

Le 15 mai 2007

Exposé de Jean Lassègue (philosophe, CREA)
Titre : Formel et forme chez Turing.

Voir mon billet précédent.

Pi-anniversaire

Classé dans : Général — Sebastiao Correia 14 mars 2007 @ 23:27
Imprimer ce billet Imprimer ce billet

Aujourd’hui est la journée de pi. Pour l’occasion,calculez vos prochaines dates d’anniversaire en nombre de pi-années ;-) :

Pi Days – Calculate your Pi birthdays

J’ai actuellement environ 10.71pi-années.

La fin du principe de complémentarité de Bohr?

Classé dans : quantique — Sebastiao Correia 2 mars 2007 @ 23:37
Imprimer ce billet Imprimer ce billet

Selon la mécanique quantique, les expériences sur les particules quantiques présentent un aspect corpusculaire et ondulatoire à la fois. C’est la fameuse dualité « onde-corpuscule ». A ce sujet, voir ce billet.

Le principe de complémentarité de Bohr prévoit quant à lui qu’il n’est pas possible d’observer les deux aspects en même temps. Et jusqu’à récemment, c’était vrai : les expériences (dont l’expérience des fentes d’Young) montraient soit l’aspect ondulatoire, soit l’aspect corpusculaire.

Shahriar S. Afshar a repris l’expérience des fentes d’Young et l’a adaptée pour qu’elle puisse révéler les deux aspects à la fois. Le système est ingénieux et presque trivial. Le tout était d’y penser.

Son expérience semble réfuter le principe de complémentarité de bohr, puisqu’elle montre que les photons se comportent de façon ondulatoire malgré la connaissance du chemin par lequel ils sont passés (en tant que particules). Si cette expérience se confirme, ça pourrait bien être une petite révolution dans le « monde quantique ».

Sources :

  1. Le blog d’Automates Intelligents : Pourra-t-on sauver le soldat Niels Bohr? où l’on trouvera un schéma de l’expérience.
  2. L’article de Shahriar S. Afshar est ici.
  3. Voir aussi l’article d’Automates intelligents de juillet 2004.

Séminaire sur les concepts d’égalité, identité et catégorisation

Classé dans : Rendez-vous — Sebastiao Correia 28 février 2007 @ 17:41
Imprimer ce billet Imprimer ce billet

Oups!! Désolé !! C’est déjà passé, c’était en 2006 !!!
Source : CeSEF

Jeudi 6 avril 2006 de 15h à 18h30

Ecole des Mines de Paris, 60 Bd. St. Michel Paris 5, SALLE V-115

Programme :

15h-16h15′ : Exposé par Andrei RODIN sur Considérations sur les concepts d’égalité, identité et catégorisation

16h15′-16h45′ : Les réactions de Hervé BARREAU

16h45′-17h : Pause

17h-17h15′ : Quelques réactions de Mioara MUGUR-SCHACHTER

17h15′-18h30′ : Discussion Générale

Séminaire Poincaré « Espaces quantiques »

Classé dans : Rendez-vous — Sebastiao Correia @ 17:31
Imprimer ce billet Imprimer ce billet

Le prochain séminaire Poincaré parlera des espaces quantiques et aura lieu le 28 avril.

Le programme préliminaire est le suivant :

V. Pasquier : Introduction · 10h
V. Rivasseau : Renormalisation non commutative · 10h30
A. Polychronakos : Noncommutative Fluids · 11h30
J.-M. Maillet : Des groupes quantiques aux expériences de diffusion de neutrons · 14h30
A. Connes : La géométrie non commutative et le modèle spectral
de l’espace-temps · 15h30

Lieu : Institut Henri Poincaré, 11 rue Pierre et Marie Curie, Paris.
Accès ici.

Fluctuations quantiques et temps discret

Classé dans : quantique — Sebastiao Correia 21 février 2007 @ 0:10
Imprimer ce billet Imprimer ce billet

[quant-ph/0612033] Approche intrinsèque des fluctuations quantiques en mécanique stochastique

Encore un article sur la dérivation de la mécanique stochastique de Nelson. L’article est très court et en Français.

L’idée du papier est de montrer que les fluctuations quantiques se déduisent de la nature discrète du temps et de la fractalité des trajectoires microscopiques. Il s’appuie sur les mathématiques non standard.

Le temps est donc discrétisé. La reformulation du principe de Heisenberg par Feynman h / {2 pi  m} <= {Delta x}  / { Delta t} permet de montrer que les trajectoires sont continues, mais non différentiables :
x(t+ delta t) = x(t) + b delta t pm sigma sqrt {delta t}

Le signe devant sigma est une variable aléatoire et les valeurs +1 ou -1 sont supposées équiprobables. On a donc une marche aléatoire.

Si x est markovien (b et sigma sont des fonctions de t et x(t) et non de delim{lbrace}{x(tau)  :   0 < tau < t }{rbrace}), alors cette marche aléatoire équivaut à une équation différentielle stochastique usuelle.

L’introduction d’un champ de fluctuations quantiques de nature browniennes pour justifier la mécanique stochastique de Nelson n’est plus nécessaire.

Note :
Ces travaux et d’autres montrent l’importance grandissante des mathématiques non standard. En particulier, le temps jusque là toujours considéré comme réel et continu semble montrer des signes de fatigue. La discrétisation du temps semble de plus en plus s’imposer pour justifier les équations « étranges » de la mécanique quantique.

Modélisation dimensionnelle 6

Classé dans : Aide à la décision — Sebastiao Correia 17 février 2007 @ 23:44
Imprimer ce billet Imprimer ce billet

Le chapitre 6 traite de la relation client qui est devenue centrale pour l’entreprise ces dernières années. La GRC (Gestion des Relations Client) ou CRM (Customer Relationship Management) nécessite de définir précisément une dimension client conforme. Il existe des solutions GRC clés en main, mais celles-ci doivent s’intégrer à l’informatique de l’entreprise si on ne veut pas qu’elle devienne simplement une source supplémentaire d’informations incohérentes.

La dimension client est généralement très complexe. Elle peut être énorme : plusieurs centaines de milliers de lignes et plusieurs milliers d’attributs.

Concernant les noms et adresses, ceux-ci doivent être stockés à l’aide des « briques » les plus élémentaires possibles (par ex. : n° de rue, nom de rue, type de voie, boite postale, bâtiment…). La gestion de l’internationalisation est très complexe. Elle est traitée par Toby Atkinson dans « Merriam Webster’s Guide to International Business Communications » (Merriam-Webster, 1999).

Les clients ont également beaucoup d’attributs date (date de 1er achat, date de dernier achat, date de naissance…) qui doivent utiliser la dimension Date déjà vue, à l’aide de copies. La dimension Date jointe à la dimension Client est une dimension dite déportée, qui se justifie du fait de la taille de la dimension Client.

Parmi les attributs des clients, on trouve les attributs de segmentation (sexe, âge, score indiquant le comportement,…), les attributs représentant des faits agrégés (total des dépenses…).

Une autre dimension déportée comme la géographie peut aussi être justifiée par la relative indépendance par rapport au client. On obtient alors un modèle en flocons de neige.

Les dimensions Client sont souvent des « grandes dimensions à changement rapide ». Pour gérer ce type de dimension, on crée une ou plusieurs minidimensions, chargées de stocker les attributs variant souvent ou fréquemment analysés, comme l’âge, le salaire… Concernant les attributs variant de façon continue, comme le salaire, il faut stocker dans la minidimension des tranches de salaire seulement, quitte à laisser le salaire exact dans la table de faits. La table de faits se voit ajouter une clé étrangère pointant sur la minidimension. S’il y a besoin d’analyser les clients en fonction d’attributs de la minidimension, alors on peut faire une dimension déportée (en faisant une jointure avec la table client) en plus d’une minidimension (jointe sur la table de faits). Cependant la clé externe dans la dimension Client doit être de type 1 (i.e. écrasée à chaque changement).
Les minidimensions doivent éviter de dépasser les 100.000 lignes.
Dans le cas où les clients ont une structure hiérarchique récursive de profondeur variable, il est possible d’utiliser une table passerelle gérant les liens entre les clients.

Cette approche permet d’utiliser le SQL standard pour les groupements et cumuls, mais il est souhaitable d’utiliser des outils OLAP non relationnels pour simplifier les requêtes. « Cette approche tente de rapprocher deux structures intrinsèquement différentes, [... cela] revient à mélanger de l’huile et de l’eau. »

Source : Ralph Kimball et Margy Ross, « Entrepôts de données, guide pratique de modélisation dimensionnelle« , 2ième édition.

<<< Page Précédente - Page Suivante >>>