Concepts de la Business Intelligence

Les deux objectifs principaux des projets de Business intelligence sont le traitement des données en vue de l’analyse et la représentation de ces données sous une forme exploitable pour la décision.

Flux de transformation

Pour passer des systèmes opérationnels de l’entreprise vers un data warehouse orienté analyse, les données suivent un certain nombre d’étapes et de transformations.

La structure théorique la plus utilisée est la suivante (modèle central) :

Selon les besoins, le volume ou la criticité des données, certaines étapes peuvent être sautées ou combinées (cf. Différentes architectures).

Staging

La première étape est de centraliser toutes les données de la partie opérationnelle vers une base de données tampon appelée staging. Idéalement seule une partie, souvent la plus récente, est importée.

L’objectif est d’extraire les données intéressantes avec un impact minimal sur les performances des systèmes opérationnels. On préserve ainsi les performances pour les utilisateurs des applications métiers. Le staging est purgé et réalimenté à chaque import.

Operational Data Store (ODS)

L’ODS est une étape intermédiaire dans laquelle sont historisés les imports successifs du staging. Selon les entreprises et les usages, cette étape peut contenir seulement des traitements simples (format des données), ou encore des transformations plus complexes, telles que rapprochement et agrégations. Sa structure peut être très proche du staging ou se rapprocher plus de la structure finale du datawarehouse.

Data warehouse

Le résultat final des transformations est dans le datawarehouse. Tous les rapprochements et agrégations sont réalisés à partir des informations de l’ODS afin d’obtenir la structure voulue pour l’analyse. C’est sur cette base que vont requêter les outils de reporting pour construire les tableaux de bords finaux.

Différentes architectures

Selon les besoins spécifiques de l’entreprise, le modèle central peut être adapté, en particuler en utilisant des datamarts pour s’approcher au mieux du modèle d’analyse. En effet, on peut avoir besoin de plus de rapidité dans le traitement des données, ou plus de facilité dans la construction du reporting. En plus du modèle précédent, les deux architectures souvent mises en œuvres sont les suivantes :

Modèle départemental

Le datawarehouse est remplacé par un ensemble de datamarts.

Si cette architecture est plus rapide à mettre en place, elle s’avère moins viable sur le long terme car peu adaptable. Un changement des sources de données peut impacter l’ensemble des datamarts.

Modèle central et départemental

Des datamarts sont ajoutés en bout de chaîne et s’appuient sur le datawarehouse.

Il s’agit ici de la meilleure solution pour la viabilité sur le long terme. Le temps de mise en place est par contre important, ainsi que la volumétrie des données stockées.

Pour réaliser un projet BI, on utilise des outils spécifiques: les outils.