Définition
Linformatique décisionnelle (Management du système dinformation, en anglais : DSS ou encore B.I.) désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, dune entreprise en vue doffrir une aide à la décision et de permettre aux responsables de la stratégie dentreprise davoir une vue densemble de lactivité traitée. Ce type dapplication utilise en règle générale un datawarehouse (ou entrepôt de données) pour stocker des données transverses provenant de plusieurs sources hétérogènes et fait appel à des traitements lourds de type "batch" pour la collecte de ces informations.
Linformatique décisionnelle sinsère dans larchitecture plus large dun système dinformation.
Les applications classiques dune organisation permettent de stocker, restituer, modifier les données des différents services opérationnels de lentreprise (logistique, gestion de la qualité, marketing, finance par loutil comptable). Ces différents services possèdent chacun une ou plusieurs applications propres, et les données y sont rarement structurées ou codifiées de la même manière que dans les autres services. Chaque service dispose le plus souvent de ses propres tableaux de bord et il est rare que les indicateurs (par exemple : le chiffre daffaires sur un segment de clientèle donné) soient mesurés partout de la même manière, selon les mêmes règles et sur le même périmètre même sil est possible dévaluer lentreprise. Pour pouvoir obtenir une vision synthétique de chaque service ou de lensemble de lentreprise, il convient donc que ces données soient filtrées, croisées et reclassées dans un entrepôt de données central. Cet entrepôt de données va permettre aux responsables de lentreprise et aux analystes de prendre connaissance des données à un niveau global et ainsi prendre des décisions plus pertinentes, doù le nom dinformatique décisionnelle.
Source : Wikipedia
Processus global
Liste des phases dun projet décisionnel
Comme je le disais dans la partie précédente, un projet décisionnel est composé de 4 phases clés :
- La phase de collecte
- La phase dintégration
- La phase dorganisation
- La phase de restitution
Schéma global

— Processus global de traitement des données dun système décisionnel —
Source : Bewise
Je vais maintenant détailler ces 4 phases et expliquer les éléments quelles contiennent.
Processus détaillé
La phase de collecte
La collecte séffectue à partir de données appelées : données sources. Ces données peuvent se présenter sous différents formats. Il peut sagir de fichiers "plats" (fichiers CSV avec séparateurs, fichiers XML, fichiers ASCII...) mais aussi de systèmes de bases de données (export de base MySQL, PostgreSQL, DB2, ORACLE...). Ces sources de données sont donc en général hétérogènes cest pourquoi il va falloir passer par une phase dites dintégration pour pouvoir les manipuler avant de les stocker dans notre système daide à la décision.
La phase dintégration
Cest à ce niveau quapparait la première couche logicielle de lenvironnement décisionnel à savoir lETL. Cette couche offre des fonctions dextraction de données issues de différents systèmes (internes ou externes), de transformation de ces données (homogénisation, filtrage, calcul) et de leur chargement dans un ODS intermédiaire ou directement dans le DW (entrepôt de données). Elle garantit la délocalisation de la charge de calcul et une meilleure disponibilité des sources.
La deuxième couche logicielle est lODS qui fait office de structure intermédiaire destinée à stocker les données issues des systèmes de production opérationnelle. Ce sont en quelque sorte des zones de préparation avant lintégration des données dans le DW : périodicité journalière, données qualifiées, premier niveau de filtrage et dagrégat. En général, il existe deux types de schéma : un schéma "ODS brut" qui contient les tables qui recoivent les données brutes des différentes sources et un schéma "ODS final" qui contient des tables avec une structure (champs et contraintes associées) le plus proche possible du schéma du DW (même si les tables de celui-ci peuvent contenir plus de champs que les tables du DW) car ces données vont ensuite être figées dans lentrepôt. LODS ne contient des données que sur une faible période et ces données vont être manipulées, transformées, traitées, modifiées plusieurs fois avant dêtre copiées dans le DW. On peut se passer dutilisation dun ODS dans un seul cas : si les données du DW sont une simple copie (cest-à-dire quil ny a pas de traitements à faire et que les données extraites ne vont pas évoluer) des données de production (sources) ce qui nest malheureusement pratiquement jamais le cas dans de grosses structures.
La phase dorganisation
La trosième phase permet de stocker les données dans un entrepôt appelé : Datawarehouse. Cet entrepôt contient les données orientées métier, non volatiles (datées), historisées et documentées. Cette structure de données est volontairement généralement dénormalisée pour pouvoir optimiser les temps de réponses lorsque lon fait des analyses de type OLAP qui se réfère à une base de données multidimensionnelle (aussi appelée cube ou hypercube). Elle est constituée de dimensions ou axes danalyse (laxe temporel ou géographie sont des exemples courant) et de faits ou indicateurs (tels que le chiffre daffaires). Un élément important vient du fait que les données stockées dans le DW ne doivent plus changer une fois à lintérieur. Ce sont des données consolidées et figées qui vont nous permettre de faire toute sorte danalyses et statistiques.
Une fois ces données stockées dans le Datawarehouse, on va pouvoir créer des magasins de données appelés : Datamarts. Comme le Datawarehouse, cest un entrepôt de données mais dédié à une fonction de lentreprise pour des raisons daccessibilité, de facilité dutilisation ou de performance. Les données sont généralement équivalentes à celles présentes dans le DW principal mais elles sont représentées de façon adaptée aux besoins spécifiques de la fonction et/ou du domaine utilisateur (par exemple, on va créer un DM dédié pour le service Marketing ou Commercial). Le DM peut avoir une implémentation physique (cube) ou nêtre quune vue logique ("multiprovider").
La phase de restitution
La dernière phase concerne la restitution des résultats, on distingue à ce niveau plusieurs types doutils différents :- Les outils de reporting et de requêtes
- Les outils danalyse
- La phase de Datamining
Les outils de reporting et de requêtes permettent la mise à disposition de rapports périodiques, pré-formatés et paramétrables par les opérationnels. Ils offrent une couche dabstraction orientée métier pour faciliter la création de rapports par les utilisateurs eux-mêmes en interrogeant le datawarehouse grâce à des analyses croisées. Ils permettent également la production de tableaux de bord avec des indicateurs de haut niveau pour les managers, synthétisant différents critères de performance.
Les outils danalyse OLAP permettent de traiter des données et de les afficher sous forme de cubes multidimensionnels et de naviguer dans les différentes dimensions. Cet agencement des données permet dobtenir immédiatement plusieurs représentations dun même résultat, en une seule requête sous une approche descendante des niveaux agrégés vers les niveaux détaillés (Drill-down, Roll-up).
Les outils de Datamining offrent une analyse plus poussée des données historisées permettant de découvrir des connaissances cachées dans les données comme la détection de corrélations et de tendances, létablissement de typologies et de segmentations ou encore des prévisions. Le Datamining est basé sur des algorithmes statistiques et mathématiques, et sur des hypothèses métier.
Fonctionnalités transverses
Il existe 2 grandes familles doutils :
- Le meta-dictionnaire
- Les outils dadministration
Le meta-dictionnaire (ou méta data), a pour rôle de décrire lensemble des données gérées dans le système, depuis les sources de données jusquaux restitutions. Il permet aussi de gérer les données communes à toutes les couches.
Les outils dadministration servent à réaliser principalement des sauvegardes ou des restaurations, assurer un suivi de lutilisation et des performances (journaux ou "logs") ou encore de gérer les droits et les restrictions pour les accès aux applications et aux données selon les utilisateurs.
Schéma détaillé

— Processus détaillé de traitement des données dun système décisionnel —