Data Mining , explorer les données du Data Warehouse

Le Data Mining !

Le Data Mining est en fait un terme générique englobant toute une famille d’outils facilitant l’exploration et l’analyse des données contenues au sein d’une base décisionnelle de type Data Warehouse ou DataMart. Les techniques mises en action lors de l’utilisation de cet instrument d’analyse et de prospection sont particulièrement efficaces pour extraire des informations significatives depuis de grandes quantités de données.,Il ne suffit pas de stocker une multitude de données au sein d’une base spécialisée, Data Warehouse ou Big Data, encore faut-il les exploiter. C’est là le rôle du Data Mining qui, bien utilisé, saura tirer les enseignements contenus dans cette masse de données bien trop importante pour se contenter des seuls outils statistiques. Voyons, le principe, les méthodes utilisées, les outils et un cas concret mettant en évidence l’importance de la qualité des données.

Data Mining  , explorer les données du Data Warehouse 1

Forage de données, explorations de données ou fouilles de données, ce sont les traductions possibles du data mining en Français. En règle générale, le terme Data Mining désigne l’analyse de données depuis différentes perspectives et le fait de transformer ces données en informations utiles, en établissant des relations entre les données ou en repérant des patterns. Ces informations peuvent ensuite être utilisées par les entreprises pour augmenter un chiffre d’affaires ou pour réduire des coûts. Elles peuvent également servir à mieux comprendre une clientèle afin d’établir de meilleures stratégies marketing.

Les logiciels Data Mining font partie des outils analytiques utilisés pour l’analyse de données. Ils permettent aux utilisateurs d’analyser des données sous différents angles, de les catégoriser, et de résumer les relations identifiées. Techniquement, le Data Mining est le procédé permettant de trouver des corrélations ou des patterns entre de nombreuses bases de données relationnelles.

Le Data Mining repose sur des algorithmes complexes et sophistiqués permettant de segmenter les données et d’évaluer les probabilités futures. Le Data Mining est également surnommé Knowledge Discovery in Data (Data mining traduction ? La découverte de savoir dans les données).

data mining processus

Data Warehouse : Qu’est-ce que c’est ?

Un Data Warehouse est une technologie qui regroupe des données structurées provenant d’une ou de plusieurs sources afin qu’elles puissent être comparées et analysées pour une meilleure business intelligence. Récemment, Oracle a lancé Autonomous Data Warehouse, qui appartient à une base de données autonome.

 

 

D’un point de vue plus technique, un Data Warehouse est défini comme un ensemble de données orientées sujet, intégrées, variables dans le temps et non volatiles.

  • Orienté sur le sujet : Organisé par thème, il est possible d’utiliser le Data Warehouse pour analyser n’importe quel secteur particulier de l’entreprise.
  • Intégré : Avant toute utilisation, les données récupérées de sources hétérogènes internes ou externes sont intégrées au Data Warehouse. Pour cela, il est nécessaire de les mettre en forme et de les unifier pour garantir une certaine cohérence. Les données proviennent principalement de traitement transactionnel en ligne (OLTP).
  • Variante temporelle : Les données passées sont également conservées dans le Data Warehouse, contrairement à certains des systèmes transactionnels traditionnels où seules les données les plus récentes sont stockées. Cela permet de visualiser l’évolution dans le temps des différentes données.
  • Non volatile : Les données une fois stockées dans l’entrepôt de données ne peuvent jamais être modifiées.

 

Quelles sont les différences entre un data warehouse et une base de données traditionnelle ?

Bien qu’un Data Warehouse et une base de données stockent des données, ces deux systèmes ont été conçus à des fins différentes. Nous pouvons citer 3 distinctions majeures entre ces deux technologies :

  • Le Data Warehouse doit stocker une grande quantité de données historiques et permettre des requêtes rapides et complexes à travers les données en utilisant des technologies comme OLAP et ses dérivés voire In-memory. La base de données sert à stocker les transactions courantes et permet un accès rapide à des transactions spécifiques notamment grâce aux technologies d’indexation.
  • Les bases de données sont généralement normalisées, ce qui signifie qu’il existe une copie unique de chaque donnée. Dans le Data Warehouse, il est courant de stocker différentes versions des mêmes données.
  • Les bases de données sont généralement optimisées pour les opérations de lecture/écriture. Un Data Warehouse est optimisé pour traiter les requêtes agrégées ainsi que les opérations de lecture/récupération.

Laisser un commentaire

Contactez-nous

GSM : 06 59 67 74 68

FIX : 05 36 53 89 20

E-mail : contact@fibotechs.com

Adresse : BD HASSAN 2 ROUTE SIDI YAHYA AU DESSUS CAFE EL NAKHIL 1ER ETAGE
60000 Oujda

 

Abonnez-vous à notre newsletter