Data Warehouse

Qu'est-ce qu'un Data Warehouse (entrepôt de données) ?

Un entrepôt de données est une plateforme qui stocke des données provenant de plusieurs sources de données en un seul endroit.

Ce type de plateformes sont utilisées pour centraliser les données et faciliter ainsi l'interrogation de ces mêmes données.

Que peut stocker un Data Warehouse ?

Un entrepôt de données peut stocker des données structurées et non structurées.

Les données structurées sont organisées dans un format spécifique qui peut être facilement traité par les ordinateurs.

Les données non structurées ne sont pas organisées dans un format spécifique et peuvent être plus difficiles à traiter.

Les "Data Warehouse" stockent généralement les données sous forme de tableaux, ce qui facilite leur interrogation et leur analyse.

Quels sont les différents types de Data Warehouse ?

Il existe trois types différents d'entrepôts de données : les "Entreprise Data Warehouse" (EDW), les "Data Mart" et les "Operational Data Store".

Les EDW, entrepôts de données d'entreprise sont le type d'entrepôt de données le plus grand et le plus complexe. Ils sont utilisés par les grandes entreprises pour stocker toutes leurs données commerciales en un seul endroit centralisé.

Les Data Marts sont des entrepôts de données plus petits et plus spécifiques qui sont utilisés pour stocker un sous-ensemble de données d'entreprise.

Concernant les ODS, leurs utilités résident dans le fait de produire un niveau de granularité plus fin et créer une base de données plus légère et homogène afin d'agréger ces données au niveau du Data Warehouse, il agit ainsi comme un intermédiaire.

Quels sont les outils Data Warehouse les plus utilisés ?

Les outils d'entrepôt de données les plus couramment utilisés tendent à se chevaucher, car beaucoup d'entre eux sont conçus pour effectuer des tâches similaires. Toutefois, parmi les plus populaires, citons Apache Hadoop, Microsoft SQL Server, Oracle Database et IBM DB2.

databasepie-chartrocket