Quelle est la différence entre une base de données et un entrepôt de données?

163

Quelle est la différence entre une base de données et un entrepôt de données?

Ne sont-ils pas la même chose, ou du moins écrits dans la même chose (c'est-à-dire Oracle RDBMS)?

Homme de données
la source

Réponses:

147

Consultez ceci pour plus d'informations.

À partir d'un lien précédent:

Base de données

  1. Utilisé pour le traitement transactionnel en ligne ( OLTP ) mais peut être utilisé à d'autres fins telles que l'entreposage de données. Cela enregistre les données de l'utilisateur pour l'historique.
  2. Les tables et jointures sont complexes car normalisées (pour RDMS ). Ceci est fait pour réduire les données redondantes et pour économiser de l'espace de stockage.
  3. Entité - Les techniques de modélisation relationnelle sont utilisées pour la conception de bases de données RDMS.
  4. Optimisé pour l'opération d'écriture.
  5. Les performances sont faibles pour les requêtes d'analyse.

Entrepôt de données

  1. Utilisé pour le traitement analytique en ligne ( OLAP ). Cela lit les données historiques pour les utilisateurs pour les décisions commerciales.
  2. Les tables et jointures sont simples puisqu'elles sont dé-normalisées. Ceci est fait pour réduire le temps de réponse pour les requêtes analytiques.
  3. Données - Des techniques de modélisation sont utilisées pour la conception de l'entrepôt de données.
  4. Optimisé pour les opérations de lecture.
  5. Haute performance pour les requêtes analytiques.
  6. Est généralement une base de données.

Il est également important de noter que les entrepôts de données peuvent provenir de zéro à de nombreuses bases de données.

TheCloudlessSky
la source
3
La modélisation des données est un terme générique et ne s'applique pas uniquement aux entrepôts de données. (Peut-être que dans le deuxième numéro 3, ils signifiaient «modélisation dimensionnelle» car c'est, d'après mon expérience, la façon la plus populaire de les construire.) La dernière ligne n'a pas de sens: comment un entrepôt de données «contient» une base de données? Je pourrais dire qu'un entrepôt de données provient de 0 à plusieurs bases de données (OLTP).
Patrick Marchand
2
@Mark - Où est-il dit que les bases de données sont UNIQUEMENT pour OLTP? Il montre comment les bases de données sont liées aux entrepôts de données.
TheCloudlessSky
5
@Nickolay - C'est une réponse vieille de deux ans. Modifiez-le et corrigez-le si vous êtes concerné.
TheCloudlessSky
1
@DataMan - Marquez ceci comme réponse correcte. c'est une réponse assez bonne et juste à votre question.
sanzy
1
Quelle est la différence entre Data - Techniques de modélisation et Entité - Techniques de modélisation relationnelle?
QAIS
32

À partir d'une vue non technique: une base de données est limitée à une application ou à un ensemble d'applications particulier.

Un entrepôt de données est un référentiel de données au niveau de l'entreprise. Il contiendra des données de tous / de nombreux segments de l'entreprise. Il va partager ces informations pour donner une image globale de l'entreprise. Il est également essentiel à l'intégration entre les différents segments de l'entreprise.

D'un point de vue technique: Le mot «Data Warehouse» n'a pas reçu de définition reconnue. Personnellement, je définis un data warehouse comme une collection de data-marts. Où chaque magasin de données consiste en une ou plusieurs bases de données où la base de données est spécifique à un ensemble de problèmes spécifique (application, ensemble de données ou processus).

En termes simples, une base de données est un composant d'un entrepôt de données. Il existe de nombreux endroits pour explorer ce concept, mais comme il n'y a pas de «définition», vous trouverez des défis avec toutes les réponses que vous donnez.

Markus
la source
Le Datamart est de préférence une base de données OLTP?
CᴴᴀZ
@ CᴴᴀZ pour quoi? Datamart sont créés pour l'OLAP, Datamart est essentiellement un petit DWH (pour une petite partie de l'entreprise). il est créé pour l'analyse, donc si vous avez besoin d'un système OLTP, un datamart n'est pas votre choix, si vous avez besoin d'un modèle de données pour l'analyse (schéma de démarrage ou flux de neige), vous préférez un datamart.
Enrique Benito Casado
Salut @Enrique, j'ai compris: Datamart contribue à l'OLAP. J'ai pris le signal de Datamarts étant OLTP d' ici - SQL Server OLTP Datamart .
CᴴᴀZ
Salut @ CᴴᴀZ, j'ai lu l'article et ce serait juste comment faire un OLTP avec un Datamart. D'accord . (mais je pense qu'ils l'ont dit comme une exception) Prenez en compte que comment ils disent, les tables OLTP doivent être normalisées afin de ne pas avoir d'incohérences. la normalisation n'est pas si compliquée à faire dans un schéma ER mais elle est beaucoup plus compliquée pour les thats Star-Schema ou Snow-Flow. Ces schémas sont conçus pour faciliter une lecture dans la base de données et non une opération transactionnelle. C'est pourquoi utiliser un Datamart comme OLTP ne devrait pas être une bonne idée, même si c'est possible.
Enrique Benito Casado
16

Un entrepôt de données est un TYPE de base de données.

En plus de ce que les gens ont déjà dit, les entrepôts de données ont tendance à être OLAP, avec des index, etc. réglés pour la lecture, pas pour l'écriture, et les données sont dé-normalisées / transformées en des formes plus faciles à lire et à analyser.

Certaines personnes ont dit que les «bases de données» sont les mêmes que OLTP - ce n'est pas vrai. OLTP, encore une fois, est un TYPE de base de données.

Autres types de "bases de données": Fichiers texte, XML, Excel, CSV ..., Fichiers plats :-)

Dave
la source
1
C'est la bonne réponse de tous. Et un peu sur Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ
7

La façon la plus simple de l'expliquer serait de dire qu'un entrepôt de données est plus qu'une simple base de données. Une base de données est une collection de données organisée d'une manière ou d'une autre, mais un entrepôt de données est organisé spécifiquement pour «faciliter le reporting et l'analyse». Ce n'est cependant pas toute l'histoire car l'entreposage de données contient également «les moyens de récupérer et d'analyser les données, d'extraire, de transformer et de charger des données, et de gérer le dictionnaire de données sont également considérés comme des composants essentiels d'un système d'entreposage de données».

Entrepôt de données

kniemczak
la source
4

DataBase : - OLTP (processus de transaction en ligne)

  • Ce sont des données actuelles, des données détaillées à jour, des données relationnelles isolées plates.
  • La relation d'entité est utilisée pour concevoir la base de données
  • Taille de la base de données 100 Mo-Go transaction simple ou quires

Entrepôt de données

  • OLAP (processus analytique en ligne)
  • Il s'agit de données historiques Schéma d'étoile, schéma de neige fléchie et galaxie
  • le schéma est utilisé pour concevoir l'entrepôt de données
  • Taille de la base de données 100 Go-To Fondation améliorée des performances des requêtes pour la VISUALISATION DES DONNÉES D'EXPLOITATION DE DONNÉES
  • Permet aux utilisateurs d'acquérir une compréhension et des connaissances plus approfondies sur divers aspects de leurs données d'entreprise grâce à un accès rapide, cohérent et interactif à une grande variété de vues possibles des données
ramya ankishetty
la source
4

Entrepôt de données vs base de données: un entrepôt de données est spécialement conçu pour l'analyse de données, ce qui implique la lecture de grandes quantités de données pour comprendre les relations et les tendances entre les données. Une base de données est utilisée pour capturer et stocker des données, telles que l'enregistrement des détails d'une transaction.

Entrepôt de données: charges de travail adaptées - analyses, rapports, big data. Source de données - Données collectées et normalisées à partir de nombreuses sources. Capture de données - Opérations d'écriture en masse généralement selon un calendrier de traitement par lots prédéterminé. Normalisation des données - Schémas dénormalisés, tels que le schéma Star ou le schéma Snowflake. Stockage des données - Optimisé pour la simplicité d'accès et les requêtes à grande vitesse. performances en utilisant le stockage en colonne. Accès aux données - Optimisé pour minimiser les E / S et maximiser le débit de données.

Base de données transactionnelle: charges de travail adaptées - Traitement des transactions. Source de données - Données capturées telles quelles à partir d'une source unique, telle qu'un système transactionnel. Capture de données - Optimisée pour les opérations d'écriture continue car de nouvelles données sont disponibles pour maximiser le débit des transactions. Normalisation des données - Schémas statiques hautement normalisés. Stockage de données - Optimisé pour des opérations d'écriture de haut niveau sur un seul bloc physique orienté ligne. Accès aux données - Volumes élevés de petites opérations de lecture.

LarryH
la source
1

Tout stockage de données pour l'application utilise généralement la base de données. Il peut s'agir d'une base de données relationnelle ou d'aucune base de données SQL actuellement en vogue.

L'entrepôt de données est également une base de données. Nous pouvons appeler la base de données de l'entrepôt de données comme stockage de données spécialisé à des fins de rapport analytique pour l'entreprise. Ces données sont utilisées pour la décision commerciale clé.

Les données organisées aident à établir des rapports et à prendre efficacement des décisions commerciales.

Rama Krishna
la source
1

Base de données:

Utilisé pour le traitement transactionnel en ligne (OLTP).

  • Orienté vers les transactions.
  • Orienté application.
  • Données actuelles.
  • Données détaillées.
  • Données évolutives.
  • De nombreux utilisateurs, administrateurs / opérationnels.
  • Temps d'exécution: court.

Entrepôt de données:

Utilisé pour le traitement analytique en ligne (OLAP).

  • Analyse orientée.
  • Orienté sujet.
  • Données historiques.
  • Données agrégées.
  • Données statiques.
  • Pas beaucoup d'utilisateurs, directeur.
  • Temps d'exécution: long.
Abderrahmen
la source
1

Un Data Warehousing (DW) est un processus de collecte et de gestion de données provenant de sources variées afin de fournir des informations commerciales significatives. Un entrepôt de données est généralement utilisé pour connecter et analyser des données d'entreprise provenant de sources hétérogènes. L'entrepôt de données est le cœur du système de BI qui est conçu pour l'analyse des données et le reporting.

Charith Perera
la source
0

La source de l'entrepôt de données peut être un cluster de bases de données, car les bases de données sont utilisées pour le processus de transaction en ligne, comme la conservation des enregistrements actuels, mais dans l'entrepôt de données, il stocke les données historiques destinées au processus analytique en ligne.

dgcharitha
la source
0

Un entrepôt de données est un type de structure de données généralement hébergé sur une base de données. L'entrepôt de données fait référence au modèle de données et au type de données qui y sont stockées - données qui sont modélisées (modèle de données) pour servir à des fins analytiques.

Une base de données peut être classée comme toute structure qui héberge des données. Traditionnellement, ce serait un SGBDR comme Oracle, SQL Server ou MySQL. Cependant, une base de données peut également être une base de données NoSQL comme Apache Cassandra, ou un MPP en colonne comme AWS RedShift.

Vous voyez qu'une base de données est simplement un endroit pour stocker des données; un entrepôt de données est un moyen spécifique de stocker des données et sert un objectif spécifique, qui est de répondre à des requêtes analytiques.

OLTP vs OLAP ne vous dit pas la différence entre un DW et une base de données, OLTP et OLAP résident sur des bases de données. Ils stockent simplement les données d'une manière différente (différentes méthodologies de modèles de données) et servent à des fins différentes (OLTP - transactions d'enregistrement, optimisées pour les mises à jour; OLAP - analyse des informations, optimisées pour les lectures).

Aakash Rami
la source
-1

Voir en termes simples: Dataware -> Données énormes utilisant pour Analytique / stockage / copie et analyse. Base de données -> Fonctionnement CRUD avec les données fréquemment utilisées.

Dataware house est un type de stockage que vous n'utilisez pas quotidiennement et la base de données est quelque chose que vous traitez fréquemment.

Par exemple. Si nous demandons un relevé bancaire, cela nous donne les 3/4/6 / plus derniers mois car il est dans la base de données. Si vous voulez plus que cela, il stocke sur Dataware House.

user7188680
la source
-1

Exemple: Une maison vaut $100,000, et elle s'apprécie à $1000chaque année.

Pour garder une trace de la valeur actuelle de la maison, vous utiliseriez une base de données car la valeur changerait chaque année.

Trois ans plus tard, vous pourrez voir la valeur de la maison qui est $103,000.

Pour garder une trace de la valeur historique de la maison, vous utiliseriez un entrepôt de données car la valeur de la maison devrait être

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
utilisateur3019766
la source