Definition und Anwendungsbereich
Es gibt keine eindeutige Definition. Die geläufigste wird aber von Bill Immon geliefert. Das Data-Warehouse ist eine Sammlung von themenbezogenen Daten aus diversen Quellen, die dauerhaft gespeichert werden. Die Speicherung der Daten erfolgt nach einer bestimmten Struktur in denormalisierten, relationalen Datensammlungen. So können Daten abteilungsübergreifend evaluiert und Entscheidungsprozesse innerhalb eines Unternehmens erleichtert werden, da oftmals verschiedene Abteilungen auf die gleichen Daten Zugriff benötigen. Somit ist es ein wichtiger Bestandteil des Wissens- und Informationsmanagement eines Betriebes.
Geschichte
IBM stellte bereits in der Mitte der 1980er- Jahren das Konzept, das hinter dem Data-Warehouse steht vor. Der eigentliche Name wurde erstmals 1988 von Barry Devlin verwendet. Als Begründer des Konzepts gibt dennoch Bill Immon, da seine Definition am häufigsten Gebraucht findet.
Prozess des Data Warehouse
Der Gesamtprozess wird als Data-Warehousing bezeichnet, er umfasst die Beschaffung von Daten und deren Weiterverarbeitung (ETL-Prozess), die Speicherung der Daten, die Analyse der Daten und die Versorgung und Datenhaltung der Data Marts.