Blogs

Home / Blogs / Wat is een datamart? Ontwerp, voorbeelden en implementatie uitgelegd

Inhoudsopgave
De geautomatiseerde, Geen code datastapel

Leer hoe Astera Data Stack kan het gegevensbeheer van uw onderneming vereenvoudigen en stroomlijnen.

Wat is een datamart? Ontwerp, voorbeelden en implementatie uitgelegd

December 19th, 2023

In tegenstelling tot een datawarehouse waarin bedrijfsbrede gegevens worden opgeslagen, bevat een datamart informatie die betrekking heeft op een bepaalde afdeling of vakgebied. Een verkoopdatamart kan bijvoorbeeld alleen gegevens bevatten die betrekking hebben op producten, klanten en verkopen. Lees deze blog om een ​​beter inzicht te krijgen in deze departementale gegevensopslagplaatsen.

Wat zijn datamarts?

Datamarts zijn een subset van het datawarehouse dat zich met één enkele kwestie bezighoudt. Ze worden vaak gebouwd en beheerd door één enkele bedrijfsafdeling. Omdat ze onderwerpgericht zijn, halen ze doorgaans gegevens uit slechts een klein aantal bronnen, bijvoorbeeld interne operationele systemen. data lake, een gecentraliseerd datacollectieof externe bronnen. Ze zijn meestal compact en minder ingewikkeld dan datawarehouses, waardoor ze gemakkelijker te bouwen en te onderhouden zijn.

Nu we hebben begrepen wat ze zijn, zullen we kijken naar de drie verschillende soorten datamart-voorbeelden, hun toepassingen en hoe ze het gegevensbeheer vereenvoudigen. We illustreren ook een stapsgewijze handleiding voor het implementeren van een afdelingsspecifieke gegevensopslagplaats voor uw specifieke bedrijf.

Soorten datamarts

Bron: Study.com

Welke voordelen hebben datamarts voor databasebeheer?

Laten we, voordat we de verschillende typen ervan bespreken, kort kijken naar de voordelen van datamarts en waarom ze nodig zijn voor een datagestuurd bedrijf:

  • Maak snellere gegevenstoegang mogelijk door een specifieke set gegevens op te halen voor BI en rapportage. Als gevolg hiervan helpt het de business intelligence te versnellen.
  • Ze zijn eenvoudiger te implementeren en kosteneffectiever dan het opzetten van een onderneming datawarehouse.
  • Ontworpen volgens de eisen van een bepaalde groep gebruikers die op een specifieke afdeling werken.
  • Ze zijn relatief flexibeler dan een datawarehouse. Elke wijziging in het datamodel kan vanwege de kleinere omvang eenvoudig en snel in de datamart worden opgenomen.
  • Sta gedetailleerde toegangscontrolerechten toe vanwege uitgebreide partitionering en segmentatie.

Kortom, ze zijn een stuk sneller, aanpasbaar en kosteneffectief in onderhoud dan een datawarehouse. Datawarehouses worden daarentegen gemaakt voor het consolideren van gegevens uit een groot aantal bronnen (vaak niet in een gestructureerd formaat).

Soorten datamarts

Datamarts kunnen in drie hoofdtypen worden ingedeeld:

1. Afhankelijk

Met een afhankelijke datamart kunt u al uw bedrijfsgegevens in één combineren datawarehouse, waardoor u de typische voordelen van centralisatie krijgt.

In dit voorbeeld zijn afdelingsgegevensarchieven nodig en moet u deze als afhankelijke entiteiten bouwen om consistentie en integratie tussen alle gegevensopslagsystemen te garanderen.

Afhankelijke datamarts kunnen op twee verschillende manieren worden geconstrueerd. In de eerste benadering worden bedrijfsdatawarehouses en datamarts gebouwd zodat de operator toegang heeft tot beide wanneer dat nodig is. Bij de tweede benadering, ook wel de federatieve benadering genoemd, worden de resultaten van het ETL-proces opgeslagen in een tijdelijk opslaggebied, zoals een gemeenschappelijke databus, in plaats van een fysieke opslaglocatie. databank zodat de operator alleen toegang heeft tot de afdelingsgegevens.

Deze laatste methodologie is niet ideaal omdat het af en toe een gegevensschroothoop oplevert waarin alle gegevens afkomstig zijn uit een gedeelde bron, maar meestal wordt weggegooid.

2. Onafhankelijk

Er kan een onafhankelijke datamart worden gecreëerd zonder gebruik te maken van het centrale datawarehouse. Het wordt vooral aanbevolen voor kleinere eenheden of groepen binnen een organisatie. Zoals de naam al doet vermoeden, is dit soort repository noch gerelateerd aan het enterprise datawarehouse, noch aan enige andere entiteit. Het voert de gegevens afzonderlijk in en ook de analyses worden zelfstandig uitgevoerd.

Naarmate er steeds meer onafhankelijke datamarts worden gebouwd, neemt ook de gegevensredundantie in de hele organisatie toe. Dit komt omdat elke onafhankelijke dataopslag zijn eigen dataopslag nodig heeft, meestal een duplicaat van de uitgebreide bedrijfsinformatie. Omdat deze onafhankelijke gegevensopslagplaatsen rechtstreeks toegang hebben tot bestanden en/of tabellen van het operationele systeem, zijn ze aanzienlijk groter de schaalbaarheid van de beslissingsondersteunende systemen (DSS) beperken.

3. Hybride

Door gebruik te maken van een hybride datamart kunt u naast een datawarehouse ook data uit meerdere operationele bronsystemen combineren. Deze zijn met name handig als u ad-hocintegratie nodig heeft, zoals het toevoegen van een nieuwe groep of producten aan het bedrijf.

Zoals de naam al aangeeft, is een hybride datamart een combinatie van zowel de afhankelijke als de onafhankelijke typen. Het is geschikt voor bedrijven die meerdere databases hebben en een snelle doorlooptijd nodig hebben. Dit soort datamart-voorbeelden hebben een kleine opschoning van de gegevens nodig, ondersteunen enorme opslagstructuren en zijn flexibel omdat het de voordelen van zowel afhankelijke als onafhankelijke systemen combineert.

Datamarts ontwerpen voor datawarehousing

Zo kunt u een datamart ontwerpen die aansluit bij de behoeften van uw onderneming:

1. ontwerp

De eerste stap is het creëren van een robuust ontwerp. Enkele kritische processen die bij deze fase betrokken zijn, zijn:

  • Het verzamelen van de bedrijfs- en technische vereisten.
  • Gegevensbronnen identificeren.
  • Een geschikte gegevenssubset kiezen.
  • Ontwerpen van de logische lay-out (databaseschema) en fysieke structuur.

2. Bouwen/construeren

De volgende stap in het proces is het bouwen van de datamart. Dit omvat het creëren van de fysieke database en de logische structuren. In deze fase bouwt u de feitentabellen, dimensietabellen, velden, indexen en toegangscontroles.

3. Invullen/gegevensoverdracht

De volgende stap is het vullen van de markt, wat betekent dat er gegevens naartoe worden overgebracht. In deze fase kunt u ook de frequentie van de gegevensoverdracht instellen, bijvoorbeeld dagelijks of wekelijks. Deze stap omvat meestal:

  • Broninformatie extraheren.
  • Het opschonen en transformeren van de gegevens.
  • Het laden van de gegevens in de afdelingsrepository.
  • Het opbouwen van de metadata en het opslaan ervan.

4. Gegevenstoegang

In deze stap worden de gegevens die in de datamart zijn geladen, gebruikt bij het uitvoeren van query's, het genereren van rapporten, grafieken en publiceren. De belangrijkste taken in deze fase zijn:

  • Het opzetten van een metalaag en het vertalen van databasestructuren en itemnamen naar bedrijfsuitingen, zodat niet-technische operators de datamart gemakkelijk kunnen gebruiken.
  • Opzetten en onderhouden van databasestructuren.
  • Indien nodig kunt u ook API en interfaces instellen om de toegang tot gegevens te vereenvoudigen.

5. beheren

De laatste stap omvat management en observatie, waaronder:

  • Controle van doorlopende gebruikerstoegang.
  • Optimalisatie en verfijning van het doelsysteem voor verbeterde prestaties.
  • Toevoeging en beheer van nieuwe gegevens in de repository.
  • Herstelinstellingen configureren en de beschikbaarheid van het systeem garanderen in geval van een storing.

Kijkend naar de toekomst – Data Marts en de cloud

Datamarts bieden een efficiënte, flexibele en schaalbare benadering voor het opslaan van gegevens. Lokale oplossingen raken echter snel achterhaald vanwege de groeiende hoeveelheid binnenkomende gegevens. Als gevolg hiervan verplaatsen veel bedrijven hun oplossingen voor gegevensopslag naar de cloud.

Dankzij een cloudgebaseerde architectuur kunnen bedrijven hun gegevens online creëren en opslaan. De snelheid en flexibiliteit van deze aanpak creëren kansen voor analytics in de cloud. Het uitvoeren van analyses in de cloud zorgt voor grotere schaalbaarheid en kostenefficiëntie in vergelijking met opties op locatie. Dat is niet alles. Cloudgebaseerde datamarts bieden nog tal van andere voordelen:

  • Realtime data-analyse.
  • On-demand toegang tot gegevens.
  • Een uniform overzicht van alle datamarts.
  • Toegang tot cloud-native bronnen en bestemmingen.

The Bottom Line

Een datamart bevat een subsectie van bedrijfsbrede gegevens, die waardevol zijn voor een bepaalde gebruikersgroep in de organisatie. In tegenstelling tot een datawarehouse dat duur en complex is om te creëren, biedt het een kostenefficiënt alternatief. Het maakt ook snellere gegevenstoegang mogelijk en is eenvoudig te gebruiken, omdat het precies is ontworpen volgens de eisen van de operators en zich richt op één afdeling/vakgebied.

Een datamart kan u helpen uw bedrijfsprocessen te versnellen, omdat de implementatie ervan minder tijd kost dan een datawarehouse. Het bevat ook gegevens uit het verleden, zodat uw data-analisten gemakkelijk datatrends kunnen bepalen.

Dit vind je misschien ook leuk
Wat is een zakelijke woordenlijst? Definitie, componenten en voordelen
Wat is online transactieverwerking (OLTP)?
Beste dataminingtools in 2024
aangezien Astera Voor uw databeheerbehoeften?

Breng codevrije connectiviteit tot stand met uw bedrijfsapplicaties, databases en cloudapplicaties om al uw gegevens te integreren.

Laten we nu verbinding maken!
laten we verbinden