Inhoudsopgave:
Definitie - Wat betekent Data Cube?
Een gegevenskubus verwijst naar een driedimensionaal (3D) (of hoger) waardenbereik dat doorgaans wordt gebruikt om de tijdvolgorde van de gegevens van een afbeelding uit te leggen. Het is een gegevensabstractie om geaggregeerde gegevens vanuit verschillende gezichtspunten te evalueren. Het is ook nuttig voor het afbeelden van spectroscopie, omdat een spectraal opgelost beeld wordt weergegeven als een 3D-volume.
Een gegevenskubus kan ook worden beschreven als de multidimensionale uitbreidingen van tweedimensionale tabellen. Het kan worden gezien als een verzameling identieke 2D-tafels die op elkaar zijn gestapeld. Gegevenskubussen worden gebruikt om gegevens weer te geven die te complex zijn om te worden beschreven door een tabel met kolommen en rijen. Als zodanig kunnen gegevenskubussen veel verder gaan dan 3-D en veel meer dimensies bevatten.
Techopedia verklaart Data Cube
Een gegevenskubus wordt meestal gebruikt om gegevens gemakkelijk te interpreteren. Het is vooral handig wanneer gegevens samen met dimensies worden weergegeven als bepaalde maatstaven voor zakelijke vereisten. Elke dimensie van een kubus vertegenwoordigt een bepaald kenmerk van de database, bijvoorbeeld dagelijkse, maandelijkse of jaarlijkse verkopen. De gegevens in een gegevenskubus maken het mogelijk om bijna alle cijfers voor vrijwel elke of alle klanten, verkoopagenten, producten en nog veel meer te analyseren. Zo kan een gegevenskubus helpen trends vast te stellen en prestaties te analyseren.
Gegevenskubussen zijn hoofdzakelijk onderverdeeld in twee categorieën:
- Multidimensionale gegevenskubus: de meeste OLAP-producten zijn ontwikkeld op basis van een structuur waarbij de kubus een multidimensionale array heeft. Deze multidimensionale OLAP-producten (MOLAP) bieden meestal betere prestaties in vergelijking met andere benaderingen, vooral omdat ze rechtstreeks in de structuur van de gegevenskubus kunnen worden geïndexeerd om subsets van gegevens te verzamelen. Wanneer het aantal dimensies groter is, wordt de kubus schaarser. Dat betekent dat verschillende cellen die bepaalde attribuutcombinaties vertegenwoordigen geen geaggregeerde gegevens zullen bevatten. Dit verhoogt op zijn beurt de opslagvereisten, die soms ongewenste niveaus kunnen bereiken, waardoor de MOLAP-oplossing onhoudbaar is voor enorme datasets met vele dimensies. Compressietechnieken kunnen helpen; het gebruik ervan kan echter de natuurlijke indexering van MOLAP beschadigen.
- Relational OLAP: Relational OLAP maakt gebruik van het relationele databasemodel. De ROLAP-gegevenskubus wordt gebruikt als een verzameling relationele tabellen (ongeveer twee keer zoveel als de hoeveelheid dimensies) in vergelijking met een multidimensionale array. Elk van deze tabellen, bekend als een kubus, betekent een specifieke weergave.