Inhoudsopgave:
Definitie - Wat betekent Parallelle gegevensanalyse?
Parallelle gegevensanalyse is een methode voor het analyseren van gegevens met behulp van parallelle processen die tegelijkertijd op meerdere computers worden uitgevoerd.
Het proces wordt gebruikt bij de analyse van grote gegevenssets, zoals grote telefoongesprekken, netwerklogboeken en webrepository's voor tekstdocumenten die te groot kunnen zijn om in een enkele relationele database te worden geplaatst. De methode wordt vaak gebruikt in Big Data Analytics en algemene data-analyse.
Techopedia verklaart Parallel Data Analysis
Het primaire concept achter parallelle data-analyse is parallellisme, gedefinieerd in computing als de gelijktijdige uitvoering van processen.
Dit wordt vaak bereikt door meerdere processors of zelfs meerdere computers te gebruiken en is een gangbare praktijk in gedistribueerd computergebruik. Bij de parallelle gegevensanalyse voeren verschillende computers die verschillende aspecten van gegevensanalyse uitvoeren deze processen tegelijkertijd uit en consolideren ze vervolgens de resultaten in één groot rapport.
De reden voor dit parallellisme is vooral om analyse sneller te maken, maar het is ook omdat sommige gegevenssets te dynamisch, te groot of gewoon te log zijn om efficiënt in een enkele relationele database te worden geplaatst. Het resultaat zou zijn dat die datasets zich in verschillende databases bevinden die geoptimaliseerd zijn voor dat soort data en op verschillende machines, dus lineaire analyse is gewoon geen efficiënte optie.
