Un cubo OLAP (On Line Analytical Processing) è una struttura che permette la memorizzazione dei dati e conseguentemente di effettuare analisi in tempi rapidi. Il cubo OLAP può essere immaginato come una estensione del foglio di lavoro a due dimensioni. Il cubo ha da 3 ad un arbitrario numero di caratteristiche o dimensioni. Più propriamente potremmo chiamare il cubo OLAP "ipercubo", in quanto spiega la caratteristica che possiedono i cubi OLAP di analizzare più di 3 dimensioni contemporaneamente.Gli elementi base di OLAP sono i “Data Cube”, i cubi che contengono i dati e che consentono una
navigazione multidimensionale. Ogni lato del cubo rappresenta una dimensione. Una dimensione è caratterizzata da un insieme di attributi con livelli di gerarchia e corrispondono alle successive righe e colonne dell’analisi. Una misura è la proprietà dei fatti da analizzare a valore numerico e corrispondono quindi ai valori che vengono calcolati in seguito.
Tutte le dimensioni presenti in un’analisi possono essere associate, arrivando ad un numero a piacere di combinazioni. Possono cosìessere rappresentate situazioni estremamente complesse, anche in presenza di una mole considerevole di dati. La gerarchia di una dimensione descrive una relazione gerarchica tra due o più membri della dimensione.
I singoli membri di una dimensione possono essere in relazione tra loro in modo gerarchico. Ad esempio, un giorno specifico appartiene a un determinato mese che, a sua volta, rientra in un anno specifico. Per riflettere relazioni di questo tipo, i membri delle dimensioni sono organizzati in gerarchie delle dimensioni.
La gerarchia di una dimensione è una struttura logica che utilizza livelli ordinati come metodo di organizzazione e aggregazione dei dati. Ad esempio, la dimensione "ORA" può avere una gerarchia che aggrega i dati dal livello "MESE" al livello "TRIMESTRE" al livello "ANNO".
Una dimensione può avere più di una gerarchia. Ad esempio, oltre alla gerarchia MESE-TRIMESTRE-ANNO, la dimensione ORA può avere anche la gerarchia GIORNO-MESE-ANNO. Bisogna tenere presente che se esistono più gerarchie per la stessa dimensione, è necessario specificare una gerarchia predefinita per la dimensione.
Le operazioni di Slice and Ice sono delle funzionalità OLAP che consentono di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione, come ad esempio la creazione di master-detail e rotazione degli assi delle rappresentazioni a matrice.
Le operazioni di slice and ice sono operazioni di selezione e proiezione per estrarre piani o sottocubi senza fare aggregazioni delle misure.
Tali operazioni selezionano (o in altre parole filtrano) un sottoinsieme delle celle del cubo, ottenuta “affettando e tagliando” a cubetti il cubo stesso, e selezionano e proiettano riducendo la dimensionalità dei dati.
Slice taglia una fetta del cubo con restrizioni su una dimensione, Ice invece taglia un cubetto con restrizione su due o più dimensioni.
In statistica si definisce "Tabella di contingenza" una tabella costituita da righe che rappresentano i possibili valori (o categorie) di una variabile e da colonne che rappresentano i possibili valori (o categorie) di una seconda variabile. I dati nel corpo della tabella sono il numero di volte in cui compare ogni coppia di valori/categorie. Talvolta la "Tabella di contingenza" è detta anche "Tabella a doppia entrata", essa come si è già detto rappresenta una distribuzione di dati bivariati, cioè che considerano contemporaneamente due variabili di tipo sia qualitativo, sia quantitativo riferite alle stesse unità statistiche. L’aspetto è quello di una tabella suddivisa rispettivamente per righe e colonne secondo le modalità delle due variabili. All’interno della tabella, ad ogni incrocio delle righe con le colonne, è scritta la frequenza, cioè il numero di unità statistiche che presentano una data modalità di una delle due variabili in combinazione con una data modalità dell’altra.
Nessun commento:
Posta un commento