STATISTICHE DESCRITTIVE , SEGMENTAZIONE ED ANALISI ESPLORATIVA DEI DATI.
STATISTICA Base offre una selezione completa di metodi per l'analisi
esplorativa:
Statistiche Descrittive e Grafici. Il programma calcola praticamente
tutte le statistiche descrittive ad uso generale più comuni, incluse: mediana,
moda, quartili, percentili specificati dall'utente, media e deviazione standard,
intervalli interquartili, limiti di confidenza per la media, indice di
asimmetria e di curtosi (con i rispettivi errori standard), media armonica,
media geometrica e molte altre statistiche descrittive e diagnostiche. Come per
tutti i moduli di STATISTICA, è fornita un'ampia varietà di grafici che
aiuteranno l'utente nell'analisi esplorativa, per es., vari tipi di grafici
box-and-whisker, istogrammi, istogrammi di distribuzioni bivariate (3D o
categorizzati) scatterplot 2D e 3D con sottoinsiemi marcati, normal, half normal
e detrended probability plot, ecc.. È disponibile una selezione di test per
verificare l'adattamento dei dati alla distribuzione normale (Kolmogorov-Smirnov,
Lilliefors e Shapiro-Wilk; è anche disponibile una serie di procedure per
verificare l'adattamento ad altre distribuzioni; si veda anche
Analisi dei Processi di STATISTICA; e si veda inoltre la sottosezione
sull'adattamento nella sezione Grafici).
Analisi
per Gruppi (Segmentazione). Praticamente tutte le statistiche descrittive e
tutti i grafici riassuntivi possono essere calcolati su dati categorizzati
(segmentati: breakdown) tramite una o più variabili di raggruppamento. Per
esempio, con soli pochi clic del mouse l'utente può suddividere i dati per
Sesso ed Età e quindi osservare gli istogrammi, i grafici
box-and-whisker, i normal probability plot, gli scatterplot, ecc.,
categorizzati. Se si sono selezionate più di due variabili di categorizzazione,
si possono produrre cascate dei rispettivi grafici. Sono offerte opzioni
per categorizzare in base a variabili continue; per es., si può richiedere che
una variabile sia suddivisa in un numero scelto di intervalli, oppure
utilizzare la procedura di ricodifica per definire il modo in cui la variabile
sarà ricodificata (opzioni per la categorizzazione di complessità praticamente
illimitata possono essere specificate in un qualunque momento; queste possono
evidenziare relazioni coinvolgenti tutte le variabili nel data set). In
aggiunta, è offerta una procedura specializzata di segmentazione gerarchica che
permette all'utente di categorizzare i dati per un massimo più sei variabili
categoriali e di calcolare una varietà di grafici, statistiche descrittive e
matrici di correlazioni categorizzati per sottogruppi (l'utente può
richiedere interattivamente di ignorare alcuni fattori nella tabella completa
di segmentazione e quindi esaminare le statistiche per ciascuna tabella
marginale). Numerose opzioni di formattazione e di etichettamento permettono
all'utente di produrre tabelle e report in qualità da pubblicazione, con
etichette lunghe e descrizioni di variabili. Si noti come nella procedura di
segmentazione si possano specificare piani m0olto ampi (per es., 100000 gruppi
per una sola variabile categoriale), ed i risultati includeranno tutte le
statistiche rilevanti per l'ANOVA (inclusa la tabella ANOVA completa, i test
sugli assunti, quale il test di Levene e di Brown-Forsythe per l'omogeneità
delle varianze, una selezione di sette test post-hoc, ecc.). Come per
tutti gli altri moduli di STATISTICA, è utilizzata una precisione di
calcolo estesa (precisione "quadrupla", dove applicabile) per offrire un
impareggiabile livello di accuratezza (si veda la sezione sulla Precisione).
Grazie alla natura interattiva del programma, l'esplorazione dei dati risulta
estremamente semplice. Per esempio, da qualunque Spreadsheet di risultati è
possibile produrre direttamente grafici esplorativi, puntando col mouse su
specifiche celle o intervalli di celle. È possibile produrre Cascate di
grafici anche complessi (per es., con categorizzazione multipla) con un singolo
clic del mouse, e questi possono essere letti in sequenza come uno slide-show
premendo il pulsante Continua. Oltre ai numerosi grafici statistici
predefiniti, l'utente può definire un numero indefinito di rappresentazioni
grafiche dei dati di base, di statistiche riassuntive, di relazioni tra
statistiche, così come di tutte le segmentazioni e categorizzazioni,
utilizzando le comode opzioni punta-e-clicca progettate per ridurre il
numero necessario di clic del mouse. Tutte le tecniche grafiche esplorative
(descritte nella sezione Grafici)
sono integrate con quelle statistiche, per facilitare l'analisi grafica dei
dati (per es., tramite eliminazione interattiva degli outlier, selezione di
sottogruppi, lisciamento, adattamento di funzioni, opzioni estese di brushing
per identificare facilmente e/o estrarre dati selezionati, ecc.). Si veda anche
la sezione su
Statistiche su Blocchi, in seguito.