STATISTICA








(prodotto add-on)

Caratteristiche di STATISTICA Tecniche Esplorative Multivariate
Esegui le analisi via Web STATISTICA Tecniche Esplorative Multivariate offre un'ampia selezione di tecniche esplorative, dall'analisi di raggruppamento ai metodi avanzati degli alberi di classificazione, con un numero indefinito di strumenti di visualizzazione interattivi per l'esplorazione di relazioni e regolarità; è compreso un completo linguaggio integrato di Visual Basic.

Tecniche Esplorative Multivariate di STATISTICA è compatibile con Windows 95, Windows 98, Windows NT, Windows 2000, Windows XP, Windows Me. Include i seguenti moduli:
Tecniche di Analisi di Raggruppamento
Analisi Fattoriale
Analisi delle Componenti Principali e Classificazione
Analisi della Correlazione Canonica
Analisi dell'Attendibilità e degli Item
Alberi di Classificazione
Analisi di Corrispondenza
Scaling Multidimensionale
Analisi Discriminante
Modelli di Analisi Discriminante Generale (GDA)


Cluster Analysis ANALISI DI RAGGRUPPAMENTO. Questo modulo include una implementazione completa dei metodi di raggruppamento (k-means, raggruppamento gerarchico, unione a due vie). Il programma può elaborare i dati organizzati come file di dati di base o come matrici di distanza. L'utente può riunire in gruppi casi, variabili o entrambi, basandosi su un'ampia varietà di misure di distanza (incluse l'Euclidea, l'Euclidea quadrata, la distanza di Manhattan, di Chebychev, ecc.) e basandosi su un'ampia varietà di regole di amalgamamento (inclusi legame singolo, completo, media pesata o non pesata dei centroidi, metodo di Ward, ed altro). Le matrici delle distanze possono essere salvate per ulteriori analisi con altri moduli del sistema STATISTICA. Nel raggruppamento K-Means, l'utente ha il controllo totale su tutti i centri di gruppo iniziali. Possono essere elaborate analisi di disegni estremamente ampi; per esempio, l'unione (ad alberi) gerarchica può essere eseguita su matrici con oltre 1000 variabili, o con oltre 1 milione di distanze. Oltre ai classici output per l'analisi dei gruppi è disponibile un completo insieme di statistiche descrittive e diagnostiche (per es., la registrazione completa dei livelli di unione nell'analisi dei gruppi gerarchica, la tabella ANOVA nell'analisi k-means). I dati sull'appartenenza ai gruppi possono essere aggiunti al file dati corrente per analisi successive. Le opzioni grafiche nel modulo Analisi dei Gruppi (Cluster Analysis) includono dendrogrammi (diagrammi ad albero) personalizzabili, plot a matrice discreti (stile grafici a curve di livello) per le unioni a due vie, grafici delle registrazioni degli "amalgamamenti", grafici delle medie nell'unione k-means, e molto altro.
Torna al Principio

Factor Analysis ANALISI FATTORIALE. Il modulo Analisi Fattoriale (Factor Analysis) contiene un'ampia selezione di statistiche ed opzioni; esso inoltre offre una implementazione completa delle tecniche analitiche fattoriali (e fattoriali gerarchiche), comprensive di statistiche diagnostiche e di un'ampia varietà di grafici analitici ed esplorativi. Con questo modulo si eseguono analisi delle componenti principali ed analisi fattoriali gerarchiche (oblique) e possono essere trattati problemi estremamente grandi (ad esempio, con migliaia di variabili). L'analisi fattoriale confermativa può essere fatta con il modulo Modellazione di Equazioni Strutturali (SEPATH) disponibile in STATISTICA Modelli Lineari/Non-Lineari Avanzati.
Torna al Principio

Principal Components and Classification Analysis ANALISI DELLE COMPONENTI PRINCIPALI E CLASSIFICAZIONE. STATISTICA include un programma l'analisi delle componenti principali e la classificazione. L'output include autovalori, (regolari, cumulati, relativi), pesi fattoriali, punteggi fattoriali (che possono essere aggiunti al file di dati, illustrati graficamente come icone e ricodificati interattivamente), ed una varietà di statistiche e di metodi diagnostici più tecnici. Le rotazioni disponibili includono la Varimax, Equamax, Quartimax, Biquartimax (normalizzate o semplici) e le rotazioni Oblique. Lo spazio fattoriale può essere rappresentato graficamente "strato per strato" in scatterplot 2D o 3D con i valori delle variabili etichettati; altri grafici integrati includono lo Scree plot, vari scatterplot, grafici a barre e a linee ed altro. Dopo che è stata determinata una soluzione fattoriale, l'utente può ricalcolare (cioè ricostruire) la matrice di correlazione a partire dal rispettivo numero di fattori, per valutare la bontà del modello fattoriale. Possono essere utilizzati come input sia file di dati di base che matrici di correlazione. Analisi fattoriali confermative ed altre analisi ad essa collegate possono essere eseguite con il modulo Modellazione di Equazioni Strutturali (SEPATH) disponibile in STATISTICA Modelli Lineari/Non-Lineari Avanzati, in cui un Wizard per Analisi Fattoriali Confermative (Confirmatory Factor Analysis Wizard) guiderà passo-passo lungo il processo di specificazione del modello.

  Premere qui per leggere un caso di applicazione reale degli strumenti di Analisi delle Componenti Principali di STATISTICA.

Torna al Principio

ANALISI DELLA CORRELAZIONE CANONICA. Canonical Correlation Analysis Questo modulo offre una implementazione completa delle procedure per l'analisi della correlazione canonica ; con esso si possono elaborare file di dati di base o matrici di correlazione e si possono calcolare tutte le statistiche standard per l'analisi di correlazione canonica (inclusi autovettori, autovalori, coefficienti di ridondanza, pesi canonici, varianze estratte, test di significatività per ogni radice, ecc.) ed un elevato numero di test o statistiche diagnostiche estese. I punteggi delle variabili canoniche possono essere calcolati per ogni caso e visualizzati tramite i plot ad icona integrati (possono anche essere aggiunti al file dati). Il modulo Correlazione Canonica (Canonical Analysis) include anche una varietà di grafici integrati (incluso il grafico degli autovalori e delle correlazioni canoniche, lo scatterplot delle variabili canoniche e molti altri). Analisi confermative sulle relazioni strutturali tra variabili latenti possono anche essere eseguite tramite il modulo Modellazione di Equazioni Strutturali (SEPATH) disponibile in STATISTICA Modelli Lineari/Non-Lineari Avanzati; sono disponibili tecniche stepwise e selezione avanzata del sottoinsieme migliore di predittori per piani MANOVA/MANCOVA nel modulo Modelli di Regressione Generali (GRM) in STATISTICA Modelli Lineari/Non-Lineari.
Torna al Principio

ANALISI DELL'ATTENDIBILITA' E DEGLI ITEM. Reliability/Item Analysis Questo modulo comprende un'ampia selezione di metodi per lo sviluppo e la valutazione di analisi esplorative e questionari. Come in tutti gli altri moduli di STATISTICA, possono essere analizzati disegni estremamente ampi (è possibile analizzare scale con un massimo di 300 item in una singola analisi). L'utente può calcolare statistiche di attendibilità per tutti gli item in una scala, selezionare interattivamente sottoinsiemi, o ottenere confronti tra sottoinsiemi di item tramite il metodo di suddivisione. In una singola analisi l'utente può valutare l'attendibilità di una scala-somma così come di sottoscale. Quando si eliminano interattivamente degli item, i nuovi valori di attendibilità sono calcolati istantaneamente senza dovere rielaborare il file dati. L'output include matrici di correlazione alle statistiche descrittive per gli item, alfa di Cronbach, alfa standardizzato, la correlazione media tra item, la tabella ANOVA completa per la scala, l'insieme completo di statistiche sugli item completi (incluso gli R multipli sugli item completi), la credibilità tra due gruppi confrontati, e la correlazione tra i due gruppi corretta per l'attenuazione. Una selezione di grafici (inclusi vari scatterplot, istogrammi, plot a linee ed altri grafici integrati) ed un insieme di procedure interattive cosa-se sono offerti per aiutare nello sviluppo delle scale. Per esempio, l'utente può calcolare l'attendibilità attesa dopo aver aggiunto un particolare numero di item nella scala, e può stimare il numero di item che dovrebbero essere aggiunti nella scala per ottenere un particolare valore di credibilità. Inoltre, l'utente può stimare la correlazione corretta per l'attenuazione tra la scala corrente ed un'altra misura ipotetica (data la credibilità della scala corrente).
Torna al Principio


Classification Trees Classification TreesALBERI DI CLASSIFICAZIONE. Il modulo Alberi di Classificazione e Regressione di STATISTICA offre una completa implementazione degli algoritmi più recenti per la produzione e la verifica della robustezza degli alberi di classificazione (un albero di classificazione è una regola per prevedere la classe cui appartiene un oggetto a partire dai valori delle sue variabili predittore). Metodi avanzati per gli alberi di classificazione , incluse opzioni flessibili per la costruzione di modelli e strumenti interattivi per esplorare gli alberi disponibili in Modelli ad Alberi di Classificazione e Regressione Generali (GTrees) e CHAID Generale (Individuazione Automatica delle Interazioni Chi-quadro). Gli alberi di classificazione possono essere prodotti utilizzando variabili predittore di tipo categorico, variabili predittore ordinali, o entrambi questi due tipi di variabili predittore, nonché utilizzando suddivisioni (o "diramazioni") univariate o a combinazione lineare. Le opzioni di analisi includono la possibilità di eseguire suddivisioni esaustive (come in THAID e CART™) o di tipo analisi discriminante; la selezione non distorta delle variabili (come in QUEST); le regole di stop diretto (come in FACT) o le potature dal basso verso l'alto (come in CART); le potature in base a tassi di errata classificazione o in base a funzione di devianza; le misure di bontà di adattamento Chi-quadro generalizzato, G-quadro o su indice di Gini. I costi di errata classificazione a priori possono essere specificati come uguali, stimati a partire dai dati, oppure specificati dall'utente. L'utente può pure specificare il valore v per la validazione incrociata (o cross-validazione) v-fold nella fase di costruzione dell'albero, il valore v per la validazione incrociata v-fold per la stima dell'errore, la dimensione della regola ES (Errore Standard), la dimensione minima del nodo prima di potare, i semi per la generazione dei numeri casuali, nonché il valore alfa per la selezione delle variabili. Sono fornite opzioni grafiche per esplorare i dati di input e di output.
Si veda anche: Alberi di Classificazione e Regressione Generali (GTrees) e Modelli CHAID (Chi-square Automatic Interaction Detection) Generali.
Back to Top

Correspondence Analysis ANALISI DELLE CORRISPONDENZE. Questo modulo comprende una implementazione completa delle tecniche di analisi delle corrispondenze semplice e multiple. Il programma accetta come input file dati che contengono variabili di gruppo che saranno utilizzate per calcolare le tabelle incrociate, file dati che contengono frequenze (o qualche altra misura di corrispondenza, associazione, similitudine, confusione, ecc.) e variabili che identifichino (enumerino) le celle nella tabella di input, o infine file dati con frequenze (o altre misure di corrispondenza) da sole (cioè, l'utente può direttamente digitare e analizzare una tabella di frequenze). Per l'analisi delle corrispondenze multiple l'utente può anche specificare direttamente una tabella di Burt come input per le analisi. Il programma calcolerà diverse tabelle, incluse le tabelle delle percentuali di riga, di colonna e dei percentuali totali, i valori attesi, i valori osservati meno gli attesi, le deviazioni standardizzate e i contributi ai valori del Chi-quadro. Il modulo Analisi delle Corrispondenze calcolerà gli autovalori ed autovettori generalizzati, e riporterà tutti i test diagnostici standard, inclusi i valori singolari, gli autovalori, e le proporzioni di inerzia per ogni dimensione. L'utente può anche scegliere manualmente il numero delle dimensioni oppure specificare un valore di soglia per la percentuale cumulata massima di inerzia. Il programma calcolerà i valori delle coordinate standard per punti riga e colonna. L'utente può scegliere tra standardizzazione profilo di riga, standardizzazione profilo di colonna e standardizzazione profilo di riga e colonna. Per ogni dimensione e punto riga o colonna, il programma calcolerà il valore di inerzia, qualità e i valori coseno al quadrato. Inoltre l'utente potrà visualizzare (su spreadsheet) le matrici dei vettori singolari generalizzati; come per tutti i valori degli spreadsheet, queste matrici possono essere gestite anche tramite STATISTICA Visual Basic, per esempio, per implementare un metodo non standard per calcolare le coordinate. L'utente può calcolare i valori delle coordinate e le statistiche ad esse correlate (valori di qualità e coseno al quadrato) per i punti supplementari (di riga o colonna), e confrontare i risultati con i punti regolari di riga e colonna. I punti supplementari possono essere specificati anche per l'analisi delle corrispondenze multiple. Oltre agli istogrammi 3D che possono essere calcolati per tutte le tabelle, l'utente può produrre un plot a linee per gli autovalori, e plot 1D, 2D e 3D per i punti riga e colonna. I punti riga e colonna possono essere anche combinati in un singolo grafico, con qualunque punto supplementare (ogni tipo di punto userà un colore e un marcatore differente, cosicché differenti tipi di punto potranno essere facilmente identificati nel grafico). Tutti i punti sono etichettati ed è disponibile una opzione per troncare le etichette dei nomi dei punti ad uno specifico numero di caratteri.
Torna al Principio

Multidimensional Scaling SCALING MULTIDIMENSIONAL. Il modulo Scaling Multidimensionale (Multidimensional Scaling) include una implementazione completa dello scaling multidimensionale (non metrico). Possono essere analizzate matrici di similarità, dissimilarità o correlazione tra variabili (cioè "oggetti" o casi), e possono essere specificate fino a 9 dimensioni. La configurazione iniziale può essere calcolata dal programma (tramite analisi delle componenti principali) o specificata dall'utente). Il programma utilizza una procedura iterativa per minimizzare il valore di stress ed il coefficiente di alienazione. L'utente può controllare le iterazioni e osservare i cambiamenti in questi valori. Le configurazioni finali possono essere rilette tramite Scrollsheet e tramite scatterplot 2D e 3D dello spazio ottenuto dall'analisi, con i punti dei casi etichettati. L'output include i valori lo stress grezzo (raw F), stress di Kruskal, coefficiente di stress S e coefficiente di alienazione. La bontà di adattamento può essere valutata tramite diagrammi di Shepard (con d-cappello e d-star). Come con tutti gli altri risultati di STATISTICA, la configurazione finale può essere salvata in un file dati.
Torna al Principio

Discriminant Analysis ANALISI DISCRIMINANTE. Il modulo Analisi Discriminante (Discriminant Analysis) è una implementazione completa dell'analisi discriminante stepwise. STATISTICA include anche il modulo Modelli di Analisi Discriminante Generali per l'adattamento dei piani ANOVA/ANCOVA a variabili categoriali dipendenti ed eseguire vari tipi di analisi avanzate (ad esempio, selezione del sottoinsieme migliore di predittori, profili di probabilità a posteriori, ecc.) Il programma eseguirà l'analisi stepwise in avanti o all'indietro, oppure inserirà nel modello blocchi di variabili specificati dall'utente. Oltre ai numerosi grafici e statistiche diagnostiche inseriti per descrivere le funzioni discriminanti, il programma offre pure un'ampia possibilità di opzioni e di statistiche per la classificazione di casi vecchi o nuovi (per una convalida del modello). Gli output includono i lambda di Wilks, L'F per "entrare" (o "uscire" dal modello), i p-level, i valori di tolleranza e l'R-quadro.Il programma eseguirà una completa analisi della correlazione canonica e riporterà gli autovalori e i loro valori cumulati per tutte le radici, più i loro p-level, i coefficienti semplici e standardizzati delle funzioni discriminanti (canoniche), la matrice dei coefficienti strutturali (dei pesi fattoriali), le medie per le funzioni discriminanti, ed i punteggi discriminanti per ogni caso (che possono anche essere automaticamente aggiunti al file dati). I grafici integrati includono istogrammi dei punteggi canonici all'interno di ogni gruppo (e tra tutti i gruppi combinati), scatterplot speciali per coppie di variabili canoniche (dove l'appartenenza al gruppo di singoli casi è marcata visivamente), una completa selezione di grafici categorizzati (multipli) che permette di esplorare le distribuzioni e le relazioni tra le variabili dipendenti tra i gruppi (inclusi i plot box-and-whisker multipli, gli istogrammi, gli scatterplot, e i probability plot) e molto altro. Il modulo Analisi Discriminante calcola anche le funzioni di classificazione standard per ogni gruppo.La classificazione dei casi può essere letta in termini di distanze di Mahalanobis, probabilità a posteriori, o classificazioni effettive; i punteggi per i singoli casi possono essere visualizzati tramite plot ad icone esplorativi o altri grafici multidimensionali integrati direttamente con gli Scrollsheet dei risultati. Tutti questi valori possono essere automaticamente aggiunti al file dati corrente per analisi successive. È possibile visualizzare la matrice riassuntiva di classificazione, contenete il numero e la percentuale dei casi classificati correttamente. L'utente ha a disposizione diverse opzioni per specificare le probabilità di classificazione a priori e può specificare condizioni di selezione per includere o escludere dalla selezione dei casi specifici (per es., per testare le funzioni di classificazione in un nuovo campione).
Torna al Principio

MODELLI DI ANALISI DISCRIMINANTE GENERALE (GDA). Il modulo STATISTICA Modelli di Analisi Discriminante Generale (GDA) è un'applicazione ed estensione del Modello Lineare Generale ai problemi di classificazione. Come il modulo Analisi Discriminante, GDA permette di eseguire analisi discriminante standard e stepwise. GDA implementa problemi di analisi discriminante come un caso speciale di modello lineare generale e in tal modo offre tecniche analitiche estremamente utili ed innovative, efficienti e potenti. Come nell'analisi discriminante tradizionale, GDA consente di specificare una variabile categoriale dipendente. Per le analisi, l'appartenenza a gruppi (in relazione alla variabile dipendente) è codificata da variabili indicatrici e possono essere applicati tutti i metodi di GRM. Nelle finestre di dialogo dei risultati, sono disponibili le statistiche sui residui disponibili in GRM, GLM e GDA. GDA possiede strumenti efficienti e potenti per applicazioni di data mining così come per la ricerca. GDA calcola tutti i risultati standard dell'analisi discriminante, inclusi i coefficienti delle funzioni discriminanti, risultati di analisi canonica (coefficienti grezzi e standardizzati, test step-down delle radici canoniche, ecc.), statistiche per la classificazione (incluse la distanza di Mahalanobis, probabilità a posteriori, classificazione effettiva dei casi nel campione d'analisi e campione di validazione, matrice di errata classificazione, ecc.) e così via. Per avere maggiori informazioni sul modulo GDA, si faccia clic qui.
Torna al Principio
Richiedi Prezzi
Home Page



[StatSoft]
Via Parenzo 3 - 35010 Vigonza (Padova)
Tel: 0498934654; Fax: 0498932897

[StatSoft]e-mail: info@statsoft.it

©Copyright StatSoft Italia srl, 1984-2009.
StatSoft, StatSoft logo, STATISTICA, STATISTICA Enterprise/QC, STATISTICA Enterprise, Data Miner, SEPATH and GTrees are trademarks of StatSoft, Inc.