Home | Prodotti | Servizi | Soluzioni | Supporto | Contatti StatSoft Italia | StatSoft Worldwide

STATISTICA Modelli Lineari/Non Lineari Avanzati

DownloadScarica una Demo Gratuita di STATISTICA 10

STATISTICA Modelli Lineari/Non Lineari Avanzati offre un'ampia scelta dei più avanzati strumenti di modellazione lineare e non lineare disponibili oggi sul mercato. Supporta predittori continui e categoriali, interazioni e modelli gerarchici, e dispone di opzioni per la selezione automatica dei modelli. Inoltre sono disponibili procedure per l'analisi di componenti della varianza, serie storiche e altri metodi. Tutte le analisi sono integrate con delle componenti grafiche interattive e sono interamente implementabili con degli script in Visual Basic.

Contiene i seguenti moduli (cfr. Descrizione Dettagliata):

  • Distribuzioni e Simulazione
  • Componenti della Varianza e Modelli Misti ANOVA/ANCOVA
  • Analisi di Sopravvivenza/Tempi di Guasto
  • Modelli a Rischi Proporzionali di Cox
  • Stima Non Lineare Generale (e Regressione Rapida Logit/Probit)
  • Analisi Log-Lineare delle Tabelle di Frequenza
  • Analisi delle Serie Storiche/Previsioni
  • Modelli di Equazioni Strutturali/Analisi dei Path (SEPATH)
  • Modelli Lineari Generali (GLM)
  • Modelli di Regressione Generale (GRM)
  • Modelli Lineari Generalizzati (GLZ)
  • Modelli ai Minimi Quadrati Parziali (PLS)

Distribuzioni e Simulazione

distributions and simulationDistribuzioni e Simulazione consente agli utenti di adattare automaticamente numerose distribuzioni continue e discrete alle liste di varaibili. Sono disponibili le distribuzioni standard (normale, halfnormal, log-normale, Weibull, ecc.) e delle distribuzioni specializzate (Johnson, Mistura Gaussiana, Pareto Generalizzata, Valori Estremi Generalizzati), e STATISTICA classificherà automaticamente la bontà di adattamento delle distribuzioni selezionate per ogni variabile.

Inoltre, l'adattamento delle distribuzioni alle variabili selezionate e la covarianza tra tali variabili possono essere salvate per il deployment. Il modulo Distribuzioni & Simulazione utilizza queste informazioni per generare dei data set simulati che non riproducono fedelmente solo le rispettive distribuzioni, ma anche le covarianze. In pratica, oltre a facilitare l'adattamento di distribuzioni a un grande numero di variabili, questo modulo consente di adattare e simulare da distribuzioni multivariate, utilizzando delle tecniche di simulazione avanzate (ad es., Ipercubi-Latini). Quando i dati per l'adattamento non sono disponibili, lo strumento Piano di Simulazione permette di generare i dati da una matrice di correlazione e selezionare delle distribuzioni. Questi metodi si rivelano utilissimi in diverse situazioni, come ad esempio nella moderna pianificazione degli esperimenti, negli esperimenti di affidabilità e nella modellazione del rischio.

Torna all'Inizio

COMPONENTI DELLA VARIANZA E MODELLI MISTI ANOVA/ANCOVA

pie chart,variance componentsComponenti della Varianza e Modelli Misti ANOVA/ANCOVA è un modulo specializzato per analizzare piani con effetti random e/o fattori con molti livelli. Gli effetti casuali si presentano di frequente nella ricerca industriale, quando i livelli di un fattore rappresentano valori a loro volta campionati da una variabile casuale (in contrapposizione con il fatto di essere stati deliberatamente scelti o stabiliti dallo sperimentatore). Il modulo Componenti della Varianza permette di analizzare piani con combinazioni arbitrarie di effetti fissi, effetti random e covariate. Possono essere analizzati in maniera efficiente piani ANOVA/ANCOVA estremamente ampi: i fattori possono avere diverse centinaia di livelli. Il programma analizzerà piani fattoriali standard (incrociati) così come piani nidificati (nested) gerarchicamente, e calcolerà le somme dei quadrati e le medie dei quadrati dell’analisi della varianza standard di Tipo I, II e III per gli effetti del modello. Inoltre, è possibile calcolare la tabella delle medie dei quadrati attese per gli effetti del disegno, le componenti di varianza per gli effetti random del modello, i coefficienti per il denominatore di sintesi e la tabella ANOVA completa con i test basati sulle somme dei quadrati dell'errore ed i gradi di libertà (utilizzando il metodo di Satterthwaite). Sono supportati anche altri metodi per stimare le componenti di varianza (ad es., MIVQUE0, Massima Verosimiglianza [ML], Massima Verosimiglianza Ristretta [REML]). Per la stima di massima verosimiglianza, vengono utilizzati gli algoritmi di Newton-Raphson e la funzione punteggio di Fisher, ed il modello durante la stima non verrà arbitrariamente modificato (ridotto) per gestire situazioni in cui la gran parte delle componenti sono uguali o prossime a zero. Sono inoltre disponibili diverse opzioni per visualizzare le medie marginali pesate e non pesate, con i relativi intervalli di confidenza e delle opzioni grafiche per visualizzare i risultati.

Torna all'Inizio

ANALISI DI SOPRAVVIVENZA/TEMPI DI GUASTO

Survival Analysis, Failure, Time AnalysisQuesto modulo comprende un'implementazione completa di numerose tecniche per l'analisi di dati censurati provenenti da ricerche nel campo sociale, biologico e medico, e di procedure utilizzabili nel campo tecnologico e del marketing (ad es., controllo della qualità, stima dell'affidabilità, ecc.). Oltre al calcolo delle tabelle di sopravvivenza (o life table) con varie statistiche descrittive e alle stime di Kaplan-Meier, l'utente può confrontare le funzioni di sopravvivenza di differenti gruppi utilizzando un'ampia selezione di metodi (incluso il test di Gehan, il test F di Cox, il test di Cox-Mantel, il test Log-rank ed il test di Wilcoxon generalizzato da Peto & Peto). Inoltre si possono generari i tracciati di Kaplan-Meier per gruppi (le osservazioni non censurate vengono identificate nel grafico con differenti marcatori). Il programma inoltre contiene una selezione di procedure per stimare le funzioni di sopravvivenza (incluse le funzioni Esponenziale, a Rischi Proporzionali, di Gompertz e Weibull) sulla base dei minimi quadrati sia pesati che non pesati (le stime di massima verosimiglianza dei parametri per varie distribuzioni, inclusa la Weibull, possono essere anche calcolate nel modulo STATISTICA Analisi dei Processi). Infine, il programma offre una completa implementazione di quattro modelli generali (modello di Cox a rischi proporzionali, modello di regressione esponenziale, modelli di regressione log-normale e normale) con le relative diagnostiche, che includono analisi stratificate e grafici di sopravvivenza per valori dei predittori specificati dall'utente. Per la regressione di Cox a rischi proporzionali, l'utente può scegliere di stratificare il campione in modo da permettere rischi di base differenti su strati differenti (ma con un vettore dei coefficienti costante), oppure può scegliere di utilizzare rischi di base e coefficienti differenti. In aggiunta sono offerte delle funzionalità per definire una o più covariate dipendenti dal tempo. Le covariate dipendenti dal tempo possono essere specificate per mezzo del flessibile interprete di formule, il quale permette all'utente di definire le covariate per mezzo di espressioni aritmetiche che possono includere (ovviamente) il tempo e le funzioni logiche standard (ad es., tempdip=età+età*log(t_)*(età>45), dove t_ rappresenta il tempo di sopravvivenza), e diverse funzioni di distribuzione. Come con tutti gli altri moduli di STATISTICA, l'utente può accedere e modificare i parametri tecnici di tutte le procedure (o accettare i valori predefiniti). Il modulo offre inoltre un'estesa selezione di grafici e diagrammi per aiutare nell'interpretazione dei risultati (inclusi il grafico delle proporzioni cumulate di sopravviventi/mancati, le rappresentazioni dei dati censurati, le funzioni di rischio e di rischio cumulato, le funzioni di densità di probabilità, grafici di confronto tra gruppi, grafici di adattamento a distribuzioni, grafici dei residui e molto altro). Per applicazioni nel campo tecnico ed industriale, si veda anche l'Analisi di Weibull.

Torna all'Inizio

Modelli a Rischi Proporzionali di Cox

Il modulo Modelli a Rischi Proporzionali di Cox è uno strumento altamente scalabile, che consente di:

  • analizzare i dati di sopravvivenza di pazienti nelle ricerche mediche
  • analizzare gli abbandoni dei clienti
  • modellare i tempi di guasto di componenti meccaniche (affidabilità)

Cox Proportional HazardQuesto strumento permette di gestire in modo flessibile i dati censurati, i predittori categoriali e i piani che comprendono interazioni e/o effetti nidificati. Si possono utilizzare le tecniche stepwise e best subset per la selezione dei predittori. Il deployment delle funzioni di sopravvivenza su nuovi dati è disponibile in STATISTICA Deployment Rapido.

 

 

Torna all'Inizio

STIMA NON LINEARE GENERALE (e Regressione Rapida Logit/Probit)

Nonlinear EstimationIl modulo Stima Non Lineare consente all'utente di stimare qualunque tipo di modello non lineare. Una delle caratteristiche uniche di questo modulo è che a differenza dei tradizionali programmi per la stima non lineare, non impone alcun limite sulla dimensione del file di dati da analizzare.

Metodi di Stima

I modelli possono essere adattati sui dati utilizzando i minimi quadrati o la stima di massima verosimiglianza, o una qualunque funzione di perdita definita dall'utente. Quando si usa il criterio dei minimi quadrati per la stima dei parametri, si possono usare gli efficienti algoritmi di Levenberg-Marquardt e Gauss-Newton, raccomandati anche in presenza di file dati molto grandi o di problemi di regressione non lineare "complessi" (quelli classificati col termine "higher difficulty" fra gli Statistical Reference Datasets provvisti dal National Institute of Standards and Technology). Quando si usano funzioni di perdita arbitrarie, l'utente può scegliere tra quattro procedure differenti (quasi-Newton, Simplesso, Hooke-Jeeves pattern moves e metodo di Rosenbrock) così da poter ottenere stime stabili dei parametri praticamente in tutti i casi, anche in condizioni computazionali estreme (si veda Benchmark della Precisione Numerica).

Modelli

L'utente può specificare qualunque tipo di modello scrivendo la rispettiva equazione in uno specifico editor. Le equazioni possono includere operatori logici, in modo che possano essere stimati di regressione discontinui (piecewise) o che includono variabili indicatrici. Le equazioni possono inoltre includere un'ampia gamma di funzioni di distribuzione o di distribuzione cumulate (Beta, Binomiale, Cauchy, Chi-quadro, Esponenziale, valori Estremi, F, Gamma, Geometrica, Laplace, Logistica, Normale, Log-Normale, Pareto, Poisson, Rayleigh, t (Student), o Weibull). L'utente ha il pieno controllo su tutti gli aspetti delle procedure di stima (ad es., i valori iniziali, le dimensioni dei passi, i criteri di convergenza, ecc.). I più comuni modelli di regressione non lineare sono predefiniti nel modulo Stima Non Lineare e possono quindi essere scelti semplicemente come opzioni di un menu. Questi modelli includono la regressione stepwise Probit e Logit, il modello di regressione esponenziale e la regressione lineare segmentata (con punto di discontinuità) . Si noti che STATISTICA dispone anche di implementazioni di algoritmi per la stima di modelli lineari generalizzati, inclusi i modelli probit e logit e i modelli additivi generalizzati; si vedano le rispettive descrizioni per maggiori dettagli.

Nonlinear Estimation, ResultsRisultati

Oltre a numerose statistiche descrittive, i risultati della stima non lineare includono le stime dei parametri ed i rispettivi errori standard (calcolati indipendentemente dalla stima stessa, tramite la differenziazione finita per ottimizzare la precisione; si veda Benchmark della Precisione Numerica), la matrice di varianze/covarianze delle stime dei parametri, i valori previsti, i residui e le relative misure di bontà di adattamento (ad es., log-verosimiglianza dei modelli stimati/nulli e test Chi-quadro delle differenze della proporzione di varianza spiegata dal modello, classificazione dei casi ed odds-ratio con intervalli di confidenza per modelli logit e probit, ecc.). I valori previsti ed i residui possono essere aggiunti al file dati per delle successive analisi. Per i modelli Probit e Logit, viene calcolato automaticamente l'incremento in adattamento quando si aggiungono o rimuovono parametri (quindi l'utente può esplorare i dati tramite una procedura di analisi stepwise non lineare; per la regressione stepwise in avanti e all'indietro, o best subset dei modelli logit e probit sono fornite delle opzioni nel modulo Modelli Lineari Generalizzati).

Grafici

Tutti gli output sono integrati con un'ampia selezione di grafici, inclusi i grafici di funzioni 2D e 3D (di superficie), modificabili interattivamente, che permettono all'utente di visualizzare la qualità dell'adattamento e di identificare outlier o intervalli di discrepanza tra il modello e i dati; l'utente può modificare interattivamente l'equazione della funzione di stima senza ricaricare i dati e visualizzare quindi tutti gli aspetti del processo di stima non lineare. Sono disponibili altri grafici specializzati per valutare il processo di stima e visualizzare i risultati, come gli istogrammi di tutte le variabili selezionate e dei valori dei residui, gli scatterplot dei valori osservati contro i previsti e dei valori previsti contro i residui, i normal ed half-normal probability plot dei residui, e molto altro.

Torna all'Inizio

ANALISI LOG-LINEARE DELLE TABELLE DI FREQUENZA

Log-Linear Analysis,Frequency Tables,Modeling, LogitQuesto modulo offre una completa implementazione delle procedure per la modellazione log-lineare delle tabelle di frequenze a più entrate. Si noti che STATISTICA include anche il modulo Modelli Lineari Generalizzati, che fornisce delle opzioni per i modelli logit binomiali e multinomiali con piani ANOVA/ANCOVA codificati. Nel modulo Analisi Log-Lineare, l'utente può analizzare in una singola analisi delle tabelle con un massimo di 7 entrate, le quali possono essere complete o incomplete (con zero strutturali). Le tabelle di frequenza possono essere calcolate a partire dai dati grezzi, oppure possono essere inserite direttamente nel programma. Il modulo Analisi Log-Lineare offre una selezione completa di procedure avanzate per la modellazione in un ambiente interattivo e flessibile, che facilita ampiamente l'analisi esplorativa e confermativa di tabelle complesse. L'utente può in ogni momento rivedere la tabella osservata, così come le tabelle marginali ed i valori stimati (attesi), e può valutare l'adattamento di tutti i modelli di associazione parziale o totale, oppure selezionare specifici modelli (tabelle marginali) da adattare ai dati osservati. Il programma offre anche una procedura per la selezione automatica del modello, la quale in primis determina l'ordine necessario dei termini di interazioni richiesti dal modello per addattarsi ai dati, e quindi, attraverso l'eliminazione "all'indietro", calcola il migliore modello che fornisce un'adattamento sufficiente ai dati (utilizzando dei criteri specificati dall'utente). L'output standard include il G-quadro (Chi-quadro di massima verosimiglianza), il Chi-quadro standard di Pearson con i correttti gradi di libertà e livelli di significatività, le tabelle osservate ed attese, le tabelle marginali, ecc. Le opzioni grafiche disponibili nel modulo Analisi Log-lineare includono una varietà di grafici 2D e 3D, progettati per visualizzare tabelle di frequenza a due e a più entrate, i grafici delle frequenze osservate e stimate, numerosi grafici dei residui (standardizzati, componenti del Chi-quadro di massima verosimiglianza, deviazioni di Freeman-Tukey, ecc.) e molti altri.

Torna all'Inizio

ANALISI DELLE SERIE STORICHE/PREVISIONI

Time Series Analysis,Forecasting,ARIMA residualsIl modulo Serie Storiche contiene un'elevata quantità di metodi descrittivi, di modellazione, di scomposizione e di previsione sia per serie aventi come dominio il tempo che per serie che si basano sulle frequenze. Queste procedure sono tra loro pienamente integrate, ossia, i risultati di un'analisi (ad es., residui dell'ARIMA) possono essere utilizzati direttamente nelle analisi successive (ad es., per calcolare la funzione di autocorrelazione dei residui ARIMA). Inoltre, sono disponibili numerose opzioni per esaminare e tracciare su un grafico le serie storiche singole o multiple. Le analisi possono essere eseguite anche su serie storiche estremamente lunghe. Più serie possono essere conservate nell'area di lavoro attiva del programma (ad es., diversi dati di input di serie storiche risultanti da differenti stadi dell'analisi), per poter essere esaminate oppure confrontate. Il programma tiene automaticamente traccia delle analisi successive, e mantiene una registrazione delle trasformazioni e degli altri risultati (ad es., residui ARIMA, componenti stagionali, ecc.). Quindi l'utente può sempre tornare alle trasformazioni precedenti o confrontare (tramite grafico) la serie originale con le sue trasformazioni. Le informazioni sulle trasformazioni successive sono mantenute sotto forma di etichette lunghe di variabili, in modo da poter conservare la "cronologia" di ciascuna serie se si salvano le nuove variabili create in un data set. Le singole procedure del modulo Serie Storiche sono descritte nelle sezioni che seguono.

Trasformazioni, Modellazione, Grafici, Autocorrelazioni

Questa sezione del modulo permette all'utente di esplorare completamente le regolarità presenti nelle serie storiche di input e di eseguire tutte le trasformazioni comuni, incluse: l'eliminazione del trend, la rimozione delle autocorrelazioni, il lisciamento a medie mobili (non pesate o pesate, con pesi definiti dall'utente oppure con pesi di Daniell, Tukey, Hamming, Parzen o Bartlett), il lisciamento a mediane mobili, il lisciamento esponenziale semplice (si veda anche la descrizione delle opzioni per il lisciamento esponenziale, in seguito), la differenziazione, l'integrazione, l'estrazione dei residui, lo "scostamento" (shift), il filtro 4253H, il tapering, le trasformazioni di Fourier (ed inverse) ed altro. Possono eseguite analisi sulle autocorrelazioni, autocorrelazioni parziali e crosscorrelazioni.

ARIMA e Analisi delle Serie Storiche Interrotte (Interferenze)

ARIMA,Interrupted Time Series, Intervention Analysis

Il modulo Serie Storiche offre un'implementazione completa dell'analisi ARIMA. I modelli possono includere una costante e le serie possono essere trasformate a priori; queste trasformazioni saranno automaticamente "ripristinate" quando verranno eseguite le previsioni, in modo che le previsioni, con i loro errori standard, saranno espresse in termini di valori della serie originale di input. Possono essere calcolate le somme dei quadrati esatte o approssimate condizionate ai valori di massima verosimiglianza dei parametri e l'implementazione ARIMA nel modulo Serie Storiche è particolarmente adatta per stimare dei modelli con lunghi periodi di stagionalità (ad es., periodi di 30 giorni). I risultati standard includono le stime dei parametri, i relativi errori standard, e le correlazioni tra parametri. Le previsioni, e gli errori standard, possono essere calcolate e tracciate su un grafico, ed infine aggiunte alle serie di input. Sono inoltre disponibili numerose opzioni per esaminare i residui ARIMA (per la valutazione dell'adeguatezza del modello), inclusa un'ampia selezione di grafici. L'implementazione dell'analisi ARIMA nel modulo Serie Storiche permette all'utente di eseguire analisi di serie storiche "interrotte" (con "interferenze"). Possono essere modellati diversi tipi di interferenza: interferenze "inaspettate" permanenti a singolo parametro, interferenze a due parametri graduali, interferenze temporanee (possono essere visualizzati i grafici dei differenti tipi di impatto). Le previsioni possono essere calcolate per tutti i modelli di interferenza e tracciate su un grafico (insieme alla serie di input) e/o aggiunte alla serie originale.

Lisciamento Esponenziale Stagionale e Non Stagionale

Seasonal and Non-Seasonal Exponential Smoothing,trend, Holt-Winter,transformationIl modulo Serie Storiche contiene un'implementazione completa di tutti i 12 modelli comuni di lisciamento esponenziale. I modelli possono contenere una componente stagionale additiva o moltiplicativa e/o un trend lineare, esponenziale o "smorzato"; quindi i modelli disponibili includono anche i popolari trend lineari di Holt-Winter. L'utente può specificare il valore iniziale nella trasformazione di lisciamento, il valore iniziale di trend, e il fattore stagionale (se adeguato). Possono essere specificati parametri di lisciamento separati per il trend e le componenti stagionali. L'utente può anche eseguire una ricerca "su griglia" nello spazio dei parametri per identificare i migliori parametri; il rispettivo spreadsheet dei risultati riporterà per tutte le combinazioni dei valori dei parametri l'errore medio, l'errore medio assoluto, la somma dei quadrati degli errori, l'errore quadratico medio, l'errore medio percentuale e l'errore percentuale medio assoluto. Il valore più piccolo di questi indici di adattamento sarà evidenziato nello spreadsheet. In aggiunta, l'utente dispone della possibilità di ricercare automaticamente i migliori parametri rispetto all'errore quadratico medio, all'errore medio assoluto e all'errore percentuale medio assoluto (per questo obiettivo è disponibile una procedura generale per la minimizzazione di funzioni). I risultati delle rispettive trasformazioni di lisciamento esponenziale, i residui ed i valori richiesti di previsione saranno quindi disponibili per ulteriori analisi e grafici. Inoltre, è disponibile un grafico riassuntivo per stabilire l'adeguatezza del corrispondente modello di lisciamento esponenziale; questo grafico mostrerà la serie originale insieme con i valori di lisciamento e le previsioni, più i residui di lisciamento rappresentati separatamente sull'asse Y.

Metodo Census I - Scomposizione Stagionale Classica

L'utente può specificare la lunghezza del periodo di stagionalità e scegliere il modello di stagionalità additiva o moltiplicativa. Il programma calcolerà le medie mobili, i rapporti o le differenze, i fattori stagionali, la serie corretta per la stagionalità, la componente di trend-ciclo lisciata e la componente irregolare. Queste componenti saranno rese disponibili per ulteriori analisi; ad esempio, l'utente può calcolare gli istogrammi, i normal probability plot, ecc. per alcune o tutte le componenti (ad es., per testare l'adeguatezza del modello).

Census Method II - Scomposizione Stagionale e Correzione Stagionale X-11, Mensile e Trimestrale

US Bureau of the Census, X-11 variant of the Census Method II, seasonal adjustment procedureIl modulo Serie Storiche contiene un'implementazione completa della variante X-11 del Metodo Census II dell'US Bureau per le procedure di correzione della stagionalità. Mentre gli algoritmi X-11 originali non erano compatibili con l'anno 2000 (potevano essere analizzati solo i dati precedenti al Gennaio 2000), l'implementazione di STATISTICA di X-11 consente di gestire dati contenenti date precedenti o successive al primo Gennario 2000. L'organizzazione delle opzioni e delle finestre di dialogo segue strettamente le definizioni e le convenzioni descritte nella documentazione del Bureau of the Census. Possono essere specificati modelli stagionali additivi e moltiplicativi. L'utente può anche specificare fattori a priori relativi ai giorni lavorativi e fattori per la correzione stagionale. Le variazioni dovute ai giorni lavorativi possono essere stimate tramite la regressione (con controllo per le osservazioni estreme) ed utilizzate per correggere la serie (condizionatamente, se richiesto). Sono fornite delle opzioni standard per classificare le osservazioni estreme, per ricavare i fattori stagionali e per calcolare la componente del trend (l'utente può scegliere tra vari tipi di medie mobili pesate; medie mobili ottime per lunghezza e per i pesi possono essere scelte automaticamente dal programma). Le componenti finali (stagionalità, trend-ciclo, irregolare) e le serie corrette per la stagionalità sono automaticamente disponibili per ulteriori analisi e grafici; queste componenti possono anche essere salvate per ulteriori analisi con altri programmi. Il programma produrrà i grafici delle differenti componenti, inclusi i plot categorizzati per i mesi (o i trimestri).

Modelli Polinomiali a Ritardi Distribuiti

L'implementazione dei metodi polinomiali per i ritardi distribuiti del modulo Serie Storiche stima dei modelli sia con ritardi non vincolati, che a ritardi distribuiti di Almon (vincolati). Sono disponibili numerosi grafici per esaminare le distribuzioni delle variabili del modello.

Analisi Spettrale (di Fourier) e Cross-Spettrale

time series,Fourier,Spectrum and Cross-Spectrum AnalysisIl modulo Serie Storiche include un'implementazione completa delle tecniche per l'analisi spettrale (scomposizione di Fourier) e l'analisi spettrale incrociata. Il programma è particolarmente adatto per l'analisi di serie storiche di lunghezza elevata (ad es., con più di 250000 osservazioni), e non impone alcuna limitazione sulla lunghezza della serie (cioè, la lunghezza della serie non deve essere per forza un multiplo di 2). Comunque l'utente può scegliere di "riempire" o troncare la serie prima di eseguire l'analisi. Le trasformazioni standard di pre-analisi includono il tapering, la sottrazione della media e l'eliminazione del trend. Per l'analisi spettrale di una singola serie, i risultati standard includono la frequenza, il periodo, i coefficienti di seno e coseno, i valori del periodogramma e le stime della densità spettrale; quest ultime possono essere calcolate utilizzando pesi e dimensioni delle finestre di Daniell, Hamming, Bartlett, Tukey, Parzen, oppure valori definiti dall'utente. Quando si lavora con serie particolarmente lunghe, è possibile visualizzare soltanto un determinato numero (definito dall'utente) dei valori più elevati del periodogramma della densità, in ordine decrescente; quindi i più importanti picchi del periodogramma o di densità possono essere facilmente identificati anche in serie lunghe. L'utente può eseguire il test d di Kolmogorov-Smirnov sui valori del periodogramma per verificare se seguono una distribuzione esponenziale (per testare cioè se la serie in input è composta di white noise). Sono disponibili numerosi grafici per riassumere i risultati; l'utente può rappresentare i coefficienti di seno e coseno, i valori del periodogramma, i valori del log-periodogramma, i valori di densità spettrale, ed infine i valori della log-densità confrontati con le frequenze, i periodi o i log-periodi. Per serie di input lunghe, l'utente può scegliere il segmento (periodo) per cui tracciare il grafico del rispettivo periodogramma o dei valori di densità, estendendo così la "risoluzione" del periodogramma o del plot della densità. Per l'analisi di Fourier incrociata, oltre ai risultati dell'analisi spettrale per una singola serie, il programma calcola il periodogramma incrociato (parte reale ed immaginaria), la densità co-spettrale, il quadrature spectrum, la cross-ampiezza, i valori di coerenza, i valori di guadagno e il phase-spectrum. Tutte queste quantità possono essere poste in un grafico in confronto con le frequenze, con i periodi o log-periodi, sia per tutti i periodi (frequenze) che solo con un segmento definito dall'utente. I più elevati valori del periodogramma incrociato possono essere visualizzati in uno spreadsheet in ordine decrescente, in modo da facilitare l'identificazione dei picchi salienti nell'analisi di serie storiche "lunghe". Come con tutte le altre procedure del modulo Serie Storiche, tutti questi risultati possono essere aggiunti all'area di lavoro attiva, e renderli quindi disponibili per successive analisi con altre procedure per l'analisi di serie storiche o con altri moduli di STATISTICA.

Tecniche di Previsione Basate sulla Regressione

Infine, STATISTICA offre delle tecniche per l'analisi di serie storiche basate su modelli di regressione per variabili con o senza ritardi (incluse le regressioni passanti per l'origine, le regressioni non lineari e le previsioni interattive del tipo what-if).

Torna all'Inizio

MODELLI DI EQUAZIONI STRUTTURALI/ANALISI DEI PATH (SEPATH)

Structural Equation Modeling And Path Analysis, SEPATHSTATISTICA include un'implementazione completa delle tecniche per la modellazione di equazioni strutturali, con le funzionalità flessibili della simulazione Monte Carlo (SEPATH). Questo modulo è un programma all'avanguardia con un'interfaccia utente "intelligente". Offre una completa selezione di procedure per la modellazione, integrate con un'interfaccia utente avanzata, che permettono di specificare modelli anche complessi senza utilizzare alcuna sintassi di comandi. Tramite Wizard e Path Tool è possibile definire l'analisi in semplici termini funzionali utilizzando menu e finestre di dialogo (a differenza da altri programmi per la modellazione di equazioni strutturali, non è richiesto l'apprendimento di complessi "linguaggi").

SEPATH include numerose funzionalità avanzate: il programma può analizzare matrici di correlazione, covarianza e dei momenti (medie strutturate, modelli con intercetta); tutti i modelli possono essere specificati tramite gli strumenti Path Wizard, Wizard Analisi Fattoriale e Path Generale; queste procedure sono altamente efficienti e permettono all'utente di specificare modelli anche complessi in pochi minuti effettuando delle semplici scelte su delle finestre di dialogo. Il modulo SEPATH calcolerà, utilizzando delle tecniche di ottimizzazione vincolata, gli errori standard per i modelli standardizzati e per i modelli adattati a matrici di correlazione. Le opzioni per i risultati comprendono un completo insieme di statistiche diagnostiche, inclusi gli indici per l'adattamento standard e basati sulla non centralità, che rispecchiano i più recenti sviluppi nell'area della modellazione delle equazioni strutturali. L'utente può adattare modelli a campioni (gruppi) multipli e può specificare per ogni gruppo parametri fissi, liberi o vincolati (uguali tra i gruppi). Quando si analizzano matrici dei momenti queste funzionalità permettono di testare ipotesi complesse per medie strutturate nei diversi gruppi. La documentazione del modulo SEPATH contiene numerose descrizioni dettagliate, inclusi degli esempi di analisi fattoriale confermativa, di analisi dei path (causale), di modelli teorici per test affini, di matrici multi-caratteristica-multi-metodo, di analisi fattoriale longitudinale, di simmetria composita, di medie strutturate, ecc..

Simulazione Monte Carlo con SEPATH

Monte Carlo simulationIl modulo SEPATH include potenti opzioni per la simulazione: l'utente può generare (e salvare) data set per modelli predefiniti, sulla base della distribuzione normale o di una distribuzione asimmetrica. Possono essere calcolate le stime bootstrap, le distribuzioni di varie statistiche diagnostiche, le stime dei parametri, ecc. sulle prove Monte Carlo. Sono disponibili numerose opzioni grafiche per visualizzare i risultati (ad es., le distribuzioni delle stime dei parametri) a partire dalle prove Monte Carlo.

Torna all'Inizio

 

Analizzare Sistemi Lineari e Non Lineari

STATISTICA comprende cinque tipi di analisi dei modelli lineari e non lineari: Modelli Lineari Generali (GLM), Modelli di Regressione Generale (GRM), Modelli Generali di Analisi Discriminante (GDA), Modelli Lineari Generalizzati (GLZ) e Modelli ai Minimi Quadrati Parziali (PLS). Si noti che STATISTICA include anche delle implementazioni dei Modelli Additivi Generalizzati (GAM), degli Alberi di Classificazione e Regressione (C&RT) e dei Modelli CHAID (Chi-square Automatic Interaction Detection), disponibili in STATISTICA Data Miner; questi moduli possono essere inoltre utilizzati per adattare modelli non lineari (ANOVA/ANCOVA) a variabili dipendenti continue e categoriali.

Tutti questi moduli sono estremamente completi, contengono implementazioni avanzate dei rispettivi metodi e condividono alcune soluzioni generali per l'interfaccia utente.

Caratteristiche Comuni Generali dei Cinque Moduli GLM General Linear Models General Regression Models GRM general discriminant analysis gda generalized linear models glz general partial least squres pls

Tre alternative per l'interfaccia utente: (1) Specifiche rapide, (2) Wizard, e (3) Sintassi. Tutti i moduli offrono le tre alternative per la specifica dei piani (ad es., ANOVA/ANCOVA, di regressione, a superficie risposta, mistura, ecc.; si veda la descrizione di GLM per i dettagli):

  1. Tramite le finestre di dialogo delle Specifiche rapide, che richiedono all'utente di specificare le variabili necessarie, ecc., data una selezione iniziale del tipo di piano (ad es., se si seleziona un piano a risposta di superficie, verranno richiesti i predittori continui e una facoltativa variabile di blocchi),

    GLZ Quick-spec Dialogs

  2. Tramite un potente ed unico Wizard di Piani, che guidano l'utente passo-passo attraverso il processo di specificazione di un modello, e

    GRM Wizard

  3. Tramite una semplice sintassi dei comandi, che offre la scelta tra il linguaggio SAS® tradizionale o il più semplice e flessibile linguaggio VGLM (entrambe le opzioni includono le finestre di "inserimento rapido", con i tasti a scelta rapida e la possibilità di aprire file di sintassi salvati in formato testuale).

    GLM Syntax Editor

Generazione automatica della sintassi dei comandi. Una delle caratteristiche uniche di questa interfaccia utente è data dalla fatto che STATISTICA genererà automaticamente in background la sequenza completa di comandi per qualsiasi piano specificato tramite le finestre delle Specifiche Rapide (cfr. il punto 1) o il Wizard (cfr. il punto 2). Queste registrazioni "attive" di qualunque tipo di piano specificato (anche il più complesso) possono essere ri-eseguite, salvate per un uso futoro, modificate, incluse in uno script di STATISTICA Visual Basic per essere eseguita con nuovi data set, ecc. Dato che la sintassi per specificare i piani è condivisa da tutti questi moduli, è piuttosto semplice trasferire le specifiche da un tipo di analisi ad un altro, per esempio per stimare lo stesso modello in GLM e GLZ.

Campione di addestramento, di convalida incrociata (verifica) e di previsione. Tutti e cinque i moduli calcoleranno delle dettagliate statistiche dei residui che possono essere salvate per maggiori analisi con altri strumenti. Un'altra caratteristica unica di questi programmi è data dal fatto che queste statistiche possono essere calcolate separatamente per le osservazioni con le quali è stato stimato il modello (cioé, il campione di addestramento), per i casi esplicitamente esclusi dalle stime (il campione di convalida incrociata o verifica), e per i casi senza i valori osservati per la variabili dipendente (il campione di previsione). Inoltre, tutti i risultati grafici (ad es., i probability plot, gli istogrammi, gli scatterplot delle statistiche selezionate dei previsti o dei residui) possono essere calcolati per uno o più di questi campioni. Quindi, tutti i moduli offrono dei metodi diagnostici particolarmente approfonditi per valutare la qualità del modello.

Confrontare le analisi; modificare le analisi. Come tutte le funzionalità analitiche di STATISTICA, più istanze di tutti i moduli possono essere aperte contemporaneamente, in modo da analizzare più data set allo stesso tempo. Questa possibilità si rivela estremamente utile per confrontare i risultati di diverse analisi sugli stessi dati o le stesse analisi su dati diversi. Per modificare un'analisi non è necessario ri-specificarla completamente, ma basterà indicare soltanto le modifiche desiderate. I risultati di diverse modifiche di un'analisi possono essere facilmente confrontati. GLM, GRM, GDA, GLZ e PLS possono eseguire analisi del tipo "what-if" per nuovi livelli, consentendo il confronto di dati e analisi differenti allo stesso tempo.

MODELLI LINEARI GENERALI (GLM)

General Linear ModelingSTATISTICA Modelli Lineari Generali (GLM) analizza le risposte di una o più variabili dipendenti continue come una funzione di una o più variabili indipendenti categoriali o continue. GLM non è solamente lo strumento computazionalmente più avanzato sul mercato, ma è anche l'applicazione più completa, in quanto offre un'ampia scelta di opzioni, grafici, statistiche e diagnostiche rispetto a qualsiasi altro pacchetto. Progettato con un "approccio senza compromessi", GLM offre una grande selezione di opzioni per gestire i cosìdetti problemi "controversi" per i quali si fatica a trovare una soluzione. GLM calcolerà tutti i risultati standard, incluse le tabelle ANOVA con test univariati e multivariati, le statistiche descrittive, ecc. GLM offre inoltre moltissime opzioni per i risultati e i grafici, che solitamente non sono disponibili in altri programmi. GLM è in grado di fornire semplici metodi per la verifica di combinazioni lineari nella stima dei parametri, per la specificazione dei termini d'errore e degli effetti personalizzati, per i confronti post-hoc tra effetti di gruppo o per effetti di misure ripetute, ed per le interazioni tra misure ripetute.

Le seguenti sezioni riassumono alcuni dei più importanti vantaggi di GLM rispetto ad altri programmi, e le caratteristiche e funzionalità uniche disponibili in questo modulo; tuttavia è importante iniziare sottolineando il fatto che GLM non è soltanto il più avanzato strumento disponibile sul mercato, ma è anche l'applicazione più completa per la costruzione di modelli lineari, ed offre la più ampia gamma di opzioni, grafici, statistiche e diagnostiche di qualsiasi altro programma.

Piani. L'utente può scegliere tra piani ANOVA o MANOVA a una via (semplici o altamente personalizzati), a effetti principali, fattoriali o nidificati (nested); piani a misure ripetute; piani di regressione semplice, multipla o polinomiale; piani a superficie di risposta (con o senza blocchi), piani a superficie mistura, piani di analisi della covarianza semplice o complessa (ad es., con pendenze separate), o piani MANCOVA multivariati. I fattori possono essere fissi o casuali. Tutti questi piani possono essere efficientemente specificati tramite una qualsiasi delle tre interfacce descritte in precedenza, e possono essere personalizzati in diversi modi (ad es., si possono togliere degli effetti, specificare delle ipotesi personalizzate, ecc.). Inoltre, GLM può gestire piani estremamente grandi; per esempio, possono essere specificati fattori di misure ripetute con più di 1000 livelli, i modelli possono includere 1000 covariate oppure è possibile analizzare piani tra-gruppi estremamente grandi.

Il modello sovra-parametrizzato e sigma-ristretto. Una discussione dettagliata va oltre lo scopo della presente sintesi; la maggior parte dei programmi offrono solo il modello sovra-parametrizzato e soltanto alcuni il modello sigma-ristretto; STATISTICA GLM è l'unico programma disponibile sul mercato che li offre entrembi. Si noti che ciascuno dei due modelli ha i suoi vantaggi e svantaggi, ma entrambi gli approcci sono necessari per offrire una piattaforma GLM completa, cioé in gradi di gestire correttamente anche i problemi analitici più avanzati ed esigenti. Per esempio, i piani annidati e con pendenze separate si analizzano meglio utilizzando il modello sovra-parametrizzato; il modo più comune per valutare i componenti della varianza, e per calcolare i termini sintetizzati d'errore in un modello misto ANOVA, si basa sul modello sovra-parametrizzato. I piani fattoriali con numerosi fattori danno i risultati migliori con il modello sigma-ristretto; in breve, una semplice interazione a 2-vie di due fattori con due livelli richiede una sola colonna della matrice del piano con la parametrizzazione sigma-ristretta, ma 4 colonne se si utilizza il modello sovra-parametrizzato; di conseguenza, analizzare, ad esempio, un piano fattoriale a 8-vie complete richiede solo pochi secondi con GLM.

Gestione dei piani con celle mancanti. STATISTICA GLM calcolerà le consuete somme dei quadrati da Tipo I a IV per piani non bilanciati e incompleti; tuttavia, come è ampiamente noto (ad es., Searle, 1987; Milliken & Johnson, 1986), applicando questi metodi ai piani "confusi" con celle mancanti in luoghi più o meno casuali, può portare a dei risultati fuorvianti e privi di senso. STATISTICA GLM quindi offre anche due ulteriori metodi per analizzare i piani con celle mancanti: Hockings (1985) "scomposizione efficace delle ipotesi", e un metodo che elimina automaticamente gli effetti che non possono essere completamente stimati (ad es., quando le medie dei minimi quadrati non esistono per tutti i livelli del rispettivo effetto principale o effetto di interazione). Il secondo metodo è quello comunemente applicato all'analisi di piani altamente frazionati negli esperimenti industriali (si veda anche STATISTICA DOE). Questo metodo porta a risultati unici (non dipendenti dall'ordine dei livelli dei fattori), facilmente interpretabili, e coerenti con la letteratura relativa a questo campo. Quest utile caratteristica è unica per GLM.

Risultati. GLM calcolerà tutti i risultati standard, incluse le tabelle ANOVA con test univariati e multivariati, le statistiche descrittive, ecc. GLM offre anche numerose opzioni dei risultati e, in particolare, dei grafici solitamente non disponibili in altri programmi. Per esempio, GLM include una selezione completa di tipi di grafici delle medie (osservate, dei minimi quadrati, ponderate) per le interazioni di ordine superiore,

GLM Means Summary

con le barre degli errori (standard) per gli effetti che coinvolgono fattori tra gruppi o di misure ripetute;

GLM: Error Bars

analisi e grafici estensivi dei residui (per il campione di "addestremento", di verifica o convalida incrociata, o di previsione senza valori osservati per le variabili risposta), grafici delle componenti della varianza; profili di preferenza e ottimizzazione della risposta per ogni modello;

GLM: Profiler

medie corrette per l'analisi tradizionale della covarianza. Vengono fornite anche delle opzioni flessibili per la specificazione di confronti pianificati, incluse le funzionalità per specificare i contrasti, utilizzando sia la sintassi a comandi che una sequenza estremamente semplice (Wizard) di finestre

GLM Contrasts

(è possibile inserire dei coefficienti di contrasto per i livelli chiaramente etichettati dei fattori del piano; il programma valuterà il confronto per le medie dei minimi quadrati ("previsti"), cioè le medie previste e coerenti con l'attuale modello; questa è una soluzione unica al problema dei confronti pianificati in piani complessi e incompleti); modi semplici per testare le combinazioni lineari delle stime dei parametri (ad es., per verificare l'uguaglianza di specifici coefficienti di regressione); inserimento di termini d'errore ed effetti personalizzati; metodi completi di confronto post-hoc per gli effetti tra-gruppi o di misure ripetute, e le interazioni tra misure ripetute e tra gli effetti, inclusi: LSD di Fisher, Bonferroni, Scheffé, HSD di Tukey, HSD per N non uguali, Newman Keuls, Duncan e il test di Dunnett

GLM Post Hoc Tests

(con delle opzioni flessibili per la stima dei corretti termini d'errore), i test sugli assunti (ad es., test di Levene, grafici delle medie vs. deviazioni standard, ecc.).

Torna all'Inizio

MODELLI DI REGRESSIONE GENERALE (GRM)

General Regression ModelingSTATISTICA Modelli di Regressione Generale (GRM) fornisce un'implementazione unica e altamente flessibile dei modelli lineari generali, ed un completo insieme di tecniche stepwise e best subset per la ricerca dei migliori predittori categoriali e continui. Nello specifico, l'implementazione di GRM permette all'utente di usare metodi stepwise e best subset per costruire modelli con piani molto complessi, inclusi i piani con effetti categoriali. Perciò, il termine "generale" dei Modelli di Regressione Generale si riferisce sia all'uso del modello lineare generale, che alla possibilità di analizzare piani con predittori di diversa natura, a differenza della maggior parte dei programmi di regressione stepwise. Inoltre, le opzioni dei risultati includono i diagrammi di Pareto delle stime dei parametri, i riassunti (test) del modello completo con vari metodi per la valutazione dei modelli senza costante, le correlazioni parziali e semi parziali, ecc.

Selezione stepwise e best subset di predittori continui e categoriali (modelli ANOVA) per modelli con più variabili dipendenti. GRM è un "programma fratello" del modulo STATISTICA Modelli Lineari Generali (GLM). Oltre alle numerose opzioni analitiche uniche disponibili in GLM (inclusi i confronti pianificati, i test post-hoc, l'analisi dei residui, ecc.), GRM consente di costruire modelli tramite i metodi stepwise e best subset. Infatti queste tecniche sono rese disponibili non solo per i problemi analitici tradizionali con un'unica variabile dipendente, ma anche per quelli che prevedono più variabili risposta; in questo modo, GRM può essere considerato un programma unico. Questi metodi possono essere utilizati con piani che includo predittori sia continui che categoriali (ANOVA o ANCOVA), e le tecniche utilizzate in GRM assicurano che gli effetti con più gradi di libertà siano considerati come un blocco unico. In particolare, è consentito costruire dei modelli tramite la selezione in avanti o all'indietro degli effetti (che possono essere inclusi o rimossi un'unica volta durante il processo di selezione), la selezione stepwise forward o backward degli effetti (i quali possono entrare od uscire in qualunque momento, utilizando F o p per inserire e per rimuovere), o la selezione best subset; quest ultima in particolare fornisce le opzioni più flessibili per controllare i modelli durante la ricerca dei sottoinsiemi (ad es., la dimensione minima e massima dei sottoinsiemi, il CP di Mallow, l'R-quadro e l' R-quadro corretto, ecc.).

Risultati. Il modulo Modelli di Regressione Generale (GRM) forniscono tutte le opzioni standard dei risultati descritte in GLM (inclusi i profili di preferenza, le statistiche dei residui e delle previsioni, i test degli assunti, i grafici delle medie, ecc.). Inoltre, sono disponibili delle opzioni dei risultati specifiche per la regressione, tra le quali i diagrammi di Pareto delle stime dei parametri, i riassunti (test) del modello completo con vari metodi per la valutazione dei modelli senza costante, le correlazioni parziali e semi parziali, ecc.

Torna all'Inizio

MODELLI LINEARI GENERALIZZATI (GLZ)

generalized linear model, tweedieI Modelli Lineari Generalizzati (GLZ) consentono di ricercare delle relazioni lineari e non lineari tra una variabile risposta continua e dei predittori categoriali o continui (includono logit multinomiale e probit, modelli di identificazione del segnale e molti altri). Applicazioni speciali dei modelli lineari generalizzati includono diversi tipi di analisi, come ad esempio la regressione logit e probit binomiale o multinomiale, la Teoria di Identificazione dei Segnali (SDT) o i modelli Tweedie.

La distribuzione Tweedie è in realta una famiglia di distribuzioni che appartengono alla classe dei modelli esponenziali di dispersione, tali che la varianza è nella forma Var(Y) = φμP, dove φ > 0 è il parametro di dispersione/scala e μ è la media. P deve essere compresa nell'intervallo (-∞, 0] U [1, ∞).

Si noti che STATISTICA Data Miner include anche un'implementazione dei Modelli Additivi Generalizzati (GAM). Il modulo GLZ calcolerà tutte le statistiche standard dei risultati, inclusi i test rapporto di verosimiglianza, i test di Wald e dello score per gli effetti significativi, le stime dei parametri e i rispettivi errori standard ed intervalli di confidenza, ecc. L'interfaccia utente, i metodi per specificare i piani e l'utilizzo del programma sono molto simili a GLM, GRM e PLS. L'utente è in grado di specificare facilmente piani ANOVA o ANCOVA, piani a superfici di risposta, piani di superfici e misture, ecc.; quindi, anche utenti privi di esperienza saranno in grado di utilizzare dei modelli lineari generalizzati per analizzare i loro dati. Inoltre, GLZ include una selezione completa di strumenti per la verifica dei modelli, come gli spreadsheet e i grafici per le statistiche sui residui e per l'identificazione degli outlier, che includono i residui grezzi, i residui di Pearson, i residui della devianza, i residui di Pearson studentizzati, i residui della devianza studentizzati, i residui di verosimiglianza, le statistiche Chi-quadro differenziali, la devianza differenziale, le distanze di Cook generalizzate, ecc.

GLZ Start Up Dialog

 

Modelli e funzioni legame. Un'ampia gamma di distribuzioni (delle famiglia esponenziale) possono essere specificate per la variabile risposta: Normale, Poisson, gamma, binomiale, multinomiale, multinomiale ordinale e Gaussiana inversa. Inoltre, la natura della relazione tra i predittori e le risposte può essere indicata scegliendo una, cosìdetta, funzione legame tra numerose possibilità (comuni e speciali): log, potenza, identità, logit, probit, complimentary log-log (c-log-log) e log-log. Diversamente dagli altri modelli non lineari, questi modelli possono essere stimati tramite procedure estremamente rapide, e possono essere interpretati in modo molto semplice (simile ai modelli lineari generali); vengono quindi abbondantemente impiegati per le analisi di relazioni non lineari nelle ricerche scientifiche.

Selezione stepwise e best subset di predittori continui e categoriali (modelli ANOVA). Oltre alle tecniche di stima standard, STATISTICA GLZ offre delle opzioni per le analisi esplorative, tra le quali delle funzioni di costruzione dei modelli per la selezione in avanti o all'indietro degli effetti (che possono essere inclusi o rimossi un'unica volta durante il processo di selezione), per la selezione stepwise forward o backward degli effetti (i quali possono entrare od uscire in qualunque momento, utilizando un p per inserire e uno per rimuovere), e i metodi di regressione best subset (utilizando la statistica score di verosimiglianza, la verosimiglianza del modello o il criterio dell'informazione di Akaike). Questi potenti metodi possono essere applicati a predittori categoriali (piani ANOVA; gli effetti saranno inseriti o rimossi dal modello come blocco multiparametrico) o continui, consentento di risparmiare una quantità significativa di tempo per costruire un modello adeguato ai dati.

Risultati. Il modulo Modelli Lineari Generalizzati calcolerà tutte le statistiche standard dei risultati, inclusi i test rapporto di verosimiglianza, i test di Wald e dello score per gli effetti significativi, le stime dei parametri e i rispettivi errori standard ed intervalli di confidenza, ecc. Inoltre, per i piani ANOVA, possono essere calcolate le tabelle e i grafici delle medie previste con i rispettivi errori standard, in modo da aiutare nell'interpretazione dei risultati. GLZ include anche una selezione completa di strumenti per la verifica dei modelli, come gli spreadsheet e i grafici per le statistiche sui residui e per l'identificazione degli outlier, che includono i residui grezzi, i residui di Pearson, i residui della devianza, i residui di Pearson studentizzati, i residui della devianza studentizzati, i residui di verosimiglianza, le statistiche Chi-quadro differenziali, la devianza differenziale, le distanze di Cook generalizzate, ecc. Come descritto in precedenza, le statistiche dei residui e delle previsioni possono essere calcolate sui dati utilizzati per la stima e su quelli per la convalida (ossia, quelli del campione per la convalida incrociata).

Torna all'Inizio

MODELLI AI MINIMI QUADRATI PARZIALI (PLS)

Partial Least Squares ModelingMinimi Quadrati Parziali (PLS) dispone di una selezione completa di algoritmi per problemi univariati e multivariati. PLS calcolerà tutti i risultati standard di un'analisi ai minimi quadrati parziali; inoltre, il modulo offre numerose opzioni per i risultati e in particolare per i grafici, solitamente non disponibili in altre implementazioni; per esempio, i grafici dei valori dei parametri in funzione del numero di componenti, i plot bidimensionali per tutte le statistiche di output (parametri, "loadings" dei fattori, ecc.), i plot bidimensionali per tutte le statistiche sui residui, ecc. Poiché PLS offre le stesse interfacce utente flessibili di GLM, GRM e GLZ, è molto semplice stimare dei modelli in un modulo e rapidamente analizzare i dati usando gli stessi modelli in PLS. Questa flessibilità unica consente anche ad un utente principiante di applicare tecniche molto potenti per le proprie analisi. Il metodo ai minimi quadrati parziali è particolarmente indicato per determinare un minore numero di dimensioni in un grande numero di predittori e variabili risposta. Questi metodi per l'analisi di sistemi lineari sono diventati popolari solamente negli ultimi anni; quindi, molti algoritmi e statistiche sono ancora oggetto di studi e ricerche.

Il modello sovra-parametrizzato e sigma-ristretto per predittori categoriali. Come per GLM e GLZ, PLS dispone dei metodi sovra-parametrizzato e sigma-ristretto per i predittori categoriali (modelli ANOVA). Nei modelli ai minimi quadrati parziali, la soluzione sigma-ristretta può rivelarsi particolarmente utile, perché potrebbe produrre risultati meno complessi (ossia viene spiegata maggior variabilità con un numero minore di componenti, fatte di vettori del piano codificati in forma sigma-ristretta).

Algoritmi. STATISTICA PLS implementa i due algoritmi più generali per l'analisi ai minimi quadrati parziali: SIMPLS e NIPALS.

Risultati. PLS calcolerà tutti i risultati standard per l'analisi ai minimi quadrati parziali, ed offre inoltre una vasta gamma di opzioni e grafici, che solitamente non sono disponibili nelle altre implementazioni; per esempio, i grafici dei valori dei parametri in funzione del numero di componenti, i plot bidimensionali per tutte le statistiche di output (parametri, "loadings" dei fattori, ecc.), i plot bidimensionali per tutte le statistiche sui residui, ecc. Inoltre, come GLM, GRM e GLZ, il modulo Minimi Quadrati Parziali offre delle opzioni complete per l'analisi dei residui, e possono essere calcolate le statistiche dei residui e delle previsioni sui dati utilizzati per la stima del modello (il campione di addestramento), su quelli non utilizzati (ossia, il campione di verifica o di convalida incrociata) e per i casi senza valori della variabile risposta (il campione di previsione).

Torna all'Inizio

STATISTICA Modelli Lineari/Non Lineari Avanzati è compatibile con Windows XP, Windows Vista e Windows 7.

Requisiti Minimi

  • Sistema Operativo: Windows XP o superiore
  • RAM: 256 MB
  • Velocità del Processore: 500 MHz

Requisiti Raccomandati

  • Sistema Operativo: Windows XP o superiore
  • RAM: 1 GB
  • Velocità del Processore: 2.0 GHz

Sono disponibili la versione a 64-bit e le versioni multiprocessore altamente ottimizzate.

Per richiedere il prezzo di questa soluzione, si compili questo form.