Nuove Funzionalità di STATISTICA 10Iscriviti ora per ricevere 10 mail (in inglese) che illustrano 10 nuove funzionalità della Versione 10.
Tre filmati sono già disponibili e possono essere subito visualizzati.
In STATISTICA 10 sono state aggiunte ulteriori funzionalità, ed ha inoltre migliorato sensibilmente le prestazioni sfruttando la tecnologia delle CPU a 64-bit (se disponibili nell'hardware in uso) e la tecnologia multithreading.
Molte delle funzioni di STATISTICA per la gestione dei dati e per le analisi (C&RT, CHAID, Modelli Lineari Generali, ecc.), che nella Versione 9 operavano in modalità singlethread, sono state ottimizzate per sfruttare la tecnologia avanzata multithreading, la quale beneficia dei sistemi con più processori.
Altre Novità:
In STATISTICA 10 è stato integrato il nuovo standard per lo scambio dei dati – Microsoft SharePoint. I documenti di STATISTICA possono ora essere scaricati o archiviati in SharePoint, in modo efficiente direttamente dall'interfaccia utente di STATISTICA. Al momento di questa release, STATISTICA 10 è l'unica applicazione analitica o di data mining che offre questa funzionalità integrata.

STATISTICA è in grado di importare i file, ed i relativi formati, di Office 2007 e 2010 direttamente al suo interno, mostrando la stessa interfaccia dell'applicazione di Microsoft e con in aggiunta le funzionalità analitiche di STATISTICA. Questa nuova tecnologia ha permesso di migliorare la velocità e di diminuire i problemi relativi all'importazione deli file Excel 2007 e 2010 negli spredsheet di STATISTICA; ora infatti è Excel 2007/2010 a gestire il formato delle celle.

STATISTICA Query ora è in gradi di recuperare i dati dai provider a cubi OLAP, come ad esempio Microsoft OLE DB Provider for Analysis Services or SAP Business Warehouse. Le query MDX possono essere generate in un ambiente drag-and-drop di semplice utilizzo, oppure è possibile inserire direttamente il codice MDX (attualmente questa opzione è in versione Beta).

Adesso è più semplice installare e gestire STATISTICA PI Connector in STATISTICA 10, infatti PI connector viene distribuito come parte della versione 10, rendendo quindi non necessario un installer separato.
La tecnologia dei Grafici di STATISTICA è stata sostanzialmente aggiornata per rilevare e sfruttare automaticamente le potenti risorse degli acceleratori grafici, i quali ora sono disponibili anche nei computer più comuni, sia desktop che laptop, e non solo nelle macchine di alto livello.
I grafici risultanti non solo vengono generati più velocemente, ma supportano anche le opzioni avanzate per la gestione della trasparenza e del gradiente. Tutti i Grafici di STATISTICA sono stati potenziati, per rendere la loro visualizzazione e comprensione più chiara e gestibile da parte dell'utente.
Inoltre, tutti le finestre dei Grafici di STATISTICA possiedono dei controlli grafici interattivi (una barra posta sul lato inferiore della finestra contenente degli slider), i quali consentono di impostare queste nuove caratteristiche. I benefici che se ne possono trarre includono non solo il miglioramento della visualizzazione, ma anche la possibilità di effettuare delle analisi esplorative direttamente sui grafici, per ricercare dei trend nascosti da una massiccia presenza di punti (tramite la trasparenza dei marcatori), oppure per ruotare i grafici 3D in senso verticale ed orizzontale.

è ora possibile interagire direttamente con la scala del grafico, scorrendo il mouse sopra le etichette degli assi verso la fine dell'asse e trascinando verso destra o sinistra per modificare la scala. Lo Scaling Interattivo è una potente tecnica grafica esplorativa che consente di rivelare trend nascosti allargando o comprimendo porzioni del display.

è ora possibile interagire direttamente con l'asse del grafico per eseguire la panoramica verso destra o sinistra, scorrendo il mouse sopra le etichette degli assi verso il centro dell'asse. Il Panning Interattivo è una potente tecnica grafica esplorativa che consente di rivelare trend nascosti nei dati.
STATISTICA 10 supporta la trasparenza (gestita in modo interattivo con delle barre sullo schermo) per controllare il contrasto delle aree grafiche e la saturazione dei marcatori sovrapposti (richiede Windows Vista SP 2 o Windows 7). Il controllo Trasparenza è una potente tecnica grafica esplorativa che consente di rivelare trend nascosti quando i dati sono concentrati in poche zone (soprattutto negli scatterplot e negli scatterplot di matrici generati da data set di grandi dimensioni).

L'obiettivo è di raggiungere un livello ottimale di densità per scoprire tendenze nascoste da un alto numero di punti casuali (white noise) che formano l'effetto detto "a macchia d'inchiostro".

Le linee di riferimento possono essere aggiunte ai grafici tramite le opzioni a loro dedicate nella finestra Opzioni Grafiche. Tali linee permettono di segnalare specifici elementi del grafico, in modo da rendere più dettagliata la loro interpretazione.

Il testo ora può essere modificato direttamente sullo schermo (facendo un clic e digitandolo), senza la necessità di utilizzare un editor, che naturalmente rimarrà disponibile per la formattazione avanzata del testo inserito.
In STATISTICA 10 sono stati apportati numerosi miglioramenti per facilitare l'utilizzo dell'applicazione da parte degli utenti e per sostenere gli ultimi studi nel campo dei fattori umani, in modo da (1) ridurre l'affaticamento degli occhi e (2) migliorare l'efficienza dell'interazione tra l'utente e il computer. STATISTICA 10 offre un'interfaccia utente migliore e più efficiente, frutto della tecnologia di visualizzazione completamente riprogettata e della nuova iconografia.
Tutte le barre multifunzione sono state aggiornate per includere nuovi simboli completamente ridisegnati (i tradizionali menu a tendina sono ancora disponibili per chi non avesse familiarità con le nuove opzioni.) Inoltre le macro di STATISTICA Visual Basic ora possono essere aggiunte alle Barre Multifunzione.

Gli spazi di lavori di STATISTICA Data Miner dispongono ora di icone più grandi (e graficamente migliorate). Inoltre sono disponibili ulteriori funzionalità per impementare questa interfaccia utente.

La Barra Multifunzione di STATISTICA ora può essere migliorata tramite l'aggiunta di API (Application Programming Interface). Questa funzionalità si rivela particolarmente utile per creare delle vere e proprie Aggiunte di STATISTICA.
Il modulo STATISTICA Distribuzione & Simulazione e le funzionalità introdotto con la versione 9 sono state ulteriormente raffinate e potenziate. STATISTICA 10 rende più facile simulare i dati da una specifica distribuzione tramite il Piano di Simulazione.
Ora è possibile trovare la distribuzione che meglio si adatta ai dati ed utilizzarla, insieme alla correlazione dei dati, per simulare uno specifico numero di osservazioni. Invece di dover aspettare di accumulare una quantità minima di dati, adesso è possibile adattare le distribuzioni teoriche, simulare da tali distribuzioni e infine trarre delle conclusioni sulla base della simulazione. In aggiunta si possono svolgere delle simulazioni a partire dalle correlazioni tra le variabili. Questa funzionalità è estremamente utile per le analisi "what-if" e sta iniziando ad essere utilizzata con maggior frequenza anche nelle industrie.
Ad esempio supponiamo di essere un'azienda che costruisce macchinari con componenti di precisione. Potremmo utilizzare le nostre conoscenze sui macchinari e sulle componenti per generare i dati, e quindi per analizzarli al fine di stimare l'affidabilità. Di seguito è stata riportata una matrice di correlazione del tasso di difettosi e del tempo di completamento campionari per le componenti di precisione, stimata sulla base dei processi precedenti e delle informazioni disponibili. Anche le medie e le deviazioni standard sono state stimate. Utilizzando il Piano di Simulazione i dati sono stati simulati a partire dalla distribuzione teorica di ogni variabile, da suoi parametri e dalle correlazioni. Ovviamente l'utente può impostare manualmente l'esatta distribuzione di ogni variabile. I risultati sono mostrati nello scatterplot adiacente, dove è facile notare come la struttura della correlazione, -0.45, sia stata mantenuta. Questi dati possono quindi essere utilizzati prima dell'inizio della produzione per scoprire quale possa essere indicativamente l'andamento del processo.

In STATISTICA 10 è stata finalmente aggiunta l'implementazione completa dei Modelli a Rischi Proporzionali di Cox, una potente tecnica analitica per i dati di durata. Possibili applicazioni di questo nuovo modulo includono:
Il modulo Modelli a Rischi Proporzionali di Cox consente di gestire in modo flessibile i dati censurati, i predittori categoriali e il piano del modello, che include la possibilità di aggiungere interazioni e/o effetti nidificati. Inoltre è possibile utilizzare le tecniche stepwise e best subset, per la selezione dei predittori. Infine il deployment delle funzioni stimate è disponibile con STATISTICA Deployment Rapido.

Sono stati apportati numerosi piccoli aggirnamenti per il calcolo delle statistiche descrittive, i quali spesso portano a significativi miglioramenti nella velocità di esecuzione quando si lavora con grandi data set.
Le profit chart ora possono essere costruite con il modulo STATISTICA Deployment Rapido dei Modelli Predittivi. Questi grafici riassumono i costi e il profitto stimato del modello corrente, e poaaono essere utilizzati in quasi tutte le applicazioni di data mining per valutare la bontà dei modelli.

Le curve ROC ora possono essere costruite con il modulo STATISTICA Deployment Rapido dei Modelli Predittivi. Questi grafici rappresentano un valido strumento per valutare la qualità dei modelli attraverso la visualizzazione dei tassi dei "veri" positivi in confronto ai "falsi" positivi, risultando così molto utili in numerosi ambiti di ricerca, come ad esempio nella medicina, nel controllo della qualità e in psicologia. Nota: è interessante osservare che il metodo della curva ROC pone le sue radici nei primi giorni di utilizzo della tecnologia radar, durante la seconda guerra mondiale. Gli operatori radar infatti valutavano la capacità di trovare segnali "veri" (aerei) contro segnali "falsi" (uccelli) tramite questo strumento. Ai giorni nostri le curve ROC sono ancora utilizzate nel data mining per le stesse ragioni.
In risposta alle crescenti esigenze del text mining, dove data set di enormi dimensioni vengono utilizzati per analisi esplorative e per la modellazione, il motore computazionale di STATISTICA Text Miner è stato completamente ridisegnato e ottimizzato per migliorare la sua scalabilità e performance. Le procedure di gestione del database interno sono state riprogettate, in modo da consentire a questo modulo di eseguire l'analisi di grandi data set in maniera efficiente, attraverso il maggior uso della tecnologia multithreading.
STATISTICA 10 offre due nuove opzioni per il deployment: Java e C#. Quest ultima permette inoltre di generare del codice C# in modo che possa essere incorporato all'interno di una funzione di SQL Server definita dall'utente, da utilizzare in una stored-procedure per calcolare le previsioni delle nuove osservazioni direttamente all'interno del database. Il codice Java può essere usato nello stesso modo all'interno di funzioni Oracle definite dall'utente. Si noti che questa funzionalità necessità di una licenza aggiuntiva. Il principale vantaggio di questo metodo è il guadagno in termini di performance, poiché il deployment interno al database può essere eseguito più rapidamente di qualunque procedura esterna (basti pensare che non è necessario estrarre i dati).

Il wizard per la costruzione di scorecard ora è completamente integrato nella piattaforma di STATISTICA e include diversi miglioramenti.
STATISTICA Scorecard è una soluzione dedicata per lo sviluppo, la valutazione e il monitoraggio di scorecard (modelli per la stima del rischio su credito), e comprende i passaggi per la Selezione dei Predittori, la Costruzione degli Attributi, la Preparazione delle Scorecard, la Selezione del Punto di Cutoff, l'Inferenza sui Respinti e la Stabilità della Popolazione.
Il programma è in grado di costruire scorecard "tradizionali", basate sulla regressione, e scorecard più sofisticate, basate sul data mining, ed infine permette di confrontarne la qualità delle previsioni. Scorecard fornisce inoltre diversi strumenti specializzati per le analisi e l'esplorazione grafica, per la previsione di nuove osservazioni o per valutare la precisione del modello. Per maggiori dettagli si veda STATISTICA Credit Scoring.

In STATISTICA 10 sono stati raggiunti significativi miglioramenti nelle prestazioni dei vari algoritmi di modellazione predittiva quando si utilizzano data set di grandi dimensioni. Ad esempio, tutte i modelli costruiti tramite il modulo Modelli Lineari Generalizzati (ad es., la Regressione Logistica) ora sono in grado di sfruttare la tecnologia multi-core e possono quindi gestire grandi quantità di dati. Simili miglioramenti nella scalabilità sono stati raggiunti anche dagli algoritmi C&RT e CHAID.
La navigazione e la gestione degli oggetti è divenuta più semplice ed efficiente nell'Enterprise Manager di STATISTICA 10 grazie alla nuova barra multifunzione.

Le configurazioni dei dati sono ora disponibili nel Visualizzatore del Sistema di STATISTICA, permettendo così all'utente di eseguire una query di una configurazione dati direttamente all'interno dell'interfaccia utente di STATISTICA, senza dover apprire Enterprise Manager.

Lo strumento Migrazione di Database è stato aggiornato alla nuova struttura del database di STATISTICA 10, ed è stato reso disponibile direttamente all'interno di STATISTICA Enterprise. Può essere eseguito da un amministratore per copiare le configurazioni da un database ad un altro.
STATISTICA 10 rende più semplice la pubblicazione delle macro in STATISTICA Enterprise, che rappresenta il metodo più facile per creare delle Configurazioni di Analisi SVB, e funziona sia con script SVB che con script R. Per accedere a questa nuova opzione è necessario creare una macro in STATISTICA, passare alla scheda Enterprise e premere il pulsante Deployment Macro.
Enterprise Manager ora permette una maggiore flessibilità nella definizione dei nomi delle Configurazione di STATISTICA Enterprise. Adesso i nomi devono essere unici soltanto all'interno della stessa cartella del Visualizzatore del Sistema.
Le Configurazioni delle Analisi impostate per l'auto aggiornamento, ora si auto aggiornano anche quando eseguite in un browser Web; l'utente può regolare l'intervallo di aggiornamento direttamente dal browser, oppure può aggiornare manualmente. L'implementazione di questa funzionalità utilizza le tecnologie web più recenti, che permettono di aggiornare solamente le immagini di un grafico invece di ricaricare l'intera pagina web.

Le Carte di Controllo della Qualità ora supportano il brushing interattivo anche quando eseguite in un browser Web. L'assegnazione di Cause, Azioni e Commenti può essere essere effettuata direttamente nell'interfaccia web. Anche in questo caso l'implementazione di questa funzionalità utilizza le tecnologie web più recenti, che permettono di aggiornare solamente le immagini di un grafico invece di ricaricare l'intera pagina web.
In STATISTICA 10, l'opzione STATISTICA MSPC Online consente di effettuare il deployment delle analisi multivariate (PCA, PLS) in STATISTICA Enterprise in modo più semplice, permettendo così l'aggiornamento e il monitoraggio in tempo reale, l'esecuzione di operazioni di drill-down per i punteggi delle componenti, e la costruzione dei grafici dei contributi e delle carte univariate.

STATISTICA Web Data Entry permette agli utenti di definire delle schermate per l'inserimento dei dati tramite browser Web, e per archiviare/gestire questi dati nel database di STATISTICA Enterpris.
STATISTICA 10 Web Data Entry include numerosi miglioramenti, tra i quali:

Insieme a STATISTICA 10 è stata rilasciata anche una nuova e migliorata versione di STATISTICA Live Score. STATISTICA Live Score è un software Server di STATISTICA all'interno della Piattaforma per l'Analisi dei Dati e il Data Mining.
I dati vengono aggregati e puliti, e i modelli stimati e validati, utilizzando STATISTICA Data Miner, mentre i modelli convalidati vengono distribuiti dal Server STATISTICA Live Score.
STATISTICA Live Score è un'applicazione multi-threaded, efficiente e indipendente dalle piattaforme hardware/software per effettuare lo scoring dei dati lungo tutti i rami aziendali. Alcuni esempi di utilizzo di STATISTICA Live Score includono:
STATISTICA Scorecard è una soluzione dedicata per lo sviluppo, la valutazione e il monitoraggio di scorecard (modelli per la stima del rischio su credito), e comprende i passaggi per la Selezione dei Predittori, la Costruzione degli Attributi, la Preparazione delle Scorecard, la Selezione del Punto di Cutoff, l'Inferenza sui Respinti e la Stabilità della Popolazione.
Sono stati aggiunti nell'Help centinaia di esempi di STATISTICA Visual Basic.
