|
“Your work has made a huge difference in my ability to create medical devices with expert-level accuracy.” Scott B. Wilson |
La popolarità delle reti neurali è rapida crescita in molte aree, dalla ricerca di base alle applicazioni di data mining, di previsione aziendale e di gestione del rischio, nell'ingegneria, ecc.
STATISTICA Reti Neurali (SANN) è uno dei pacchetti più avanzati e performanti, presenti sul mercato, per l'utilizzo delle reti neurali. Offre numerosi vantaggi unici, attirando così l'attenzione di esperti e non su questa nuova metodologia analitica.
Infatti gli esperti hanno a disposizione una vasta gamma di tipi di rete e di algoritmi di addestramento. I nuovi utenti invece possono essere guidati attraverso le fasi necessarie per la creazione di reti dallo strumento di Ricerca Automatica di Reti.
L’utilizzo delle reti neurali comporta dei passaggi in più della semplice specificazione dei dati.
STATISTICA Reti Neurali (SANN) dispone di funzionalità per assistere l’utente durante le fasi critiche della progettazione, incluse non solo le più moderne Architetture di Reti Neurali ed Algoritmi di Addestramento, ma anche nuovi approcci innovativi alla progettazione delle architetture di reti, specificando delle funzioni d’errore che consentano l’interpretazione dei risultati di output. Inoltre, gli sviluppatori e gli utenti che sono soliti eseguire esperimenti con applicazioni personalizzate apprezzeranno la possibilità, una volta terminate le sperimentazioni, di incorporare le analisi con reti neurali in applicazioni personalizzate attraverso l’uso della libreria di funzioni COM integrata in STATISTICA (che dispone di tutte le funzionalità del programma) oppure usando il codice C/C++ generato dal programma per aiutare nel deployment delle reti addestrate.
STATISTICA Reti Neurali è completamente integrato con STATISTICA, e quindi sono disponibili per le analisi numerosi strumenti per la modifica (preparazione) dei dati (trasformazioni, condizioni di selezione dei casi, strumenti di verifica dei dati, ecc.). Come tutte le analisi di STATISTICA, il programma può essere “connesso” a database remoti attraverso gli strumenti specializzati nell’elaborazione in-loco di database, oppure potrà essere collegato ai dati attivi in modo che i modelli possano essere riaddestrati od eventualmente applicati (ad es., per il calcolo di valori previsti o di classificazioni) automaticamente ogni volta che i dati cambiano.
In generale, i dati devono essere specificamente preparati per essere sottoposti come input alle reti neurali, ed è inoltre importante che l’output possa essere interpretato correttamente. STATISTICA Reti Neurali (SANN) include delle funzionalità automatiche di scaling sia per gli input che per gli output; sono inoltre disponibile delle funzioni di ricodifica automatica delle variabili contenenti valori Nominali (ad es., Sesso = [Maschio, Femmina]), quali ad esempio la ricodifica uno-di-N. SANN possiede inoltre delle funzionalità per la gestione dei dati mancanti e per la preparazione e l’interpretazione dei dati per l’uso di Serie Storiche. Numerosi strumenti rilevanti sono inoltre inclusi in STATISTICA.
Per i problemi di classificazione, SANN assegna i casi alle classi di appartenenza ed interpreta gli output della rete come probabilità reali. In combinazione con la speciale funzione di attivazione Softmax e con le funzioni di errore ad entropia incrociata, questo modulo supporta per la classificazione un approccio probabilistico.
La varietà di modelli di reti neurali e di parametri tra i quali scegliere (inclusi la dimensione della rete ed i parametri di controllo degli algoritmi di addestramento) può sembrare sconcertante [la Ricerca Automatica di Reti (ANS) consente una ricerca automatica attraverso numerose architetture di rete caratterizzate da diversi livelli di complessità; si veda in seguito]. STATISTICA Reti Neurali (SANN) supporta le classi più importanti di reti neurali per la soluzione di problemi reali:
Le architetture sopra indicate possono essere applicate in problemi di regressione, di classificazione, di regressione con serie storiche, di classificazione con serie storiche, e nell’analisi dei gruppi.
Inoltre, ANS supporta ensemble di reti basate sulla combinazione arbitraria dei tipi di rete sopra elencati. Tali combinazioni sono particolarmente utili per ottenere delle previsioni da dataset piccoli o rumorosi e sono semplici da ottenere. SANN contiene numerose funzionalità che aiutano l’utente a selezionare una corretta architettura di rete. Per visualizzare i dati , SANN è in grado di produrre scatterplot e superfici di risposta 3D, per favorire una migliore comprensione del “comportamento” reale della rete. Ovviamente, per ulteriori analisi è possibile usare le informazioni fornite da ognuna di queste sorgenti attraverso altri strumenti di STATISTICA o per l’inclusione in report, altre analisi o personalizzazioni.
SANN conserva automaticamente delle copie delle migliori reti trovate durante la sperimentazione, le quali possono essere recuperate in qualsiasi momento. L’utilità e la validità predittiva della rete possono essere automaticamente valutate includendo dei campioni di test e di validazione, confrontando la dimensione e l’efficacia della rete o il costo dell’errata classificazione.
Per ottenere performance migliori, STATISTICA Reti Neurali offre diverse opzioni per la personalizzazione delle reti. È possibile ad esempio specificare uno strato di output lineare per le reti usate nei problemi di regressione, o le funzioni di attivazione softmax per le stime probabilistiche da applicare nei problemi di classificazione. Sono inoltre incluse funzioni d’errore ad entropia incrociata ed un’ampia gamma di funzioni di attivazione specializzate, tra le quali la funzione Esponenziale, Tangente Iperbolica, Logistica Sigmoidea e Seno, sia per lo strato nascosto che per quello di output.
In STATISTICA Reti Neurali (SANN) è incluso uno strumento che consente la valutazione automatica di differenti architetture di rete con diversi livelli di complessità, e la selezione del migliore insieme di architetture per lo specifico problema. Questo strumento è noto come Ricerca Automatica di Reti (ANS).
Durante la progettazione di una rete neurale, una quantità significativa di tempo viene spesa per la selezione delle variabili appropriate, e successivamente per l’ottimizzazione dell’architettura di rete tramite ricerche di natura euristica. SANN risolve questo problema conducendo una ricerca euristica in automatico, che riguarda i tipi di rete, le dimensioni e le architetture, le funzioni di attivazione ed le funzioni di errore quando appropriato.
La Ricerca Automatica di Reti è uno strumento estremamente efficace, che utilizza delle sofisticate tecniche per la ricerca automatica di architetture ottimali di rete. Perché, quindi, lavorare ad un terminale per ore, quando è possibile lasciare che se ne occupi automaticamente STATISTICA Reti Neurali?
Durante le sperimentazioni di diverse architetture e tipi di rete, sarà possibile fare affidamento sulla qualità e la rapidità degli algoritmi di addestramento disponibili. STATISTICA Reti Neurali (SANN) supporta i più noti e moderni algoritmi di addestramento disponibili.
SANN include ovviamente algoritmi di addestramento rapidi e di secondo ordine: Conjugate Gradient Descent e BSFGS. Vi è inoltre una versione “memory-less” dell’algoritmo BFGS sul quale SANN si basa automaticamente ogni volta che la quantità di memoria disponibile sul proprio computer ha raggiunto livelli critici. Questi algoritmi in genere convergono molto più rapidamente rispetto a quelli di primo ordine, come ad esempio il Gradient Descent.
Le procedure ad algoritmi iterativi di STATISTICA Reti Neurali sono integrate dalla tracciatura automatica dell’errore di addestramento e dell’errore di test, i quali vengono registrati durante il corso dell’addestramento. L’addestramento può essere interrotto in qualsiasi istante attraverso il semplice click di un pulsante, ed è inoltre possibile specificare le condizioni di stop che determinano l’arresto anticipato dell’addestramento, per esempio, in corrispondenza del momento in cui viene superato un livello target di errore, oppure quando l’errore di selezione inizia a peggiorare oltre un dato numero di cicli. Nel caso in cui si tema il verificarsi di sovra-adattamento, non sarà necessario preoccuparsi: SANN infatti conserva automaticamente una copia della migliore rete trovata, la quale viene automaticamente recuperata ed usata come soluzione migliore. Al termine dell’addestramento sarà possibile eseguire una verifica finale della performance rispetto ai campioni di addestramento, di test e di validazione.
Una volta addestrata una rete, probabilmente si vorrebbero testare la sua performance ed esplorare le sue caratteristiche. STATISTICA Reti Neurali (SANN) fornisce una vasta gamma di output statistici e grafici.
È possibile selezionare più modelli (ed ensemble); in questo caso, quando possibile, SANN mostrerà qualsiasi risultato generato in una visione comparativa (ad es., tracciando le curve di risposta per diversi modelli su di un singolo grafico, oppure presentando le previsioni di molti modelli in un unico spreadsheet). Questa caratteristica è particolarmente utile per confrontare diversi modelli addestrati sul medesimo data set.
Tutte le statistiche sono generate indipendentemente per i campioni di addestramento, di test e di validazione o per qualsiasi loro combinazione.
Le statistiche globali calcolate includono l’errore medio della rete, la così detta matrice di confusione per i problemi di classificazione (che fornisce un riepilogo delle classificazioni corrette e non corrente per tutte le classi), e la correlazione per i problemi di regressione – tutte calcolate automaticamente. Le reti di Kohonen comprendono anche una Mappa Topologica, che consente di ispezionare visivamente le attivazioni delle unità durante l'analisi dei dati.
La semplice ed efficace interfaccia utente di STATISTICA Reti Neurali consente all’utente di creare rapidamente prototipi di reti neurali da usare per risolvere i propri problemi.
In alcune applicazioni, si potrebbe voler integrare queste soluzioni nei propri sistemi e, per esempio, implementarle in ambienti computerizzati più grandi (si pensi alle procedure “pre-confezionate” disponibili nei sistemi aziendali di analisi).
Le reti neurali addestrate possono essere applicate a nuovi dati (per ottener delle previsioni) in molti modi: è possibile salvare le reti addestrate, e successivamente recuperarle per effettuare la previsione di nuovi dati. È inoltre possibile usare il generatore opzionale di codice per salvare i modelli a reti neurali completamente addestrati nel linguaggio di programmazione C, il quale sarà pronto da compilare e da poter richiamare in applicazioni ed ambienti esterni (come visual basic) in vista di un eventuale deployment o della previsione di nuovi dati. Infine, tutte le funzionalità di STATISTICA, incluso STATISTICA Reti Neurali, sono accessibili come funzioni COM (Component Object Model) da parte di altre applicazioni (ad es., da Java, Microsoft Excel, C#, VB.NET, ecc.). Per esempio, è possibile integrare analisi automatiche create con STATISTICA Reti Neurali all’interno dei fogli di lavoro di Microsoft Excel.
Le reti possono essere di dimensione praticamente illimitata (ossia, possono essere molto più grandi di quanto ci si possa aspettare). Per tutti i problemi pratici, l'unico limite a cui è soggetto il programma è dato dall'hardware della macchina sulla quale si lavora.
STATISTICA Reti Neurali include un manuale illustrato, contenente un introduzione completa e teorica sule Reti Neurali, e degli aiuti estesi accessibili da ogni finestra di dialogo.
L'add-on STATISTICA Generatore di Codice per le Reti Neurali consente di generare del codice sorgente di una rete neurale nei linguaggi C, JAVA o PMML, il quale può essere compilato ed integrato all'interno di programmi personalizzati. Questto add-on necessita di una licenza separata.
Le reti neurali possono essere usate praticamente in qualsiasi situazione in cui l’obiettivo è determinare il valore di una variabile o di un attributo sulla base di osservazioni o misurazioni registrate (si pensi, cioè, a diverse forme di regressione, classificazione e serie storiche), dove è presente una quantità sufficiente di dati storici ed esiste realmente una relazione sottostante tracciabile o un insieme di relazioni (le reti sono relativamente tolleranti al rumore). Inoltre, le reti neurali possono essere usate per l’analisi esplorativa qualora si stia svolgendo un’operazione di raggruppamento dei dati (reti di Kohonen).
È possibile trovare una discussione completa delle considerazioni teoriche su come e quando l’applicazione delle reti neurali ha più probabilità di successo, sul capitolo dedicato alle reti neurali del Manuale Elettronico di StatSoft (disponibile sul sito web di StatSoft). Il seguente elenco include una selezione di esempi sulle diverse opportunità di applicazione di questi strumenti.
STATISTICA Reti Neurali è compatibile con Windows XP, Windows Vista e Windows 7.
Sono disponibili la versione a 64-bit e le versioni multiprocessore altamente ottimizzate.
Per richiedere il prezzo di questa soluzione, si compili questo form.