

Descrizione: I servizi di formazione altamente qualificati offerti da StatSoft vi consentiranno di apprendere tutti gli aspetti metodologici e pratici delle tecniche "allo stato dell'arte" di data mining, attraverso le quali identificare tendenze, strutture, modelli e trend inattesi sulla base dei quali prendere decisioni cruciali per la propria ricerca.
Il Corso sarà basato su esempi pratici di data mining e sarà arricchito con abbondanti materiali illustrativi in cui saranno ampiamente spiegati concetti e metodi. Oltre a ciò vi potrà essere una verifica finale su quanto appreso dai partecipanti, con utilizzo comparativo di dati reali su vere e proprie piattaforme di data mining.
Obiettivi del Corso: L'utilizzo tipico di certi strumenti "a scatola chiusa" presenta i suoi ovvi svantaggi e può spesso portare ad ottenere risultati praticamente inattendibili e a conclusioni fuorvianti. Se praticato in modo non opportuno il Data Mining potrebbe rivelarsi dannoso. È quindi importante comprendere bene le caratteristiche dei dati sottoposti alle metodologie di data mining (punti di forza e punti deboli) per essere così in grado di fare scelte informate su quali modelli utilizzare e guidicare criticamente i risultati personalmente ottenuti così come quelli ottenuti dagli altri. In questo caso verrà adottata una metodologia così detta "a scatola aperta", che enfatizzerà una comprensione delle strtture algoritmiche e dei modelli statistici utilizzate.
Formazione: La formazione verte su esempi tangibili e teorici - a partire dalla descrizione di un ampio quadro operativo fino alla descrizione del dettaglio più particolareggiato - consentendo ai partecipanti dei corsi di acquisire le conoscenze e le capacità necessarie per eseguire specifiche operazioni di data mining.
Il corso inizierà con una breve discussione sul ruolo e l'applicabilità del data mining in quegli ambienti aziendali da sempre incapaci di estrarre informazioni inutilizzate dai propri database. Dopodiché, verrà fatta una panoramica generale sul data mining, e sull'arte e la scienza dell'apprendimento dai dati. Solo successivamente si potrà passare all'osservazione nel dettaglio dei singoli strumenti e a come questi possono essere inseriti in un più ampio contesto di ricerca/business. Per questo motivo, durante la fase principale della formazione verrà proposta una serie di panoramiche riguardanti la terminologia ed i metodi specificamente utilizzati nel data mining statistico. Tutte le principali tecniche considerate verranno illustrate con esempi pratici e con spiegazioni approfondite delle metodologie di base.
In breve, questo corso di tre giorni comprenderà letture che riguardano l'utilizzo di software specifici, aspetti metodologici e applicazioni pratiche delle tecniche di data mining statistico, che consentiranno ai partecipanti di sperimentare personalmente i metodi appresi durante il corso beneficiando di un ambiente completamente orientato al data mining ed applicandole su dati reali.
Referenze: Tra i partecipanti alle diverse edizioni del corso vi sono aziende del calibro di ABB, Alstom, Barry Callebaut, Bayer Consumer Care, Bühler, CSS, Daimler Chrysler, Decathlon, Helsana, John Deere, Manor, MAN Turbo, Mobiliar, Novelis, Phonak, PostFinance, Procter & Gamble Manufacturing, Roche Diagnostics, Saudi Arabian Oil Company, Siemens e Total. Abbiamo studiato e progettato il corso sulla base dei feedback ricevuti da queste aziende.
Contenuti del Corso
Introduzione
Applicabilità del data mining
Cos'è il data mining?
Il data mining è un "déja vu statistico"?
Perchè è necessaria la statistica?
Cosa distingue il data mining dalla statistica?
Un modello precedurale per il data mining
I dati e la pre-elaborazione dei dati
Sorgenti di dati
Perchè eseguire una pre-elaborazione dei dati?
Principali operazioni di pre-elaborazione (ad es., integrazione, pulitura, trasformazione, riduzione, "discretizzazione" dei dati)
Tecniche ed operazioni di data mining
Descrizione e visualizzazione
Caratterizzazione dei dati multivariati
Dissimilarità e misure di distanza
Descrizione e visualizzazione
Metodi non supervisionati ("class discovery")
Analisi delle componenti principali
Scaling multidimensionale
Analisi dei gruppi (ad es., algoritmi gerarchici, algoritmi di partizionamento, uso pratico dell'analisi dei gruppi)
Mappe auto-organizzanti di Kohonen
Raggruppamento su affinità e regole associative
Uno sguardo in avanti
Metodi supervisionati ("class prediction")
Introduzione (ad es., distorsione induttiva e complessità del modello, funzioni score, convalida interna, convalida esterna)
Modellazione di classificazione (ad es., analisi discriminante, support vector machine, classificazione nearest neighbour, classificatori naive Bayes)
Modellazione di regressione (ad es., modelli lineari multipli, modelli lineari generalizzati, modelli di regressione non parametrici, modelli additivi generalizzati)
Reti neurali
Metodi ad alberi (ad es., CART, C4.5 e C5.0, CHAID)
Apprendimento con ensemble (ad es., bagging, sub-bagging, foreste casuali, boosting)
La maledizione della dimensionalità (ad es., estrazione delle caratteristiche, selezione di sottoinsiemi di caratteristiche)
Valutazione e confronto tra classificatori
Confronto tra modelli di regressione
Uno sguardo in avanti
Lezioni precedenti - cosa abbiamo imparato?
Confronto tra i modelli di apprendimento supervisionato scelti
Criteri per un potenziale data mining di successo
Conclusioni
Riferimenti e risorse
Appendice
Leggende sul data mining e la realtà
Informazione Prodotti



Filmati (Prodotti) 