Data Science Manuale Italiano Analisi E Visualizzazione Dei Dati


Download Data Science Manuale Italiano Analisi E Visualizzazione Dei Dati PDF/ePub or read online books in Mobi eBooks. Click Download or Read Online button to get Data Science Manuale Italiano Analisi E Visualizzazione Dei Dati book now. This website allows unlimited access to, at the time of writing, more than 1.5 million titles, including hundreds of thousands of titles in various foreign languages.

Download

Data Science : Manuale Italiano - Analisi e Visualizzazione dei Dati


Data Science : Manuale Italiano - Analisi e Visualizzazione dei Dati

Author: Mario A.B. Capurso

language: it

Publisher: Mario Capurso

Release Date:


DOWNLOAD





Questa opera segue il curriculum 2021 della Association for Computing Machinery per specialisti in Scienze dei Dati, con l’obiettivo di costituire un “Bignami” della Scienza ed Ingegneria dei Dati e facilitare il percorso di formazione personale a partire da competenze specialistiche in Informatica o Matematica o Statistica per un lettore di lingua madre italiana. Secondo di una serie di testi, copre gli aspetti metodologici della scienza dei dati, l’analisi e la visualizzazione dei dati. Descrive la metodologia CRISP DM, le fasi lavorative, i criteri di successo, i linguaggie gli ambienti utilizzabili, le librerie applicative. Poichè questo testo utilizza Orange per gli aspetti applicativi, ne viene descritta l’installazione ed i widget. Nella visualizzazione vengono fatti cenni storici, descritte le caratteristiche di una visualizzazione efficace, i tipi di messaggi veicolabili, la Grammatica dei Grafici, l’uso di un grafico e di una dashboard, i software e le librerie utilizzabili, il ruolo e l’uso del colore. Vengono quindi analizzati 55 tipi di grafici riportando significato, uso, esempi e dimensioni visive anche con un vocabolario dei grafici e tabelle riassuntive. Vengono portati esempi in Orange e viene spiegato l’eventuale uso di Python con Orange. Viene discussa l’inferenza basata sulla visualizzazione, definita l’analisi esplorativa e confermativa e riportate le tecniche. Per motivi legati alla fruibilità in formato elettronico, il testo è stato suddiviso in parti con un numero non esagerato di pagine, mantenendo costante la parte metodologica introduttiva e la bibliografia e con una numerazione dei paragrafi che rimanda al testo complessivo nella sua forma integrata. Il testo è corredato di materiale di supporto ed è possibile scaricare gli esempi in Orange e i dati di prova.

Data Science Manuale Italiano – Advanced Machine Learning e Deployment


Data Science Manuale Italiano – Advanced Machine Learning e Deployment

Author: Mario A. B. Capurso

language: en

Publisher: Mario Capurso

Release Date:


DOWNLOAD





Questa opera segue il curriculum 2021 della Association for Computing Machinery per specialisti in Scienze dei Dati, con l’obiettivo di costituire un “Bignami” della Scienza ed Ingegneria dei Dati e facilitare il percorso di formazione personale a partire da competenze specialistiche in Informatica o Matematica o Statistica per un lettore di lingua madre italiana. Parte di una serie di testi, riepiloga prima di tutto la metodologia di lavoro standard CRISP DM utilizzata in questa opera e in progetti di Scienza dei Dati. Poichè questo testo utilizza Orange per gli aspetti applicativi, ne descrive l’installazione ed i widget. La fase di modellizzazione dei dati viene considerata nell’ottica dell’apprendimento automatico riepilogando i tipi di apprendimento automatico, i tipi di modelli, i tipi di problemi e i tipi di algoritmi. Sono descritti gli aspetti avanzati associati alla modellizzazione quali le funzioni di perdita e di ottimizzazione come la gradient descent, le tecniche per analizzare le prestazioni dei modelli come il Bootstrapping e la Cross Validation. Vengono analizzati gli scenari di deployment e le più comuni piattaforme, con esempi applicativi. Vengono proposti i meccanismi per automatizzare l’apprendimento automatico e per supportare l’interpretabilità dei modelli e dei risultati come Partial Dependence Plot, Permuted Feature Importance e altre. Gli esercizi sono descritti con Orange e Python con l’uso della libreria Keras/Tensorflow. Il testo è corredato di materiale di supporto ed è possibile scaricare gli esempi in Orange e i dati di prova.

Data Science : Manuale Italiano - Aspetti metodologici, Acquisizione, Gestione e Pulizia dei Dati


Data Science : Manuale Italiano - Aspetti metodologici, Acquisizione, Gestione e Pulizia dei Dati

Author: Mario A.B Capurso

language: it

Publisher: Mario Capurso

Release Date: 2022-04-19


DOWNLOAD





Questa opera segue il curriculum 2021 della Association for Computing Machinery per specialisti in Scienze dei Dati, con l’obiettivo di costituire un “Bignami” della Scienza ed Ingegneria dei Dati e facilitare il percorso di formazione personale a partire da competenze specialistiche in Informatica o Matematica o Statistica per un lettore di lingua madre italiana. Per motivi legati alla fruibilità in formato elettronico, il testo è stato suddiviso in parti con un numero non esagerato di pagine, mantenendo costante la parte metodologica introduttiva e la bibliografia e con una numerazione dei paragrafi che rimanda al testo complessivo nella sua forma integrata. Primo di una serie di testi, copre gli aspetti metodologici della scienza dei dati, l’acquisiziona, la gestione e pulizia dei dati. Descrive la metodologia CRISP DM, le fasi lavorative, i criteri di successo, i linguaggie gli ambienti utilizzabili, le librerie applicative. Poichè questo testo utilizza Orange per gli aspetti applicativi, ne viene descritta l’installazione ed i widget. Nell’acquisizione vengono descritte le fonti dei dati, le tecniche di accelerazione, i metodi di discretizzazione, gli standard di sicurezza, i tipi e le rappresentazione dei dati, le tecniche per gestire corpus di testi come bag-of-words, word-count, TF-IDF, n-grams, analisi lessicale, analisi sintattica, analisi semantica, filtraggio stop word, stemming, le tecniche per rappresentare ed elaborare le immagini, le tecniche di campionamento, di filtraggio, di web scraping. Vengono analizzate le dimensioni della qualità dei dati, gli algoritmi per l’identificazione dell’entità, della scoperta della verità, la pulizia basata su regole, la gestione dei valori mancanti e ripetuti, la codifica dei valori categoriali , la pulizia dei valori anomali e degli errori, la gestione delle inconsistenze, lo scaling, l’integrazione dei dati da varie fonti e la classifica delle fonti aperte, gli scenari applicativi e l’uso di databases, datawarehouses, data lakes e mediators, la mappatura degli schemi di dati e il ruolo di RDF, OWL e SPARQL, le trasformazioni. Il testo è corredato di materiale di supporto ed è possibile scaricare gli esempi in Orange e i dati di prova.