Panoramica iniziale
Analisi dati con R
Pulizia dati
Analisi univariata
Analisi bivariata
Analisi multivariata
Modelli predittivi
PULIZIA DATI:
PREPARARE I DATI PER L’ANALISI
La pulizia dei dati è forse lo step più delicato, e sottovalutato anche dai professionisti, per quanto riguarda l’analisi dati. Secondo il Principio del garbage in, garbage out (letteralmente spazzatura che entra, spazzatura che esce), se i dati non sono accuratamente puliti, si rischia di produrre informazioni errate e distorte.
Questo modulo esplora le tecniche per identificare eventuali valori errati, dati mancanti e valori anomali, o outlier, e applicarne le dovute correzioni. Parallelamente, controlleremo ulteriori aspetti, dalle incongruenze nelle risposte degli intervistati ai dati disomogenei che devono essere uniformati per consentire confronti adeguati. Inoltre, la fase di pulizia ha vari punti in comune con l’analisi esplorativa, la quale fornisce una prima idea del fenomeno oggetto di studio. Queste due fasi dell’analisi dati abbracciano inevitabilmente il modulo di analisi univariata, che studia le caratteristiche delle singole variabili, e i moduli di analisi bivariata e analisi multivariata, che approfondiscono le relazioni tra variabili.
In breve, imparerai a preparare opportunamente i dataset, evitando che errori o irregolarità ne compromettano la qualità dei risultati. Apprestati dunque a comprendere meglio la struttura ed il contenuto dei tuoi dati per garantire rigore e affidabilità alle analisi.
Tra i videocorsi proposti, alla pulizia dati è dedicato un intero corso dal titolo Excel – Pulizia e preparazione dei dati. Guarda l’indice degli argomenti ed il video introduttivo gratuito per capire se il corso fa per te.
Home » Analisi Dati » Pulizia dati