STATISTICA

VARIABILI STATISTICHE:
TRA CATEGORIE E QUANTITÀ

Le variabili, che costituiscono le caratteristiche del fenomeno oggetto di studio, sono contraddistinte da numerosi aggettivi a seconda delle modalità con cui si manifestano, della scala di misurazione a cui appartengono, dell’ambito scientifico in cui si analizza il fenomeno, ecc. Inoltre, anche il nome della variabile può variare in base all’unità statistica osservata. Ad esempio, potremmo considerare il Reddito familiare, se l’unità statistica corrisponde all’intero nucleo familiare, oppure il Reddito individuale, se riferito al singolo individuo. La diversa natura dell’unità statistica può dunque dare origine a variabili distinte che descrivono la medesima caratteristica ma da prospettive diverse.

Un primo aggettivo associato alle variabili è già stato introdotto nei Disegni di ricerca, quando il ricercatore assegna casualmente differenti condizioni sperimentali alle unità statistiche mediante la variabile manipolabile, o sperimentale. Inoltre, i termini di indipendente e dipendente sono introdotti nell’ambito delle Associazioni tra variabili, dove si vogliono studiare gli effetti di una variabile sull’altra. Per quanto riguarda, invece, le variabili temporali – strettamente legate al fattore tempo come le date – sono approfondite nell’articolo Variabili temporali e date. Infine, per le diverse tipologie di scale con cui rilevare le variabili, si rimanda alle Scale di misura.

La prima fondamentale differenza che analizziamo è quella fra variabile statistica e variabile casuale. Una variabile casuale, o aleatoria, è una variabile teorica i cui valori sono associati a un esperimento probabilistico, quindi non ancora osservati al momento dell’analisi. Al contrario, una variabile statistica, o osservabile, è una variabile i cui valori sono già stati rilevati. Prima della raccolta dati, la variabile casuale rappresenta i risultati possibili, non ancora accaduti, mentre dopo la raccolta si parla di variabile statistica, i cui valori si sono già manifestati. Spesso, dunque, la variabile statistica è l’insieme delle realizzazioni osservabili di una variabile casuale.

Fenomeni, variabili e modalità

Fenomeni reali come oggetti di interesse, variabili come caratteristiche dei fenomeni, modalità come manifestazioni delle variabili

Alcuni testi statistici considerano i termini “fenomeno” e “variabile” sinonimi. Tuttavia, il fenomeno è l’argomento o tema generale oggetto di interesse, che, vista la sua multidimensionalità, include più variabili. Ad esempio, il fenomeno della disoccupazione nei comuni italiani considera variabili come Regione, Numero di abitanti, Numero di lavoratori in età attiva, ecc.

La variabile, o carattere, è la caratteristica o attributo delle unità statistiche che si intende misurare, come l’Età di un paziente o la Cilindrata di una macchina. In una matrice di dati, come nei fogli di Excel, le variabili costituiscono le colonne. Alla variabile si contrappone la costante, che può essere vista come un caso particolare di variabile, detta degenere, poiché non varia passando da un’unità statistica all’altra. Questo concetto si ricollega a quanto discusso sulle Sottopopolazioni, dove le costanti sono intese come condizioni che definiscono gruppi omogenei all’interno della popolazione. Per esempio, nel caso della sottopopolazione italiana maschile, la condizione maschio caratterizza tutti i soggetti osservati.

La modalità è il modo mediante il quale si manifesta una variabile. Spesso le modalità sono stabilite in base alla tipologia di strumento di misura che rileva la variabile e al suo livello di precisione. Inoltre, è fondamentale saper codificare le osservazioni, verificando che, per ciascuna variabile, le modalità siano esaurienti e non sovrapponibili. Nel caso della variabile Stato civile con modalità celibe/nubile, sposato, separato/divorziato, vedovo, l’analisi è incentrata più sulla dimensione matrimoniale che sulle relazioni in generale. Per una più ampia rappresentazione si potrebbero aggiungere le modalità single, in una relazione, convivente (eventualmente rimuovendo celibe/nubile), in modo da cogliere meglio la condizione sentimentale e relazionale degli individui.

L’insieme delle modalità di una variabile quantitativa è talvolta chiamato supporto, sebbene il termine sia più propriamente utilizzato per indicare l’intervallo dei valori che una variabile casuale può assumere.

Variabili qualitative

Variabili statistiche qualitative con modalità categoriali, testuali e simboliche
Una variabile si dice qualitativa, categoriale o mutabile, se le modalità sono testuali, categoriali o simboliche, come per le variabili Film preferito e Genere. Per alcune variabili qualitative non è immediato stabilire quali siano le modalità da considerare. Per esempio, la Professione non è chiaramente definibile poiché dipende dal fenomeno su cui si sta indagando. Fra le modalità si potrebbe utilizzare la macrocategoria medico oppure, più nel dettaglio, le sottocategorie come anestesista, pediatra, o dermatologo. Le variabili qualitative si suddividono in:
  • Dicotomiche, o binarie, se si presentano solamente con due modalità, come per l’Occupazione (occupato, disoccupato) e il Genere, almeno nella sua accezione tradizionale. Se si indicasse la “presenza” di una specifica categoria con 1 e “assenza” con 0, tale ricodifica prenderebbe il nome di variabile dummy, o indicatrice. Le dummy sono variabili numeriche a tutti gli effetti. Si consideri ad esempio la variabile Laureato, dove 1 identifica e 0 no. Allora, nel caso risultasse una media pari a 0.284, equivarrebbe ad affermare che i laureati corrispondono al 28.4% del campione esaminato.
  • Politomiche, se si manifestano con più di due modalità, come il Colore degli occhi o lo Stato civile, a meno che il dato non sia dicotomico del tipo sposato, non sposato. Attenzione all’uso dei numeri come semplici etichette. Ad esempio, se la variabile Regione in uno studio sulla residenza in Italia venisse codificata in 1 (Toscana), 2 (Lazio), ecc., non deve essere confusa con una variabile quantitativa: i numeri hanno solamente il compito di identificare le regioni e dunque non possono essere usati nelle abituali operazioni matematiche. Anche variabili che si presentano numericamente come il CAP o la Matricola universitaria, sono variabili le cui modalità corrispondono a dei semplici codici numerici.

Variabili quantitative

Variabili statistiche quantitative con modalità numeriche
Una variabile è definita quantitativa, numerica o metrica, quando le modalità sono rappresentate da numeri che possono essere utilizzati nelle normali procedure di calcolo. Quest’ultimo aspetto potrebbe sembrare scontato, ma in realtà vuole evidenziare il fatto che una variabile quantitativa è caratterizzata da numeri, mentre i numeri non identificano solamente variabili quantitative come si è visto nel caso della variabile Regione codificata in 1 (Toscana), 2 (Lazio), ecc. Le variabili quantitative si dividono, a loro volta, in:
  • Discrete, se fra due modalità contigue ci sono dei “salti” e nessun valore intermedio, come per il Numero di figli, dove da 0 si passa direttamente a 1, poi 2, ecc. In genere, le variabili discrete assumono valori interi.
  • Continue, se fra due modalità qualunque ci sono un numero infinito di altre modalità. Ad esempio, fra 160 e 161 cm di Altezza ci sono valori come 160.2, 160.5, ecc., quindi le variabili continue ammettono numeri con la virgola.
  • In classi, se si raccolgono le modalità, sia delle variabili discrete che continue, in intervalli numerici. Ad esempio, la variabile Età in un’indagine sui lavoratori potrebbe essere misurata nelle fasce d’età , , e . Nel raggruppare una variabile in classi si perde il dettaglio e quindi informazione. Tale accorpamento ha senso solo se controbilanciato da una presentazione dei dati più compatta e “leggibile” e da analisi statistiche più significative. Le procedure statistiche per creare gli intervalli e per analizzare le variabili quantitative così raggruppate sono approfondite nelle Variabili in classi.

Infine, alcune variabili quantitative sono dette trasferibili se possono essere spostate, parzialmente o totalmente, da un’unità statistica all’altra. Tipici esempi sono il Reddito, che può essere trasferito da un conto all’altro, oppure i Dipendenti aziendali, quando vengono riassegnati da un reparto all’altro.

Variabili discrete e continue

Variabili statistiche quantitative con modalità numeriche discrete o continue

Alla luce di quanto detto possiamo dire che le variabili qualitative sono di natura discrete mancando di “continuità” fra una modalità e l’altra, per quanto queste possano essere numerose. Per quanto riguarda, invece, le variabili quantitative, è opportuno fare una precisazione: la distinzione tra discrete e continue è, in realtà, più matematica che statistica.

Infatti, gli odierni strumenti di misura sono costruiti con un livello di taratura adeguato al contesto. È dunque inutile che una bilancia pesi una persona fino al grammo, così come è impreciso che un salumiere ne utilizzi una che misuri solamente fino agli etti. Inoltre, i limiti degli strumenti di misurazione rendono discrete le variabili che di per sé sono continue. Ad esempio, nel misurare l’Altezza di una persona basterebbe l’approssimazione al millimetro, come 171.8 cm, e il valore successivo sul metro risulterebbe 171.9 cm, “saltando” i valori intermedi come 171.83 cm o 171.88 cm. Quindi, pur essendo concettualmente utile distinguere tra variabili discrete e continue, nello studio dei fenomeni reali la statistica applica le stesse procedure sia per le variabili discrete sia per quelle continue, adattandosi al livello di precisione imposto dagli strumenti di misura.

Facebook
LinkedIn
WhatsApp
X
Telegram
Utilizzo i cookie per analizzare le prestazioni del sito e fornire contenuti personalizzati. Cliccando su “Accetto” acconsenti alla memorizzazione dei cookie. Puoi revocare il tuo consenso in qualsiasi momento. Scopri di più su questo nella mia politica sulla privacy.