Le variabili, che costituiscono le caratteristiche del fenomeno oggetto di studio, sono contraddistinte da numerosi aggettivi a seconda delle modalità con cui si manifestano, della scala di misurazione a cui appartengono, dell’ambito scientifico in cui si analizza il fenomeno, ecc. Inoltre, anche il nome della variabile può variare in base all’unità statistica osservata. Ad esempio, potremmo considerare il Reddito familiare, se l’unità statistica corrisponde all’intero nucleo familiare, oppure il Reddito individuale, se riferito al singolo individuo. La diversa natura dell’unità statistica può dunque dare origine a variabili distinte che descrivono la medesima caratteristica ma da prospettive diverse.
Un primo aggettivo associato alle variabili è già stato introdotto nei Disegni di ricerca, quando il ricercatore assegna casualmente differenti condizioni sperimentali alle unità statistiche mediante la variabile manipolabile, o sperimentale. Inoltre, i termini di indipendente e dipendente sono introdotti nell’ambito delle Associazioni tra variabili, dove si vogliono studiare gli effetti di una variabile sull’altra. Per quanto riguarda, invece, le variabili temporali – strettamente legate al fattore tempo come le date – sono approfondite nell’articolo Variabili temporali e date. Infine, per le diverse tipologie di scale con cui rilevare le variabili, si rimanda alle Scale di misura.
La prima fondamentale differenza che analizziamo è quella fra variabile statistica e variabile casuale. Una variabile casuale, o aleatoria, è una variabile teorica i cui valori sono associati a un esperimento probabilistico, quindi non ancora osservati al momento dell’analisi. Al contrario, una variabile statistica, o osservabile, è una variabile i cui valori sono già stati rilevati. Prima della raccolta dati, la variabile casuale rappresenta i risultati possibili, non ancora accaduti, mentre dopo la raccolta si parla di variabile statistica, i cui valori si sono già manifestati. Spesso, dunque, la variabile statistica è l’insieme delle realizzazioni osservabili di una variabile casuale.
Alcuni testi statistici considerano i termini “fenomeno” e “variabile” sinonimi. Tuttavia, il fenomeno è l’argomento o tema generale oggetto di interesse, che, vista la sua multidimensionalità, include più variabili. Ad esempio, il fenomeno della disoccupazione nei comuni italiani considera variabili come Regione, Numero di abitanti, Numero di lavoratori in età attiva, ecc.
La variabile, o carattere, è la caratteristica o attributo delle unità statistiche che si intende misurare, come l’Età di un paziente o la Cilindrata di una macchina. In una matrice di dati, come nei fogli di Excel, le variabili costituiscono le colonne. Alla variabile si contrappone la costante, che può essere vista come un caso particolare di variabile, detta degenere, poiché non varia passando da un’unità statistica all’altra. Questo concetto si ricollega a quanto discusso sulle Sottopopolazioni, dove le costanti sono intese come condizioni che definiscono gruppi omogenei all’interno della popolazione. Per esempio, nel caso della sottopopolazione italiana maschile, la condizione maschio caratterizza tutti i soggetti osservati.
La modalità è il modo mediante il quale si manifesta una variabile. Spesso le modalità sono stabilite in base alla tipologia di strumento di misura che rileva la variabile e al suo livello di precisione. Inoltre, è fondamentale saper codificare le osservazioni, verificando che, per ciascuna variabile, le modalità siano esaurienti e non sovrapponibili. Nel caso della variabile Stato civile con modalità celibe/nubile, sposato, separato/divorziato, vedovo, l’analisi è incentrata più sulla dimensione matrimoniale che sulle relazioni in generale. Per una più ampia rappresentazione si potrebbero aggiungere le modalità single, in una relazione, convivente (eventualmente rimuovendo celibe/nubile), in modo da cogliere meglio la condizione sentimentale e relazionale degli individui.
L’insieme delle modalità di una variabile quantitativa è talvolta chiamato supporto, sebbene il termine sia più propriamente utilizzato per indicare l’intervallo dei valori che una variabile casuale può assumere.
Alla luce di quanto detto possiamo dire che le variabili qualitative sono di natura discrete mancando di “continuità” fra una modalità e l’altra, per quanto queste possano essere numerose. Per quanto riguarda, invece, le variabili quantitative, è opportuno fare una precisazione: la distinzione tra discrete e continue è, in realtà, più matematica che statistica.
Infatti, gli odierni strumenti di misura sono costruiti con un livello di taratura adeguato al contesto. È dunque inutile che una bilancia pesi una persona fino al grammo, così come è impreciso che un salumiere ne utilizzi una che misuri solamente fino agli etti. Inoltre, i limiti degli strumenti di misurazione rendono discrete le variabili che di per sé sono continue. Ad esempio, nel misurare l’Altezza di una persona basterebbe l’approssimazione al millimetro, come 171.8 cm, e il valore successivo sul metro risulterebbe 171.9 cm, “saltando” i valori intermedi come 171.83 cm o 171.88 cm. Quindi, pur essendo concettualmente utile distinguere tra variabili discrete e continue, nello studio dei fenomeni reali la statistica applica le stesse procedure sia per le variabili discrete sia per quelle continue, adattandosi al livello di precisione imposto dagli strumenti di misura.
Home » Statistica » Le basi » Variabili statistiche