Una volta definite le Variabili statistiche e le Variabili temporali e date, è giunto il momento di approfondire con quali tipologie di scale si misurano. L’osservazione e la misurazione statistica sono spesso considerate come equivalenti. Per quanto sia d’accordo con tale visione, riconosco che ci sono alcune sfumature che è giusto chiarire. Osservare significa accorgersi di qualcosa, constatare una caratteristica, senza necessariamente assegnarle un valore o una categoria. È un atto preliminare, spesso soggettivo e informale. Misurare, invece, equivale a tradurre una caratteristica osservata in qualcosa di strutturato e registrabile, rendendo operativa una variabile.
Quando si osserva qualcosa nella vita quotidiana la memoria trattiene il ricordo. Ma se si osserva un fenomeno collettivo o scientifico, diventa necessario raccogliere i dati in modo sistematico. Da qui nasce la rilevazione statistica, quel passaggio in cui l’osservazione si concretizza nel dato, secondo regole precise. Se si osserva che Giorgio appare ansioso, si tratta di un’impressione soggettiva. Se invece si utilizza un questionario validato per misurarne il livello di ansia, si rende l’osservazione oggettiva. Inoltre, un dettaglio linguistico rafforza la sovrapponibilità dei due concetti. In statistica, il termine osservazione non indica l’atto di osservare, bensì il dato rilevato su una singola unità. E poiché l’obiettivo è raccogliere dati, osservare implica già l’intenzione di misurare.
Le scale di misura sono gli strumenti di misurazione che caratterizzano ulteriormente le variabili permettendo di eseguire specifiche operazioni matematiche con le loro modalità. Introdotte nel 1946 dallo psicologo americano Stanley Smith Steven (1906 – 1973), le scale di misura si dividono a seconda che la variabile sia categoriale (nominale e ordinale) o numerica (a intervalli e a rapporti).
La scala nominale, o sconnessa, si applica alle variabili qualitative le cui categorie non sono ordinabili, come per il Genere e Colore dei capelli. L’unica operazione possibile è l’identità, ovvero valutare se due unità statistiche presentano la stessa categoria o meno. Ad esempio, per le variabili Sport e Mezzo di trasporto si può determinare se due soggetti appartenenti al campione intervistato praticano lo stesso sport oppure se utilizzano lo stesso mezzo di trasporto.
Per le modalità di un carattere qualitativo non è possibile calcolare le “distanze” tra di esse, sebbene alcune modalità risulteranno più “prossime” di altre. Ad esempio, per la variabile sconnessa Religione, la modalità cattolica risulterà più vicina alla modalità protestante piuttosto che alla modalità musulmana. Questo implica che anche nei caratteri qualitativi nominali vi possono essere dei vincoli nell’ordine di elencazione delle modalità.
La scala ordinale, o per ranghi, si utilizza per le variabili qualitative le cui modalità possono essere ordinate secondo un criterio. Un esempio classico è il Titolo di Studio, dove si può affermare che la laurea costituisce un livello di istruzione superiore rispetto al diploma. La variabile ordinale precedente è, più specificatamente, rettilinea, ovvero in una progressione che non si ripete, a differenza della scala ordinale ciclica, dove le modalità si ripresentano in sequenza. È il caso delle Note musicali, dove al SI segue nuovamente il DO, sebbene con una maggiore frequenza. In realtà, approfondendo le variabili cicliche, si nota come la maggior parte di queste siano legate al tempo, come i Giorni settimanali o le Stagioni. In realtà, quando si parla di scala ordinale si intende implicitamente quella rettilinea.
Analizzando le variabili qualitative, si è visto che se i numeri fungono solo da etichette, la variabile rimane categoriale, come il Numero dell’autobus. Ci sono però alcune eccezioni come le scale Likert, che misurano il grado di accordo o disaccordo, con modalità etichettate solitamente da 1 a 5. In realtà, diversi ricercatori considerano le Likert alla stregua di scale a rapporti, in cui piccoli errori sono compensati da analisi statistiche più facilmente interpretabili. Anche le scale che misurano gli eventi naturali sono di questo tipo, come la nota scala Mercalli per i terremoti o la scala Douglas, che valuta il moto ondoso del mare dal livello 0 (mare calmo come una tavola) al livello 9 (tempestoso con onde alte 14 m). Dunque, possiamo considerarle variabili pseudo-quantitative, poiché le “differenze” fra categorie consecutive – come da forte ad abbastanza e da abbastanza a neutro – si possono ritenere “costanti”.
La scala a intervalli si usa per variabili quantitative di cui si possono calcolare le differenze, ma non i rapporti. Lo zero è relativo, arbitrario e non indica “assenza” della variabile. Ad esempio, per la Temperatura giornaliera (in gradi centigradi) si può dire che fra 38 e 26 °C ci sono 12 gradi di differenza, mentre non si può affermare che una giornata con 42 °C sia “doppiamente calda” rispetto ad una giornata di 21. Infatti, 0 °C è uno zero relativo – la temperatura può scendere “sotto zero” – ed è stato scelto per convenzione come temperatura alla quale l’acqua si solidifica. In realtà, lo zero assoluto non esiste sulla scala Celsius ma esiste su quella Kelvin, dove lo zero assoluto rappresenta la minima temperatura che si può ottenere in natura (-273,15 °C). Quindi è molto importante specificare la scala, termometrica in questo caso, con cui leggiamo i dati.
Inoltre, per il livello delle maree a Venezia si utilizza lo Zero Mareografico di Punta della Salute (ZMPS). In tale scala si possono avere valori sopra o sotto lo zero, che si trova 23 cm sopra lo Zero Mareografico di Genova (ZMG), il riferimento altimetrico ufficiale in Italia. Allo stesso tempo, lo ZMPS si trova sotto al livello medio del mare a Venezia di circa 30-35 cm. Questo perché il livello del mare non è uguale in ogni punto della Terra: le variazioni dipendono da molteplici fattori come la gravità, le fasi lunari, i venti, le correnti, la salinità dell’acqua, i fondali, ecc. Dunque, un’alta marea a Venezia di 120 cm equivale a circa 85-90 cm sopra il livello medio del mare a Venezia e a circa 143-148 cm sopra lo ZMG.
Infine, la scala a rapporti è adottata per le variabili numeriche tra le cui modalità si possono calcolare i rapporti e non solo gli intervalli. Questo accade se la scala presenta uno zero assoluto, non più scelto arbitrariamente, ovvero un’origine al di sotto della quale non si può scendere. Ad esempio, per l’Età ha senso dire che fra 47 e 30 anni ci sono 17 anni di differenza (intervallo). Inoltre, poiché non si possono osservare valori inferiori a 0 anni, si può anche affermare che chi ha 30 anni ha il doppio dell’età di chi ne ha 15 (rapporti). In una scala a rapporti, a differenza di quella a intervalli, lo zero può essere interpretato come “assenza”: avere zero automobili significa non averne.
Le tecniche statistiche applicate alle scale a intervalli e a rapporti sono generalmente le stesse: molti software statistici considerano le due scale equivalenti. La differenza diventa rilevante quando si lavora con proporzioni, trasformazioni logaritmiche o indici relativi, che non possono essere trattati su scala a intervalli. Fra gli indici relativi rientrano anche i rapporti statistici, che esprimono la relazione tra due differenti grandezze, come l’Indice di vecchiaia che rapporta la popolazione con 65 o più anni alla popolazione con meno di 15 anni. Vi sono poi i numeri indice, rapporti adimensionali delle stesse quantità in circostanze diverse, come l’Indice dei prezzi al consumo che rapporta i prezzi di un paniere di beni e servizi in due anni differenti.
Le scale di misura finora presentate sono state introdotte gerarchicamente, ovvero ciascuna scala ha le stesse proprietà delle precedenti ma non di quelle successive. Questo significa che una variabile misurata su scala a rapporti potrebbe essere ricodificata nelle scale precedenti, ma non viceversa. Ad esempio, la Città natale, nominale, non può essere convertita in nessun’altra scala, mentre l’Età, a rapporti, potrebbe essere resa ordinale se le modalità venissero convertite in bambino, adolescente, adulto, anziano. Fa eccezione la variabile dicotomica, che può essere trasformata nella variabile dummy: il Genere passerebbe da nominale a scala a intervalli se assegnassimo 1 a maschio e 0 a femmina. Quindi man mano che la scala “progredisce” si applicano nuove operazioni: nella nominale solamente relazioni di identità o equivalenza, nell’ordinale anche le relazioni d’ordine, nella scala a intervalli si aggiungono le differenze numeriche e in quella a rapporti si applicano anche i rapporti stessi.
Home » Statistica » Le basi » Scale di misura