Gli indici composti vengono utilizzati in domini sociali e ambientali per rappresentare informazioni complesse di più indicatori come singola metrica in grado di misurare l'avanzamento verso un obiettivo e facilitare le decisioni. Lo strumento Calcola indice composto supporta le tre fasi principali del processo di creazione di un indice: standardizzazione delle variabili di input in una scala comune (pre-elaborazione), combinazione delle variabili in una singola variabile di indice (combinazione) e ridimensionamento dell'indice risultante in valori significativi (post-elaborazione).
Disegnare l'indice
La creazione di un indice appropriato dipende dall'attenta considerazione della domanda a cui l'indice deve rispondere, dalla scelta delle variabili e dai metodi applicati. È molto utile consultare esperti dei domini e utenti finali.
Quando si progetta un indice, è opportuno tenere presenti le seguenti considerazioni:
- Se strutturare le variabili in sottoindici. Il concetto misurato dall'indice può essere rappresentato da più dimensioni. Ad esempio, un indice di vulnerabilità potrebbe essere composto dai domini degli alloggi, dei trasporti e del reddito, ciascuno comprendente più variabili. È possibile costruire sottoindici per rappresentare ogni dimensione eseguendo lo strumento più volte. Questa operazione può facilitare l'interpretabilità e, a seconda dei metodi utilizzati, può anche modificare i risultati dell'indice.
- Come selezionare le variabili. Una procedura ottimale consiste nel ridurre le variabili di input mantenendone un numero sufficiente ad acquisire le informazioni essenziali per l'indice. Un elevato numero di variabili di input può causare difficoltà di interpretazione dell'indice. Inoltre, se più variabili appartengono allo stesso dominio, ad esempio reddito mediano e povertà, l'influenza di questo dominio potrebbe essere sovrarappresentata nel risultato dell'indice. Se questa influenza non è voluta, si tratta di una ponderazione non intenzionale.
Impostare i pesi delle variabili
Le variabili sono ponderate per rappresentare l'importanza relativa di ogni fattore che contribuisce all'indice. Per impostazione predefinita, tutti i pesi sono impostati a 1, tutte le variabili hanno lo stesso peso. Tuttavia, può essere importante denotare le differenze nei contributi relativi di una variabile rispetto alle altre. Impostando il peso di una delle variabili a 2 e mantenendo quello delle altre a 1, si indica che la variabile deve essere considerata come due volte più importante delle altre relativamente al contributo apportato all'indice.
È anche possibile utilizzare pesi la cui somma corrisponde a 1. Ad esempio, se vengono utilizzate tre variabili e una deve essere considerata come due volte più importante delle altre due, è possibile utilizzare i valori di peso 0,5, 0,25 e 0,25.
Se le variabili vengono combinate tramite media, i pesi vengono applicati moltiplicando ogni variabile per il suo peso. Se i pesi vengono combinati tramite media geometrica, i pesi vengono applicati elevando ogni variabile alla potenza del suo peso.
I pesi hanno un impatto significativo sull'indice risultante. Che si mantengano pesi uguali o si modifichino i pesi a favore di alcune variabili, l'uso dei pesi aggiunge soggettività all'analisi. È possibile, inoltre, ponderare involontariamente a causa della correlazione e delle differenze nella varianza tra le variabili.
Ulteriori informazioni sull'impatto della correlazione e della varianza sull'indice.
Pre-elaborazione delle variabili
Per creare un indice appropriato, le variabili devono trovarsi in una scala compatibile. A tale scopo, lo strumento offre opzioni di pre-elaborazione che consentono di portare diverse variabili di input in una scala di misurazione comune in modo da poter essere correttamente combinate. È anche possibile invertire le variabili in modo che il significato dei valori alti in ogni variabile si allinei con quello dell'altra.
Pre-elaborare le variabili nella direzione inversa
Considerare il significato dei valori alti e bassi in ogni variabile e accertarsi che siano coerenti. Ad esempio, in un indice di vulnerabilità sociale, le posizioni con redditi mediani sono più vulnerabili, ma le posizioni con percentuali basse di persone senza assicurazione sono meno vulnerabili. Le direzioni di queste variabili sono opposte nel contesto dello scopo dell'indice.
L'inverso della variabile viene calcolato moltiplicando ogni valore per -1 e ridimensionando il campo tra l'intervallo originale della variabile.
Pre-elaborare le variabili per utilizzare una scala comune
Lo strumento include più opzioni per ridimensionare le variabili tramite il parametro Metodo per ridimensionare e combinare le variabili. Le opzioni Combina valori (media dei valori ridimensionati) e Componi differenze (media geometrica dei valori ridimensionati) eseguono il ridimensionamento utilizzando i valori minimo-massimo. Con l'opzione Combina ranghi (media dei percentili) il ridimensionamento viene eseguito tramite i percentili. Con l'opzione Evidenzia estremi (conteggio dei valori al di sopra del 90° percentile) il ridimensionamento avviene tramite valori binari. L'opzione selezionata sarà applicata a tutte le variabili e i campi ridimensionati risultanti saranno forniti nell'output. Sono disponibili le seguenti opzioni:
Minimo-massimo- Le variabili vengono ridimensionate tra 0 e 1 utilizzando i valori minimo e massimo di ogni variabile. Questo metodo è il più semplice perché conserva la distribuzione delle variabili di input e ridimensiona su una scala da 0 a 1 facile da interpretare.
Questo metodo applica la seguente formula:
Poiché questo metodo conserva la distribuzione delle variabili, può essere influenzato da distribuzioni distorte e anomalie. Ad esempio, se esiste una singola anomalia con un valore molto alto, l'anomala riceverà il valore 1 ma i valori restanti saranno simili e più vicini a zero. A causa della variazione ridotta nella variabile pre-elaborata, questa variabile potrebbe avere meno influenza sull'indice risultante.
Questo metodo dipende anche dai valori minimo e massimo nei dati di input, per cui è meno appropriato per i confronti d'indice tra più periodi di tempo, quando i valori minimo e massimo di una variabile possono cambiare con ogni fascia temporale.
Percentile - Le variabili vengono convertite in percentili tra 0 e 1. Questo metodo può essere utile quando i ranghi di ogni variabile sono più importanti dei loro valori effettivi. È anche efficace per anomalie e distribuzioni distorte perché le variabili vengono trasformate in una distribuzione uniforme.
Esistono diverse definizioni dei percentili. Questo metodo utilizza la seguente formula:
,
dove R è il rango ordinale (utilizzando il valore di rango minimo in caso di pareggio), N è il numero di valori e P è il percentile risultante.
I percentili denotano la posizione di un valore rispetto ad altri valori nella variabile. Ad esempio, mentre la differenza di reddito tra $50,000 e $60,000 può non essere sostanziale, la differenza di percentile può essere notevole se esistono molte feature con valori intermedi.
Contrassegna per soglia (binario) - La variabile viene convertita in valori binari (0,1), che indicano se il valore è superiore o inferiore a una determinata soglia. Questo metodo è utile quando è importante evidenziare alcuni valori e la variazione dei valori non è importante.
Questo metodo non è influenzato da anomalie nelle variabili di input, ma le informazioni a livello di intervallo in ogni variabile di input vengono perse perché ogni variabile viene convertita in una forma binaria (0,1).
- Grezzo - Vengono utilizzati i valori originali delle variabili. Questo metodo deve essere utilizzato solo se tutte le variabili si trovano su una scala comparabile. Ad esempio, utilizzare questo metodo quando tutte le variabili sono un'unità standard come percentuali o parti per milione. Questo metodo può essere utile anche quando la standardizzazione o la trasformazione delle variabili è giù avvenuta.
Combinare le variabili
Dopo essere state pre-elaborate in una scala comune, le variabili vengono aggregate in un singolo valore. L'opzione Combina valori ridimensionati (media dei valori ridimensionati) del parametro Metodo per ridimensionare e combinare le variabili aggrega per media. Il metodo Componi valori ridimensionati (media geometrica dei valori ridimensionati) aggrega per media geometrica. L'opzione Evidenzia estremi (conteggio dei valori al di sopra del 90° percentile) aggrega per somma.
Somma e Media sono metodi additivi. Media geometrica è un metodo moltiplicativo.
Metodi additivi
I metodi di combinazione Somma e Media sono relativamente semplici da interpretare e vengono utilizzati da svariati indici. I metodi sono quasi identici, determinano distribuzioni con la stessa forma che differiscono solo nella scala e la mappa di indice risultante apparirà uguale. Solo i valori differiscono.
Questi metodi consentono ai valori alti di una variabile di compensare i valori bassi in un'altra variabile.
Metodi moltiplicativi
I metodi moltiplicativi hanno il vantaggio di non consentire ai valori alti in una variabile di compensare i valori bassi in un'altra variabile. Perché un valore di indice sia alto, più variabili devono avere valori alti.
Le media geometrica è simile alla moltiplicazione. Un indice che utilizza la media geometrica determina la stessa mappa di un indice che utilizza la moltiplicazione per combinare le variabili perché la distribuzione ha la stessa forma, solo i valori differiscono.
Post-elaborare l'indice
Una volta che le variabili sono state pre-elaborate e combinate nell'indice grezzo, la post-elaborazione può rendere l'indice più comprensibile.
Invertire l'indice
Considerare lo scopo dell'indice e valutare se i valori di indice alti sono quelli previsti. L'inversione dell'indice trasformerà i valori alti nell'indice grezzo in valori bassi nell'indice finale e viceversa.
Ridimensionare l'indice utilizzando i valori minimo e massimo
L'uso dei valori minimo e massimo per ridimensionare l'indice cambia l'intervallo dell'indice di output. Questa opzione può essere più facile da interpretare, a prescindere dai metodi di pre-elaborazione e combinazione utilizzati. Ad esempio, specificare un valore Minimo pari a 0 e un valore Massimo pari a 100 per ridimensionare l'indice grezzo su questo intervallo. Questa opzione utilizza la seguente formula:
dove x è il valore originale, min(x) è il valore minimo trovato nell'indice, max(x) è il valore massimo trovato nell'indice, a è il valore minimo specificato, b è il valore massimo specificato e x' è il valore ridimensionato.
Interpretare i risultati
Il layer indice visualizza la distribuzione dei valori di indice dopo l'eventuale ridimensionamento o inversione opzionale. Il layer fornisce una mappa coropletica continua utilizzabile per valutare i risultati dell'indice. È possibile utilizzare la mappa per valutare i valori di indice alti e bassi mantenendo la distribuzione dell'indice ed eventuali anomalie.
Il layer include anche i seguenti campi, che possono essere utilizzati per esplorare i risultati:
- Un campo percentile che indica le posizioni relative (ranghi) tra i valori di indice. Utilizzare questo campo per esplorare il modo in cui le posizioni si relazionano tra loro in base al loro rango, anziché alle loro differenze di indice.
- Un campo con l'indice classificato in cinque classi intervallo equivalenti.
- Un campo con l'indice classificato in cinque classi quantile.
- Un campo con l'indice classificato in sei classi di deviazione standard. Utilizzare questo campo per esplorare il modo in cui il valore di indice in ciascuna posizione si relaziona con il valore indice medio e per identificare le posizioni con valori indice estremamente elevati o bassi.
Risorse aggiuntive
Per ulteriori informazioni, vedere Organisation for Economic Co-operation and Development Handbook on Constructing Composite Indicators: Methodology and User Guide.