Os índices compostos são utilizados em domínios sociais e ambientais para representar informações complexas de múltiplos indicadores como uma métrica única que pode medir o progresso em direcção a um objectivo e facilitar decisões. A ferramenta Calcular Índice Composto oferece suporte às três etapas principais do processo de criação de índice: padronizar variáveis de entrada para uma escala comum (pré-processamento), combinar variáveis em uma única variável de índice (combinação) e dimensionar o índice resultante para valores significativos (pós-processamento).
Projete o índice
A criação de um índice apropriado depende de uma consideração cuidadosa da questão que o índice está tentando responder, da escolha da variável e dos métodos aplicados. Consultar especialistas de domínio e usuários finais é útil.
Considere o seguinte ao projetar o índice:
- Se deve estruturar as variáveis em subíndices. O conceito que o índice está medindo pode ser representado por múltiplas dimensões. Por exemplo, um índice de vulnerabilidade pode ser composto pelos domínios habitação, transporte e rendimento, cada um compreendendo múltiplas variáveis. Você pode construir subíndices para representar cada dimensão executando a ferramenta diversas vezes. Isto pode ajudar na interpretabilidade e, dependendo dos métodos utilizados, também pode alterar os resultados do índice.
- Como selecionar variáveis. Uma prática recomendada é reduzir o número de variáveis de entrada, mantendo o suficiente para capturar as informações essenciais necessárias para o índice. Um grande número de variáveis de entrada pode resultar em dificuldade na interpretação do índice. Além disso, se múltiplas variáveis pertencerem ao mesmo domínio, por exemplo, rendimento mediano e pobreza, a influência deste domínio pode estar sobrerrepresentada no resultado do índice. Se esta influência não for intencional, isto é conhecido como ponderação não intencional.
Definir pesos variáveis
As variáveis são ponderadas para representar a importância relativa de cada fator à medida que contribui para o índice. Por padrão, todos os pesos são definidos como 1, o que significa que cada variável tem peso igual. No entanto, pode ser importante denotar diferenças nas contribuições relativas de uma variável em comparação com as outras. Ao alterar uma das variáveis para peso 2 e manter as demais em 1, você denota que a variável deve ser considerada duas vezes mais importante que as demais em sua contribuição para o índice final.
Você também pode usar pesos que somam 1. Por exemplo, se três variáveis forem usadas e uma for considerada duas vezes mais importante que as outras duas, você poderá usar valores de peso de 0,5, 0,25 e 0,25.
Se as variáveis forem combinadas por média, os pesos serão aplicados multiplicando cada variável pelo seu respectivo peso. Se os pesos forem combinados por média geométrica, os pesos serão aplicados elevando cada variável à potência de seu respectivo peso.
Os pesos têm um impacto significativo no índice resultante. Quer você mantenha pesos iguais ou altere os pesos para favorecer as variáveis, o uso de pesos adiciona subjetividade à análise. Além disso, você pode estar ponderando involuntariamente devido à correlação e às diferenças de variância entre as variáveis.
Saiba mais sobre o impacto da correlação e da variação no índice.
Variáveis de pré-processamento
Para criar um índice apropriado, as variáveis devem estar em uma escala compatível. Para conseguir isso, estão disponíveis opções de pré-processamento na ferramenta que trazem diferentes variáveis de entrada para uma escala de medição comum para que possam ser combinadas adequadamente. Você também pode inverter variáveis para que o significado dos valores altos em cada variável se alinhe entre si.
Pré-processe variáveis para reverter a direção
Considere o significado dos valores baixos e altos em cada variável e certifique-se de que sejam consistentes entre si. Por exemplo, num índice de vulnerabilidade social, os locais com rendimentos medianos mais baixos são mais vulneráveis, mas os locais com baixas percentagens de pessoas sem seguro são menos vulneráveis; a direção dessas variáveis é oposta no contexto da finalidade do índice.
O inverso da variável é calculado multiplicando cada valor por -1 e dimensionando o campo entre o intervalo original da variável.
Pré-processe as variáveis para usar a mesma escala
A ferramenta inclui diversas opções para dimensionar as variáveis usando o parâmetro Método para dimensionar e combinar variáveis. As opções Combinar valores (média dos valores escalonados) e Diferenças compostas (média geométrica de valores escalonados) são dimensionadas usando valores mínimo-máximo. A opção Combinar classificações (média de percentis) é dimensionada usando percentis. A opção Realçar extremos (contagem de valores acima do percentil 90) é dimensionada usando valores binários. A opção selecionada será aplicada a todas as variáveis e os campos escalonados resultantes serão fornecidos na saída. As seguintes opções estão disponíveis:
Mínimo máximo—As variáveis são escalonadas entre 0 e 1 usando os valores mínimo e máximo de cada variável. Este método é o mais simples, pois preserva a distribuição das variáveis de entrada e escala para uma escala de 0 a 1 que é fácil de interpretar.
Este método aplica a seguinte fórmula:
Como este método preserva a distribuição das variáveis, ele pode ser afetado por distribuições distorcidas e valores discrepantes. Por exemplo, se houver dados atípicos únicos com valor muito alto, os dados atípicos receberão o valor 1, mas o restante dos valores será semelhante e mais próximo de zero. Devido à variação reduzida na variável pré-processada, esta variável pode ter menos influência no índice resultante.
Este método também depende dos valores mínimo e máximo nos dados de entrada, tornando-o menos apropriado para comparações de índices em vários períodos de tempo, quando os valores mínimo e máximo de uma variável podem mudar a cada intervalo de tempo.
Percentil—As variáveis são convertidas em percentis entre 0 e 1. Este método pode ser útil quando as classificações de cada variável são mais importantes do que os seus valores reais. Também é robusto para dados atípicos e distribuições distorcidas, pois as variáveis são transformadas em uma distribuição uniforme.
Há várias definições para percentis. Este método usa a seguinte fórmula:
,
onde R é a classificação ordinal (usando o valor mínimo da classificação em caso de empate), N é o número de valores e P é o percentil resultante.
Os percentis denotam a posição de um valor em relação aos outros valores dentro da variável. Por exemplo, embora a diferença de rendimento entre $50.000 e $60.000 possa não ser substancial, a diferença percentual pode ser grande se houver muitas feições com valores intermédios.
Sinalizador por limite (binário)—A variável é convertida em valores binários (0, 1), que indicam se o valor está acima ou abaixo de um limite especificado. Este método é útil quando é importante destacar determinados valores e a variação dos valores não importa.
Este método não é afetado por dados atípicos nas variáveis de entrada, mas as informações de nível de intervalo em cada variável de entrada são perdidas, à medida que cada variável é convertida para um formato binário (0, 1).
- Bruto—Os valores originais das variáveis são usados. Este método somente deve ser utilizado se todas as variáveis estiverem numa escala comparável. Por exemplo, use este método quando todas as variáveis forem uma unidade padrão, como porcentagens ou partes por milhão. Este método também pode ser útil quando a padronização ou transformação de variáveis já ocorreu.
Combinar variáveis
Depois que as variáveis são pré-processadas em uma escala comum, as variáveis são agregadas para criar um único valor. A opção Combinar valores em escala (média dos valores em escala) do parâmetro Método para dimensionar e combinar variáveis agrega por média. O método Valores escalonados compostos (média geométrica de valores escalonados) agrega por média geométrica. Os Extremos de destaque (contagem de valores acima do percentil 90) são agregados por soma.
Soma e Média são métodos aditivos. A média geométrica é um método multiplicativo.
Métodos aditivos
Os métodos de combinação de Soma e Média são relativamente simples de interpretar e são comumente usados por uma variedade de índices. Os métodos são quase idênticos; eles resultam em distribuições com o mesmo formato, que diferem apenas em escala, e o mapa de índice resultante terá a mesma aparência. Apenas os valores diferem.
Esses métodos permitem que valores altos em uma variável compensem valores baixos em outra variável.
Métodos multiplicativos
Os métodos multiplicativos têm a vantagem de não permitirem que valores altos em uma variável compensem valores baixos em outra variável; para que um valor de índice seja alto, múltiplas variáveis devem ter valores altos.
A média geométrica é semelhante à multiplicação. Um índice que usa média geométrica resultará no mesmo mapa que um índice que usa multiplicação para combinar variáveis, pois a distribuição tem o mesmo formato, apenas os valores diferem.
Pós-processamento do índice
Depois que as variáveis são pré-processadas e combinadas no índice bruto, o pós-processamento pode ajudar a tornar o índice mais compreensível.
Inverter o índice
Considere a finalidade do índice e avalie se os valores elevados do índice são os pretendidos. A reversão do índice fará com que valores altos no índice bruto se tornem valores baixos no índice final e vice-versa.
Dimensione o índice usando valores mínimos e máximos
Usar valores mínimo e máximo para dimensionar o índice altera o intervalo do índice de saída. Esta opção pode ser mais fácil de interpretar, independentemente dos métodos de pré-processamento e combinação utilizados. Por exemplo, especifique um valor Mínimo de 0 e um valor Máximo de 100 para dimensionar o índice bruto para esse intervalo. Esta opção usa a seguinte fórmula:
onde x é o valor original, min(x) é o valor mínimo encontrado no índice, max(x) é o valor máximo encontrado no índice, a é o valor mínimo especificado, b é o valor máximo especificado e x' é o valor escalonado.
Interpretar os resultados
A camada de índice exibe a distribuição dos valores do índice após qualquer escalonamento ou reversão opcional. A camada fornece um mapa coroplético contínuo que pode ser usado para avaliar os resultados do índice. Você pode usar o mapa para avaliar valores altos e baixos do índice, preservando a distribuição do índice e quaisquer dados atípicos.
A camada também inclui os seguintes campos que podem ser usados para explorar os resultados:
- Um campo de percentil que indica as posições relativas (classificações) entre os valores do índice. Use este campo para explorar como os locais se relacionam entre si com base em sua classificação, em vez de nas diferenças reais de índice.
- Um campo com o índice classificado em cinco classes de intervalos idênticos.
- Um campo com o índice classificado em cinco classes de quantis.
- Um campo com o índice classificado em seis classes de desvio padrão. Utilize este campo para explorar como o valor do índice em cada local se relaciona com o valor médio do índice e para identificar locais com valores de índice extremamente altos e baixos.
Recursos adicionais
Veja a Organização para Cooperação e Desenvolvimento Econômico Manual sobre Construção de Indicadores Compostos: Metodologia e Guia do Usuário para obter informações adicionais.