Indeksy złożone są używane w zagadnieniach społecznych i środowiskowych do reprezentowania złożonych informacji pochodzących z wielu wskaźników w postaci pojedynczego pomiaru, który może mierzyć postęp na drodze do osiągnięcia celu i ułatwiać podejmowanie decyzji. Narzędzie Oblicz Indeks złożony obsługuje trzy główne etapy procesu tworzenia indeksu: standaryzowanie zmiennych wejściowych do wspólnej skali (przetwarzanie wstępne), łączenie zmiennych w pojedynczą zmienną indeksu (łączenie) oraz skalowanie indeksu wynikowego do postaci znaczących wartości (przetwarzanie końcowe).
Projektowanie indeksu
Tworzenie odpowiedniego indeksu zależy od dokładnego rozważenia pytania, na które indeks próbuje odpowiedzieć, wyboru zmiennych i zastosowanych metod. Przydatna jest konsultacja z ekspertami z danej dziedziny oraz użytkownikami końcowymi.
Podczas projektowania indeksu należy wziąć pod uwagę następujące kwestie:
- Czy należy określić strukturę zmiennych w postaci indeksów podrzędnych. Pojęcie mierzone przez indeks może być reprezentowane przez wiele wymiarów. Na przykład indeks podatności ekonomicznej może obejmować domeny mieszkalnictwa, transportu i dochodów, a każda z nich może składać się z wielu zmiennych. Istnieje możliwość utworzenia indeksów podrzędnych reprezentujących poszczególne wymiary przez wielokrotne uruchomienie narzędzia. Może to ułatwić interpretację i w zależności od użytej metody może również zmienić wyniki indeksu.
- Jak wybrać zmienne. Najlepszą praktyką jest zmniejszenie liczby zmiennych wejściowych, przy zachowaniu wystarczającej ich liczby do zarejestrowania istotnych informacji potrzebnych dla indeksu. Duża liczba zmiennych wejściowych może spowodować problemy podczas interpretowania indeksu. Ponadto, jeśli wiele zmiennych odnosi się do tej samej domeny, na przykład mediana dochodu i ubóstwo, domena ta może być nadreprezentowana w wyniku indeksu. Jeśli ten wpływ jest niezamierzony, zjawisko to jest nazywane niezamierzonym ważeniem.
Konfigurowanie wag zmiennych
Zmienne są ważone w celu reprezentowania względnej istotności poszczególnych współczynników składających się na indeks. Domyślnie wszystkie wagi są skonfigurowane na wartość 1, co oznacza, że wagi wszystkich zmiennych są równe. Może być jednak ważne oznaczenie różnic we względnych wkładach zmiennych w porównaniu z innymi. Przez zmianę wagi jednej ze zmiennych na 2 i pozostawienie wagi 1 w przypadku pozostałych można oznaczyć, że dana zmienna powinna być uważana za dwa razy ważniejszą od innych, jeśli chodzi o jej wkład do końcowego indeksu.
Można również użyć wag, które sumują się do wartości 1. Jeśli na przykład używane są trzy zmienne i jedna powinna być uważana za dwa razy ważniejszą od pozostałych dwóch, można użyć wag o wartościach 0,5, 0,25 i 0,25.
W przypadku łączenia zmiennych przez średnią, wagi są stosowane przez pomnożenie każdej zmiennej przez jej wagę. Jeśli wagi są łączone przez średnią geometryczną, wagi są stosowane przez podniesienie wartości każdej zmiennej do potęgi równej jej wadze.
Wagi mają znaczący wpływ na wynikowy indeks. Niezależnie od tego, czy zachowane zostaną równe wagi, czy też zostaną zmienione w celu faworyzowania zmiennych, użycie wag wnosi subiektywizm do analizy. Dodatkowo ważenie może w sposób niezamierzony wynikać z korelacji i różnic wariancji między zmiennymi.
Dowiedz się więcej na temat wpływu korelacji i wariancji na indeks.
Wstępne przetwarzanie zmiennych
Aby utworzyć odpowiedni indeks, zmienne muszą być wyrażone w zgodnej skali. Aby to osiągnąć, można użyć opcji przetwarzania wstępnego dostępnych w narzędziu, które pozwalają na doprowadzenie różnych zmiennych wejściowych do wspólnej skali pomiarowej, co umożliwia ich odpowiednie połączenie. Można również odwrócić zmienne, tak aby znaczenie wysokich wartości poszczególnych zmiennych było zgodne.
Wstępne przetwarzanie zmiennych w celu odwrócenia kierunku
Rozważ znaczenie niskich i wysokich wartości każdej zmiennej oraz upewnij się, że są ze sobą spójne. Na przykład w indeksie podatności społecznej lokalizacje o niższych medianach dochodów wskazują wyższą podatność, ale lokalizacje z niższymi odsetkami osób bez ubezpieczenia wskazują niższą podatność; co oznacza, że kierunki tych zmiennych są przeciwne w kontekście przeznaczenia indeksu.
Odwrócenie zmiennej jest obliczane przez pomnożenie każdej wartości przez -1 i przeskalowanie pola w odniesieniu do pierwotnego zakresu zmiennej.
Wstępne przetwarzanie zmiennych w celu użycia tej samej skali
Narzędzie udostępnia kilka opcji skalowania zmiennych przy użyciu parametru Metoda skalowania i łączenia zmiennych. Opcje Połącz wartości (średnia skalowanych wartości) oraz Różnice złożone (średnia geometryczna skalowanych wartości) służą do skalowania z użyciem wartości minimalnej i maksymalnej. Opcja Połącz rangi (średnia percentyli) umożliwia skalowanie z użyciem percentyli. Opcja Wyróżnij wartości skrajne (liczba powyżej 90. percentyla) umożliwia skalowanie z użyciem wartości binarnych. Wybrana opcja zostanie zastosowana do wszystkich zmiennych, a wynikowe skalowane pola zostaną udostępnione w danych wynikowych. Dostępne są następujące opcje:
Minimum-maksimum — zmienne są skalowane do zakresu od 0 do 1 przy użyciu minimalnej i maksymalnej wartości poszczególnych zmiennych. Ta metoda jest najprostsza, ponieważ zachowuje rozkład zmiennych wejściowych i skaluje je do zakresu od 0 do 1, który jest łatwy do zinterpretowania.
Ta metoda polega na zastosowaniu następującego wzoru:
Ponieważ metoda ta zachowuje rozkład zmiennych, mogą mieć na nią wpływ rozkład skośny oraz elementy odstające. Jeśli na przykład istnieje pojedyncza wartość odstająca o bardzo dużej wartości, otrzyma ona wartość 1, ale pozostałe wartości będą podobne i bliższe zeru. Ze względu na zmniejszenie zmienności wstępnie przetworzonej zmiennej, może ona mieć mniejszy wpływ na indeks.
Ta metoda zależy również od wartości minimalnej i maksymalnej w danych wejściowych, co sprawia, że jest mniej odpowiednia w przypadku porównywania indeksu w wielu przedziałach czasu, gdy wartości minimalna i maksymalna zmiennej mogą zmieniać się w poszczególnych etapach.
Percentyl — zmienne są przekształcane w wartości percentyli z zakresu od 0 do 1. Ta metoda może być przydatna, gdy rangi poszczególnych zmiennych są ważniejsze niż ich rzeczywiste wartości. Jest ona także odporna na elementy odstające i rozkłady skośne, ponieważ zmienne są przekształcane do rozkładu równomiernego.
Istnieją różne definicje percentyli. W tej metodzie używany jest następujący wzór:
,
gdzie R to ranga porządkowa (w przypadkach spornych używana jest minimalna wartość rangi), N to liczba wartości, a P to wynikowy percentyl.
Percentyle oznaczają pozycję wartości względem innych wartości w zmiennej. Na przykład różnica w dochodzie między 50 000 USD a 60 000 USD może nie być znacząca, jednak różnica percentyli może być duża w przypadku wielu obiektów o wartościach leżących między nimi.
Flaga według progu (binarna) — zmienna jest konwertowana na wartości binarne (0, 1), które wskazują, czy dana wartość jest powyżej, czy poniżej określonego progu. Ta metoda jest przydatna, jeśli ważne jest wyróżnienie niektórych wartości, a ich zmienność nie ma znaczenia.
Ta metoda nie jest zakłócana przez wartości odstające w zmiennych wejściowych, ale informacje na poziomie interwału w każdej zmiennej wejściowej są tracone, ponieważ każda zmienna jest przekształcana do postaci binarnej (0, 1).
- Nieprzetworzone — używane są pierwotne wartości zmiennych. Metody tej należy używać tylko wtedy, gdy wszystkie zmienne mają porównywalną skalę. Można jej na przykład używać, gdy wszystkie zmienne są standardowymi jednostkami, takimi jak wartości procentowe lub części na milion. Ta metoda może być także przydatna, jeśli przeprowadzono już standaryzację lub transformację zmiennych.
Łączenie zmiennych
Po wstępnym przetworzeniu zmiennych do wspólnej skali zmienne są agregowane w celu utworzenia pojedynczej wartości. Opcja Połącz wartości skalowane (średnia wartości skalowanych) parametru Metoda skalowania i łączenia zmiennych powoduje agregowanie według wartości średniej. Metoda Połącz wartości skalowane (średnia geometryczna wartości skalowanych) powoduje agregowanie według wartości średniej geometrycznej. Metoda Wyróżnij wartości skrajne (liczba wartości powyżej 90. percentyla) powoduje agregowanie według sumy.
Metody Suma i Średnia są addytywne. Metoda Średnia geometryczna jest multiplikatywna.
Metody addytywne
Kombinacja metod Suma i Średnia jest względnie prosta do zinterpretowania i jest często używana w różnych indeksach. Metody są prawie identyczne; wynikami ich działania są rozkłady o takim samym kształcie, które różnią się tylko skalą, a wynikowa mapa indeksowa wygląda tak samo. Różnią się tylko wartości.
Te metody pozwalają na skompensowanie niskich wartości jednej zmiennej wysokimi wartościami innej zmiennej.
Metody multiplikatywne
Metody multiplikatywne mają tę zaletę, że nie pozwalają na skompensowanie niskich wartości jednej zmiennej wysokimi wartościami innej zmiennej; aby wartość indeksu była wysoka, wiele zmiennych musi mieć wysokie wartości.
Średnia geometryczna jest podobna do mnożenia. Indeks, w którym wykorzystywana jest średnia geometryczna, powoduje utworzenie takiej samej mapy co indeks, w którym do łączenia zmiennych używane jest mnożenie, ponieważ rozkład ma taki sam kształt, a różnią się tylko wartości.
Przetwarzanie końcowe indeksu
Gdy zmienne zostaną wstępnie przetworzone i połączone do postaci indeksu nieprzetworzonego, przetwarzanie końcowe indeksu może sprawić, że będzie on bardziej zrozumiały.
Odwracanie indeksu
Należy rozważyć przeznaczenie indeksu i ocenić, czy wysokie wartości indeksu są zgodne z oczekiwaniami. Odwrócenie indeksu spowoduje, że wysokie wartości w indeksie nieprzetworzonym staną się niskimi wartościami w indeksie końcowym i odwrotnie.
Skalowanie indeksu z użyciem wartości minimalnej i maksymalnej
Użycie wartości minimalnej i maksymalnej do skalowania indeksu zmienia zakres indeksu wynikowego. Ta opcja może być łatwiejsza do interpretacji niezależnie od użytych metod przetwarzania wstępnego i łączenia. Na przykład można określić wartość Minimum jako 0, a wartość Maksimum jako 100, aby przeskalować indeks nieprzetworzony do tego zakresu. W tej opcji używany jest następujący wzór:
gdzie x to wartość pierwotna, min(x) to minimalna wartość znaleziona w indeksie, max(x) to maksymalna wartość znaleziona w indeksie, a to podana wartość minimalna, b to podana wartość maksymalna, a x' to wartość skalowana.
Interpretowanie wyników
Warstwa indeksu wyświetla rozkład wartości indeksu po dowolnym opcjonalnym skalowaniu lub odwróceniu. Warstwa udostępnia ciągły kartogram, którego można użyć do oceny wyników indeksu. Można użyć tej mapy, aby ocenić wysokie i niskie wartości indeksu, zachowując rozkład indeksu i wszystkie elementy odstające.
Warstwa zawiera również następujące pola, które umożliwiają badanie wyników:
- Pole percentyla, które wskazuje względne pozycje (rangi) między wartościami indeksu. To pole umożliwia badanie powiązań między lokalizacjami na podstawie ich rangi, a nie na podstawie rzeczywistych różnic indeksu.
- Pole z indeksem podzielonym na pięć klas o równych interwałach.
- Pole z indeksem podzielonym na pięć klas kwantyli.
- Pole z indeksem podzielonym na sześć klas odchylenia standardowego. To pole umożliwia badanie wartości indeksu w poszczególnych lokalizacjach w odniesieniu do średniej wartości indeksu oraz identyfikowanie lokalizacji o ekstremalnie wysokich i ekstremalnie niskich wartościach indeksu.
Dodatkowe zasoby
Dodatkowe informacje można znaleźć w podręczniku Handbook on Constructing Composite Indicators: Methodology and User Guide Organizacji Współpracy Gospodarczej i Rozwoju.