A ferramenta Localizar Valor Alto de Incidência determinará se há qualquer agrupamento estatisticamente significativo no modelo espacial dos seus dados.
Diagrama do fluxo de trabalho
Exemplos
O departamento de polícia de uma cidade está conduzindo uma análise para determinar se há uma relação entre crimes violentos e taxas de desemprego. Um programa de trabalho de verão expandido será implementado para escolas secundárias em áreas onde há alto crime violento e alto desemprego. Localizar Valor Alto de Incidência será utilizado para encontrar áreas com valores altos de desemprego e crime estatisticamente significativos.
Um estrategista político deseja saber quais regiões mostraram o apoio mais forte ou mais fraco para um partido político em particular nas últimas eleições. Estas informações podem ser úteis ao guiar estratégias de campanha para eleições futuras. O estrategista subtrai a proporção de votos Democratas da proporção de votos Republicanos e então utiliza Localizar Valor Alto de Incidência para localizar os valores altos e baixos nas diferenças. Os valores altos (vermelho) denotarão o apoio Republicano forte enquanto os valores baixos (azul) denotarão o apoio Democrata forte.
Um oficial da conservação está estudando a doença em árvores para priorizar quais áreas da floresta devem receber o tratamento e aprender mais sobre as áreas que estão mostrando alguma resistência. A ferramenta Localizar Valor Alto de Incidência pode ser utilizada para encontrar grupos de doenças (valores altos) e árvores saudáveis (valores baixos).
Anotações de uso
As feições de entrada podem ser de pontos ou de áreas.
O parâmetro Localizar agrupamentos de altos e baixos é utilizado para avaliar a disposição espacial das suas feições. Se as suas feições forem áreas, um campo deverá ser escolhido. O agrupamento será determinado utilizando os números no campo escolhido. As feições de ponto podem ser analisadas utilizando um campo ou a opção Point Counts. Se Point Counts for utilizado, a ferramenta determinará se os pontos propriamente serão agrupados, ao invés de grupos de valores do campo alto e baixo.
Se os pontos estiverem sendo analisados com Point Counts, duas novas opções estarão disponíveis. O parâmetro Contagem de pontos dentro permite que os pontos sejam agregados dentro de uma Fishnet Grid, Hexagon Grid ou de uma camada de área do seu Conteúdo, como municípios ou ceps. O parâmetro Definir onde os pontos são possíveis é utilizado para criar uma área ou múltiplas áreas de interesse. As três opções para este parâmetro são None, significando que todos os pontos são utilizados, uma área definida por uma camada de área do seu Conteúdo e áreas criadas utilizando a ferramenta Desenhar.
Seus dados podem ser normalizados utilizando o parâmetro Dividir por. Os dados Esri Population utilizam GeoEnriquecimento e exigem o uso de créditos. Outra opção é normalizar utilizando um campo da camada de entrada. Alguns possíveis valores que podem ser utilizados para normalização incluem número de casas ou área.
As Opções podem ser utilizadas para configurar um Tamanho de Célula ou Faixa de Distância específica para sua análise.
A camada de saída terá campos adicionais contendo informações como a significado de estatística de cada feição, o valor-p e a pontuação-z. A camada de saída também contém informações sobre a análise de estatística na seção Descrição dos seus Detalhes do Item.
Como funciona Localizar Valor Alto de Incidência
Até os modelos espaciais aleatórios exibem um grau de agrupamento. Além disso, nossos olhos e cérebro naturalmente tentam encontrar modelos mesmo quando não existe nenhum. Consequentemente, pode ser difícil saber se os modelos em seus dados são o resultado dos processos espaciais reais no trabalho ou apenas o resultado da alteração aleatória. Isto é devido ao fato dos pesquisadores e analistas utilizarem métodos de estatística como Localizar Alto Valor de Incidência (Getis-Ord Gi*) para quantificar modelos espaciais.
A ferramenta calcula a estatística de Getis-Ord Gi* (G-i-star pronunciado) para cada feição em um conjunto de dados. As pontuações Z e valores P resultantes contam a você onde as feições com valores altos ou baixos se agrupam espacilamente. Cada feição é analisada dentro do contexto de feições vizinhas. Uma feição com um valor alto é interessante, mas não pode ser um valor alto estatisticamente significativo. Para ser um valor alto estatisticamente significativo, uma feição terá um valor alto e também será cercada por outras feições com valores altos. A soma local de uma feição e seus vizinhos é comparada proporcionalmente a soma de todas as feições; quando a soma local for muito diferente da soma local esperada e quando esta diferença for muito grande para ser o resultado de chance aleatória, os reultados da pontuação z estatisticamente significativos..
Quando você localiza um agrupamento estatisticamente significativo em seus dados, você tem informações valiosas. Saber onde e quando ocorre um agrupamento pode fornecer pistas importantes sobre os processos promovendo os modelos que você está vendo. Saber que roubos residenciais, por exemplo, são constantemente mais altos em determinados bairros é uma informação vital se você precisar projetar estratégias de prevenção efetivas, alocar recursos de polícia escassos, iniciar programas de cuidados da vizinhança, autorizar investigações criminais detalhadas ou identificar potenciais suspeitos.
Analisar feições de área
Muitos dados estão disponíveis para feições de área, tais como, áreas de censo, municípios, distritos de eleitor, regiões do hospital, lotes, parques e limites de recreação, bacias, classificações da cobertura de superfície e zonas climáticas. Quando sua camada de análise tiver feições de área, você precisará especificar um campo numérico que será utilizado para localizar os agrupamentos de valores altos e baixos. Este campo pode representar o seguinte:
- Contagem (como o número de casas)
- Taxas (como a proporção da população em um nível universitário)
- Médias (como a média ou renda familiar mediana)
- Índices (como uma pontuação indicando se os gastos domésticos em produtos esportivos estão acima ou abaixo da média nacional)
Com o campo que você fornecer, a ferramenta Localizar Valor Alto de Incidência criará um mapa (a camada resultante) mostrando a você as áreas com agrupamentos estatisticamente significativos de valores altos (valores altos: vermelho) e valores baixos (valores baixos: azul).
Analisar feições de ponto
Uma variedade de dados estão disponíveis como feições de ponto. Os exemplos de feições frequentemente representadas como pontos incluem incidentes de crime, escolas, hospitais, eventos de chamada de emergência, acidentes de tráfego, poços de água, árvores e barcos. Alguma vezes você ficará interessado em analisar valores de dados (um campo) associados com cada feição de ponto. Em outros casos, você somente estará interessado em avaliar o agrupamento dos pontos. A decisão para fornecer um campo ou não dependerá da pergunta que você está fazendo.
Localizar agrupamentos de valores altos e baixos associados com feições de ponto
Você desejará fornecer um campo de análise para responder perguntas como: Onde há agrupamento de valores altos e baixos? O campo que você selecionar pode representar algum dos seguintes:
- Contagem (como o número de acidentes de tráfego nas intersecções de ruas)
- Taxas (como desemprego na cidade, onde cada cidade é representada como uma feição de ponto)
- Médias (como a média de pontuação do teste de matemática entre as escolas)
- Índices (como uma pontuação de satisfação do consumidor para revendedores de carros pelo município)
Localizar agrupamentos de contagens altas e baixas de ponto
Para alguns dados de ponto, normalmente quando cada ponto representa um evento, incidente ou indicação de presença/ausência, não haverá um campo de análise óbvio para utilizar. Nestes casos, você apenas quer saber onde o agrupamento é normalmente (estatistiamente significativo) intenso ou escasso. Para esta análise, feições de área (uma malha de fishnet que a ferramenta cria para você ou uma camada de área que você fornece) são posicionadas sobre os pontos e o número de pontos que caem dentro de cada área é contado. A ferramenta então localiza os agrupamentos das contagens altas e baixas do ponto associados com cada feição de área.
Definir onde os pontos são possíveis
Especifique uma camada de área ou desenhe áreas definindo uma área de estudo onde você deseja que a análise seja executada em todos os locais onde as feições de ponto de incidente possam ocorrer. Para esta opção, a ferramenta Localizar Valor Alto de Incidência cobrirá sua área de estudo definida com uma malha de fishnet e contará os pontos que caem dentro de cada quadrícula do fishnet. Quando você não indicar onde os pontos de incidente são possíveis utilizando esta opção, a ferramenta Localizar Valor Alto de Incidência analisará somente as quadrículas do fishnet que contêm pelo menos uma contagem de ponto. Quando você utilizar esta opção para definir onde os pontos são possíveis, entretanto, a análise será feita para todas as quadrículas do fishnet que cairem dentro dos limites das áreas que você definir.
Contar pontos dentro das suas próprias áreas de agregação
Em alguns casos, feições de área, tal como áreas de censo, batidas polícias ou lotes farão mais senso para sua análise que a malha de fishnet padrão.
Escolher para dividir por
Há duas abordagens comuns para identificar lugares com valores altos e baixos:
- Por contagem—Quando você analisa um conjunto de dados em particular, você normalmente deseja encontrar lugares com valores altos e baixos do número de feições em cada área de agregação por sua área de estudo. Por exemplo, você pode desejar encontrar valores altos onde os números mais altos de crimes aconteceram e valores baixos onde os números mais baixos de crimes aconteceram para alocar recursos.
- Por intensidade—Por outro lado, analisar e entender os padrões que levam em conta as distribuições subjacentes que influenciam um fenômeno em particular também pode ser significativo. Este conceito é normalmente conhecido como normalização, ou o processo de dividir um valor de atributo numérico por outro para minimizar diferenças em valores baseado no tamanho de áreas ou no número de feições em cada área. Por exemplo, com crime, você pode desejar entender onde há agrupamentos de números altos e baixos de crimes que levam em conta a população subjacente. Neste caso, você contará o número de crimes em cada área (se esta área for uma área de fishnet ou um conjunto de dados de área diferente) e dividirá este número total de crimes pela população total nesta área. Isto lhe fornecerá uma taxa de criminalidade ou o número de crimes por habitante. Localizar os pontos altos e baixos de criminalidade por habitante responde uma pergunta diferente que também pode ajudar a orientar a tomada de decisão.
Ambos os modos de analisar os dados em sua área de estudo são válidos; só depende da pergunta que você está fazendo.
A escolha de um atributo apropriado para dividir é muito importante. Você precisa ter certeza que o atributo Dividir Por é um atributo que, de fato, influencia a distribuição do fenômeno em particular que você está analisando.
Quando você escolhe para Dividir Por Esri Population, os dados de população da Cobertura Global de Demografias daEsri são utilizados. Certifique-se de olhar para a resolução dos dados disponíveis para a área que você está interessado para garantir que seja compatível com o tamanho das áreas que estão sendo enriquecidas (áreas de agregação que você fornece ou quadrículas de fishnet sendo criadas).
Interpretar os resultados
A saída da ferramenta Localizar Valor Alto de Incidência é um mapa. Para os pontos ou as áreas na camada de mapa resultante, a cor vermelha ou azul mais escura aparece, o mais confiante que você possa estar de que o agrupamento não é o resultado da alteração aleatória. Os pontos ou as áreas exibidas utilizando a cor bege, por outro lado, não são parte de nenhum agrupamento estatisticamente significativo; o modelo espacial associado com estas feições poderá muito provavelmente ser o resultado da alteração aleatória. Algumas vezes os resultados da sua análise indicarão que não há mesmo quaisquer agrupamentos estatisticamente significativos. Estas são informações importantes para ter. Quando um modelo espacial é aleatório, você não tem nenhuma pista sobre causas subjacentes. Nestes casos, todas as feições na camada resultante serão bege. Porém, quando você localiza um agrupamento estatisticamente significativo, os locais onde o agrupamento ocorre são pistas importantes sobre o que pode estar criando o agrupamento. Por exemplo, localizar um agrupamento espacial estatisticamente significativo de câncer associado com determinadas toxinas ambientais, pode levar à políticas e ações projetadas para proteger as pessoas. Semelhantemente, localizar valores baixos de incidência da obesidade infantil associada com as escolas que promovem programas de esporte pode fornecer uma forte justificativa para encorajar estes tipos de programas mais amplamente.
Correção de erros
O método de estatística utilizado pela ferramenta Localizar Valor Alto de Incidência é baseado na teoria de probabilidade e, consequentemente, precisa de um número mínimo de feições para operar de forma eficaz. Este método de estatística também exige uma variedade de valores de contagens ou valores do campo de análise. Se você estiver analisando incidentes de crime por área do censo, por exemplo, e incrivelmente finalizado com exatamente o mesmo número de crimes em cada área, a ferramenta não poderá solucionar. A seguinte tabela fornece uma explicação das mensagens que você pode encontrar ao utilizar a ferramenta Localizar Valor Alto de Incidência:
Mensagem | Problema | Solução |
---|---|---|
As opções de análise que você selecionou exigem um mínimo de 60 pontos para calcular valores altos e baixos de incidência. | Não há feições de ponto suficientes na sua camada de análise de ponto para calcular resultados confiáveis. | A solução óbvia é adicionar mais pontos na sua camada de análise. Alternativamente, você pode tentar definir áreas de análise delimitadas, e assim adicionar informações sobre onde os pontos deveriam ter ocorrido, mas não aconteceu. Com este método você precisará de um mínimo de 30 pontos. Você também pode tentar fornecer áreas de agregação que cobrem seus pontos. Você precisará de um mínimo de 30 áreas de polígono e 30 pontos dentro destas áreas para esta análise. Se você tiver pelo menos 30 pontos talvez queira especificar um campo de análise. Isto muda a pergunta de "onde há muitos ou poucos pontos" para "onde os valores altos e baixos do campo de análise se agrupam espacilamente". |
As opções de análise que você selecionou exigem um mínimo de 30 pontos com dados válidos no campo de análise para calcular os valores altos e baixos de incidência. | Não há pontos suficientes ou pontos suficientes associados com valores do campo de análise diferentes de NULL, na sua camada de análise para calcular resultados confiáveis. | Infelizmente, se você tiver menos que 30 pontos, este método de análise não será apropriado para seus dados. Se você tiver mais de 30 pontos e estiver vendo esta mensagem, o campo de análise que você especificou poderá ter valores NULL. Os pontos com valores do campo de análise NULL serão ignorados. Outra possibilidade é que você tem um Filtro ativo reduzindo o número de pontos disponíveis para análise. |
As opções de análise que você selecionou exigem um mínimo de 30 polígonos com dados válidos no campo de análise para calcular os valores altos e baixos de incidência. | Não há áreas de polígono suficientes ou feições de área suficientes associadas com valores do campo de análise diferentes de NULL, na sua camada de análise para calcular resultados confiáveis. | Infelizmente, se você tiver menos que 30 áreas de polígono, este método de análise não será apropriado para seus dados. Se você tiver mais de 30 pontos e estiver vendo esta mensagem, o campo de análise que você especificou poderá ter valores NULL. As áreas de polígono com valores do campo de análise NULL serão ignoradas. Outra possibilidade é que você tem um Filtro ativo reduzindo o número das áreas de polígono disponíveis para análise. |
A opção de análise que você selecionou exige um mínimo de 30 pontos para estar dentro das áreas de polígono delimitadas. | Somente os pontos que caem dentro das áreas de análise delimitadas que você desenha ou fornece serão analisados. Para fornecer resultados confiáveis, pelo menos 30 pontos devem estar dentro das áreas de análise delimitadas. | Infelizmente, se você não tiver pelo menos 30 pontos, este método não será apropriado para seus dados. Com um mínimo de 30 feições, porém, a solução aqui normalmente será fornecer, áreas de análise delimitadas diferentes, talvez maiores. Outra opção será fornecer uma camada de área com um mínimo de 30 polígonos de agregação que cobrem pelo menos 30 dos seus pontos. Quando você fornece áreas de agregação, a análise é apresentada nas contagens de ponto dentro de cada área. |
A opção de análise que você selecionou exige um mínimo de 30 pontos para estar dentro dos polígonos de agregação. | Somente os pontos que caem dentro dos polígonos de agregação serão incluídos na análise. Para fornecer resultados confiáveis, pelo menos 30 pontos devem estar dentro das áreas de polígono que você fornece. | Infelizmente, se você não tiver pelo menos 30 pontos, este método não será apropriado para seus dados; caso contrário, você deverá desenhar ou fornecer áreas de análise delimitadasque cobrem pelo menos 30 dos seus pontos. As áreas delimitadas devem refletir todos os locais onde os pontos possivelmente possam ocorrer. |
A opção de análise que você selecionou exige um mínimo de 30 áreas de agregação. | A opção que você selecionou cobrirá as áreas de agregação sobre seus pontos e então contará o número de pontos caindo dentro de cada área. Um mínimo de 30 contagens (30 áreas) é necessário para fornecer resultados confiáveis. | Os resultados confiáveis podem ser calculados se você fornecer um mínimo de 30 pontos que caem dentro de um mínimo de 30 áreas de agregação. Se você não tiver 30 áreas de agregação, você poderá tentar desenhar ou fornecer áreas de análise delimitadas que cobrem pelo menos 30 dos seus pontos. Estas áreas delimitadas devem refletir todos os locais onde os pontos possivelmente possam ocorrer. |
Os valores altos e baixos de incidência não podem ser calculados quando o número de pontos em toda a área do polígono é idêntico. Tente áreas de polígono diferentes ou diferentes opções de análise. | Quando a ferramenta Localizar Valor Alto de Incidência contou o número de pontos dentro de cada área de agregação, ela verificou que as contagens foram todas idênticas. Para computar os resultados, esta ferramenta exige pelo menos alguma variação nos valores da contagem obtidos. | Você pode fornecer áreas de agregação alternativas que não resultarão em todas as áreas tendo o exato número de pontos. Ao invés das áreas de agregação, você também pode tentar desenhar ou fornecer áreas de análise delimitadas. Alternativamente, você pode especificar um campo de análise. Porém, isto muda a pergunta de "onde há muitos ou poucos pontos" para "onde os valores altos e baixos do campo de análise se agrupam espacilamente". |
Não há variação suficiente em locais de ponto para calcular valores altos e baixos de incidência. Pontos coincidentes, por exemplo, reduzem a variação espacial. Você pode tentar fornecer uma área delimitada, áreas de agregação (um mínimo de 30) ou um Campo de Análise. | Baseado no número de pontos e como estão distribuídos, a ferramenta cria uma malha de fishnet para cobrir seus pontos. Após contar o número de pontos que caem dentro de cada quadrícula do fishnet e remover quadrículas com contagesn de zero, ficaram menos que 30 quadrículas. Esta ferramenta exige um mínimo de 30 contagens (30 quadrículas) para fornecer resultados confiáveis. | Se os seus pontos ocuparem alguns poucos locais únicos (se tiver muitos pontos coincidentes), uma boa solução é fornecer áreas de agregação que cobrem seus pontos ou desenhar e fornecer áreas de análise delimitadas indicando onde os pontos são ou não possíveis. Outra opção é especificar um campo de análise. Porém, isto muda a pergunta de "onde há muitos ou poucos pontos" para "onde os valores altos e baixos do campo de análise se agrupam espacilamente". |
Não há variação suficiente entre os pontos dentro das áreas de polígono delimitadas. Você pode tentar fornecer limites maiores. | Baseado em locais de ponto e número de pontos, a ferramenta cria uma malha de fishnet para cobrir seus pontos. Após contar o número de pontos que caem dentro de cada quadrícula de fishnet e remover quarículas que estão fora das suas áreas de análise delimitadas, ficaram menos que 30 quadrículas de fishnet. Esta ferramenta exige um mínimo de 30 contagens (30 quadrículas) para fornecer resultados confiáveis. | Se os seus pontos estiverem localizados em uma variedade de locais dentro das áreas de análise delimitadas, você precisará apenas fazer ou fornecer limites maiores. Se os seus pontos ocuparem alguns poucos locais únicos (se tiver muitos pontos coincidentes), uma boa solução é fornecer áreas de agregação que cobrem seus pontos. Outra opção é especificar um campo de análise. Porém, isto muda a pergunta de "onde há muitos ou poucos pontos" para "onde os valores altos e baixos do campo de análise se agrupam espacilamente". |
Todos os valores para seu campo de análise são provavelmente os mesmos. Os valores altos e baixos de incidência não podem ser calculados quando não tiver nenhuma variação no campo sendo analisado. | Mais provável que você tenha especificado um campo de análise com o mesmo valor para todas as suas feições de área ou ponto na camada de análise. A estatística utilizada por esta ferramenta não pode resolver isto a menos que exista uma variedade de valores para trabalhar. | Você pode especificar um campo de análise diferente ou, para feições de ponto, analisar densidades do ponto, ao invés dos valores de ponto. |
Não foi possível calcular valores altos e baixos de incidência para os dados fornecidos. Se apropriado, tente especificar um Campo de Análise. | Enquanto bastante improvável, quando a ferramenta criou uma malha de fishnet e contou o número de pontos dentro de cada quadrícula, as contagens para todas as quadrículas foram idênticas. | A solução seria fornecer suas próprias áreas de agregação, desenhar ou fornecer áreas de análise delimitadas ou especificar um campo de análise. |
O Tamanho da Célula deve ser menor que a Faixa de Distância. | Você forneceu um valor de Faixa de Distância que é menor que o tamanho de cada célula da grade. | Marque as unidades especificadas para ambos Faixa de Distância e Tamanho da Célula, utilize o valor padrão calculado pela ferramenta ou utilize um valor que é maior que o tamanho de uma célula de grade única. |
informações adicionais sobre os algoritmos empregados pela ferramenta Localizar Valor Alto de Incidência podem ser localizados em Como funciona Análise do Valor Alto de Incidência Otimizada.
Ferramentas semelhantes
Utilize Localizar Valor Alto de Incidência para determinar se há qualquer agrupamento estatisticamente significativo no modelo espacial dos seus dados. Outras ferramentas que podem ser úteis são as seguintes:
Ferramentas de análise do visualizador de mapa
Se você estiver interessado em localizar valores atípicos no padrão espacial dos seus dados, utilize a ferramenta Localizar Valores Atípicos.
Se você estiver interessado em criar um mapa de densidade das suas feições de linha ou ponto, utilize a ferramenta Calcular Densidade.
Ferramentas de análise do ArcGIS Desktop
Localizar Valor Alto de Incidência executa a mesma estatística utilizada nas ferramentas Análise do Valor Alto de Incidência (Getis-Ord Gi*) e Análise do Valor Alto de Incidência Otimizada.
Localizar Valor Alto de Incidência também está disponível no ArcGIS Pro. Para executar a ferramenta do ArcGIS Pro, o portal ativo do seu projeto deve estar executando no Portal for ArcGIS 10.5 ou posterior. Você também deve entrar no portal utilizando uma conta com privilégios para executar análise de feição padrão no portal.