Gli istogrammi riepilogano visivamente la distribuzione di una variabile numerica continua misurando la frequenza alla quale certi valori compaiono nel dataset. L'asse x in un istogramma è una linea numerica che è stata divisa in intervalli numerici o contenitori. Per ogni contenitore, una barra è disegnata dove la larghezza della barra rappresenta l'intervallo del contenitore e l'altezza della barra rappresenta il numero dei punti di dati che ricadono in quell'intervallo. Comprendere la distribuzione dei dati è un passo importante nel processo di esplorazione dei dati.
Esempio
L'istogramma qui sotto visualizza la distribuzione dell'affluenza alle urne nelle elezioni del 2016 negli Stati Uniti.
- Numero: Affluenza alle urne
- Sovrapposizioni: medio, distribuzione normale
Dati
Le configurazioni di dati includono la variabile che è usata per creare un istogramma, un numero di contenitori e le statistiche che vengono visualizzate sul grafico.
Variabile
Gli istogrammi richiedono una variabile continua Numero sull'asse x.
Alcuni metodi analitici richiedono che i dati vengano normalmente distribuiti. Quando i dati sono asimmetrici (la distribuzione è sbilenca), è possibile trasformare i dati per renderli normali. È possibile applicare trasformazioni al grafico usando il parametro Con trasformazione. Le trasformazioni possono essere o logaritmiche o radice quadrata.
Suggerimento:
Per il riferimento, è possibile aggiungere un overlay di distribuzione normale all'istogramma selezionando Distribuzione normale sotto Overlay.
Trasformazione logaritmica
La trasformazione logaritmica è spesso usata quando i dati hanno una distribuzione asimmetrica positiva e ci sono pochi valori grandi. Se questi grandi valori si trovano nel vostro set di dati, potete usare la trasformazione log per rendere le varianze più costanti e normalizzare i dati.
Gli esempi sotto mostrano la distribuzione dei voti totali nelle elezioni degli Stati Uniti del 2016. La prima immagine è positivamente derivata e non ha nessuna trasformazione applicata. La seconda immagine ha una trasformazione logaritmica applicata, che da all'istogramma una maggiore distribuzione normale.
Immagine | Trasformazione |
---|---|
Nessuno | |
Logaritmico |
Nota:
Le trasformazioni logaritmiche possono essere applicate solo ai numeri maggiori di zero.
La trasformazione di radice quadrata
Una trasformazione di radice quadrata è simile a una trasformazione logaritmica in quanto riduce l'asimmetria destra di un set di dati. A differenza delle trasformazioni logaritmiche, le trasformazioni di radice quadrata possono essere applicate a zero.
Nota:
Le trasformazioni di radice quadrata possono essere applicate solo ai numeri maggiori o uguali a zero.
Contenitori
Il numero predefinito di contenitori è 32. È possibile regolare questo modificando il valore Contenitori sulla scheda Dati. Modificando il numero dei contenitori consente di vedere più o meno dettagli nella struttura dei dati.
È possibile modificare il colore di contenitori di un istogramma usando il patch di colore accanto a Colore contenitore.
Sovrapposizioni
Le statistiche descrittive seguenti sono calcolate e vengono visualizzate come linee su istogrammi.
- Distribuzione normale: Una curva a campana usata per confrontare i tuoi dati con una distribuzione normale.
- Media: una linea verticale singola indicando il valore medio del dataset.
- Mediano: una linea verticale singola indicando il valore mediano del dataset.
- Deviazione standard: due linee verticali indicando i valori della deviazione standard sopra e sotto la media.
Cliccare l'overlay per attivarlo o disattivarlo. È possibile modificare il colore della linea usando il patch di colore accanto alla statistica.
È possibile attivare le etichette usando il parametro etichette dati. Le etichette indicano il conteggio dei valori per ogni contenitore.
Statistiche
Le statistiche seguenti sono elencate per il campo numerico selezionato:
- Medio
- Strumento
- Deviazione standard
- Righe
- Conteggio
- Minimo
- Massimo
- Somma
- Null
Assi
Le configurazioni degli Assi servono per cambiare le specifiche per l'asse x e l'asse y.
È possibile formattare il modo in cui l'asse y mostra i valori numerici specificando il numero di posizioni decimali e se usare un separatore delle migliaia.
I limiti predefiniti dell'asse y sono basati sulla gamma di valori dei dati rappresentati sull'asse y. È possibile personalizzare questi valori digitando un valore di Limiti massimi. Imposta un limite per l'asse y per mantenere la scala del grafico coerente per il confronto. Cliccare il pulsante Reimposta per riportare l'asse legato al valore di default.
Guide
Linee guida o intervalli possono essere aggiunti ai grafici come riferimento o modo per evidenziare valori significativi. Le guide vengono aggiunte all'asse y cliccando sul pulsante Aggiungi guida.
Per creare una linea guida, inserite un valore di Inizio dove volete che la linea sia disegnata. Per creare un intervallo di guida, inserisci un valore iniziale e un valore finale. Puoi anche cambiare l'aspetto della linea guida o dell'intervallo. Per le linee, lo stile, la larghezza e il colore possono essere aggiornati. Per gli intervalli, il colore di riempimento può essere aggiornato.
Puoi opzionalmente cambiare il nome della guida usando il parametro Nome guida e aggiungere del testo alla tua guida usando il parametro Etichetta guida (per esempio, Mediana).
Puoi scegliere se la guida viene visualizzata sopra il grafico o sotto il grafico usando i pulsanti Sopra e Sotto nel parametro Rendering.
Formato
È possibile configurare l'aspetto del grafico formattando elementi di testo e simboli. Le opzioni di formattazione del grafico includono:
- Elementi di testo: dimensione, colore e stile del font utilizzato per il titolo del grafico, i titoli degli assi x e y, il titolo della legenda, il testo descrizione, il testo legenda, le etichette degli assi e le etichette dei dati. È possibile modificare il formati per più elementi allo stesso tempo premento Ctrl e cliccando per selezionare gli elementi.
- Elementi simbolo: colore, dimensione e stile (Solido, Punto o Trattino) delle linee griglia e asse e colore di sfondo del grafico.
Generale
I titoli predefiniti per i grafici e gli assi sono basati sui nomi delle variabili e sul tipo di grafico. È possibile modificare o disattivare i titoli dalla scheda Generale. Inoltre, è possibile aggiungere un titolo nel parametro Titolo legenda e una descrizione del grafico nel parametro Descrizione. Una descrizione è un blocco di testo che compare in basso nella finestra del grafico.