Le condivisioni file Big Data sono registrate attraverso la pagina dei contenuti del portale. Quando si aggiunge una condivisione file Big Data nel portale, viene creato un elemento Data Store corrispondente. Quando si aggiunge una condivisione file Big Data in archivio cloud, si crea un elemento di condivisione file Big Data, un elemento Data Store di tipo condivisione file Big Data e un elemento Data Store di tipo archivio cloud. Un elemento del portale di condivisione dei file di big data include le seguenti schede:
- Panoramica: fornisce informazioni generali sulla condivisione file Big Data e sugli elementi Data Store correlati. Gli elementi dell'archivio dati correlati possono essere condivisi e cancellati con la vostra condivisione di file di grandi dati.
- Dataset: elenca i dataset e delinea lo scheda dei dati di input. Le informazioni del dataset includono i campi e i formati che rappresentano la geometria e il tempo.
- Output: delinea i modelli di output opzionali, che consentono di scrivere i risultati in una condivisione file Big Data. I modelli di output sono opzionali e vengono creati dopo aver registrato una condivisione di file di big data. Consultare Creare, modificare e visualizzare i modelli di output per informazioni su come creare o modificare un modello di output.
- Impostazioni: descrive lo stato dei contenuti, l'estensione e la protezione di cancellazione.
È possibile visualizzare e modificare i set di dati e lo schema e i modelli di output attraverso la voce di condivisione dei file di big data.
Nota:
Per condividere un elemento Condivisione file di Big Data, è necessario condividere l'elemento principale del data store. Il data store principale per una condivisione di file di big data di tipo Cloud è l'elemento Data Store (Cloud) con lo stesso nome. Per tutti gli altri tipi di condivisione file Big Data (File Share, HDFS e HIVE) il Data Store principale è l'elemento Data Store (condivisione file Big Data) con lo stesso nome.Modifica delle quote di file di big data
Una volta creata una condivisione file Big Data attraverso il portale, è possibile utilizzare la voce di condivisione file Big Data per visualizzare i dataset, modificare la formattazione dei dataset o sincronizzare la condivisione file Big Data per aggiungere ulteriori dataset.
Un file share di big data è composto da uno o più set di dati. Il numero di dataset dipende dal numero di cartelle contenute nella posizione condivisione file Big Data. Puoi visualizzare i set di dati che sono stati registrati con successo nella tua condivisione di file di big data.
Se ti aspettavi di trovare altri set di dati nella tua condivisione di file di big data o ne manca qualcuno, fai come segue:
- Verificare che la cartella di primo livello sia stata registrata. Per ulteriori informazioni, consultare Preparare i dati.
- Confermare che il formato dei propri dati di input sia consentito, ad esempio una raccolta di file deliminati, shapefile, Parquet o Optimized Row Columnar (ORC).
- Accertarsi che lo schema del dataset di input di interesse sia pertinente per una raccolta di file (tutti i file in un solo dataset devono avere gli stessi campi).
È possibile utilizzare il dataset per verificare il numero di dataset in una condivsione file Big Data o revisionare gli schemi dataset per un dataset registrato. Puoi modificare lo schema di un set di dati selezionato aggiornando la sua geometria, la definizione del tempo e i nomi dei campi usando i passi seguenti.
Modificare i dataset di input di condivisione di file Big Data
La modifica dell'elemento di condivisione file Big Data permette di modificare il modo in cui i dati sono registrati e vengono utilizzati per l'analisi. Puoi anche usare l'opzione di modifica per vedere come i tuoi dati sono attualmente registrati. Per ulteriori informazioni su ciascuna opzione in questa finestra di dialogo, vedere Modifica dei parametri in condivisioni di file Big Data. Per modificare i parametri del dataset, attenersi alla procedura seguente:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Dataset.
- Fai clic sul pulsante Modifica accanto al set di dati che vuoi modificare.
- Modifica il set di dati usando le opzioni Campi, Geometria, Tempo e File.
- Al termine della modifica delle proprietà del dataset, fare clic su Salva.
Eliminare i dataset di input di condivisione file Big Data
Eliminare i dataset consente di personalizzare quali dataset sono disponibili nella condivisione file Big Data. L'eliminazione di un dataset non elimina i dati nella posizione di origine. Se in seguito si decide di ripristinare il dataset eliminato nella connessione Big Data, è possibile utilizzare l'opzione sincronizza. Per eliminare dataset dalla condivisione file Big Data, eseguire le seguenti operazioni:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Dataset.
- Selezionare la casella di controllo accanto al dataset da eliminare.
- Fare clic sul pulsante Elimina in cima alla tabella dei dataset per rimuoverlo dalla condivisione file Big Data.
Modificare un file Manifest di condivisione file Big Data o file dei suggerimenti
Nell'opzione Mostra avanzate della scheda Datasets della condivisione di file di big data, puoi visualizzare, scaricare e caricare il file manifest o hints. Se carichi un manifesto, esso sovrascrive qualsiasi modifica che hai fatto ai tuoi set di dati di condivisione di file di big data e sostituisce i set di dati e lo schema esistenti. Per saperne di più sul manifesto di condivisione dei file di big data, vedi Manifesto di condivisione dei file di big data. Per saperne di più sull'uso di un file di suggerimenti, vedi File di suggerimenti. Per modificare un file Manifest di condivisione file Big Data o file dei suggerimenti, attenersi alla seguente procedura:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Datasets.
- Clicca sul pulsante Mostra avanzate per attivarlo.
- Per scaricare il file del manifesto, clicca su Download nella sezione del manifesto.
- Per scaricare il file dei suggerimenti, clicca su Download nella sezione dei suggerimenti.
- Utilizzare un editor di testo per modificare e salvare le modifiche localmente nel file manifest .json o file dei suggerimenti .dat scaricato.
Suggerimento:
Il formato file predefinito per il file dei suggerimenti è .dat. Dopo aver scaricato il file, è possibile cambiare la sua estensione in .txt e modificare il file. - Per caricare un file modificato, nella condivisione dei file di big data, vai alla scheda Dataset e attiva Mostra avanzate.
- Per caricare il manifest, fare clic su Carica nella sezione dei manifest e cercare il file .json aggiornato.
- Per caricare il file dei suggerimenti, fare clic su Carica nella sezione dei suggerimenti e cercare il file .txt aggiornato.
- Fare clic su Carica.
Se carichi un file di suggerimenti, sincronizza la condivisione del file di big data. Quando si effettua la sincronizzazione, solo i dataset con suggerimenti o i nuovi dataset vengono aggiornati, e le modifiche apportate a qualsiasi altro dataset non presente nel file dei suggerimenti rimangono invariate.
Sincronizza la tua condivisione di file di big data
È possibile effettuare la sincronizzazione nella connessione Big Data se si aggiungono nuovi dataset all'origine dati o se si carica un file dei suggerimenti. Il file di suggerimenti fornisce le specifiche che vengono utilizzate quando si rigenera la quota di file di big data.
Nota:
Quando una condivisione di file di big data è sincronizzata, aggiorna solo la condivisione di file di big data per i set di dati esistenti che hanno un file di suggerimenti o nuovi set di dati. Qualsiasi modifica effettuata ai dataset all'interno del file dei suggerimenti viene sovrascritta con le regole definite dal file dei suggerimenti.- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Datasets.
- Clicca sul pulsante Sync per attivarlo.
Creare, modificare e visualizzare i modelli di output
È possibile creare, visualizzare o modificare i modelli di output. Puoi anche modificare gli attributi e le impostazioni per i modelli di output, che delineano il modo in cui i risultati dell'output vengono scritti nella condivisione dei file di big data.
Per creare un modello di output, completate i seguenti passi:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Uscite.
- Clicca sul pulsante Aggiungi modello di output.
- Crea un nome per il modello di output e seleziona il tipo di file su cui il modello di output scriverà.
- Imposta i formati della geometria per questo modello facendo clic sulla scheda Geometria. È possibile impostarli per uno, due o tutti i tipi di geometria. Le opzioni di formattazione sono le stesse delle quote dei file di big data in ingresso.
- Imposta i formati di tempo per questo modello facendo clic sulla scheda Tempo. Si può lasciare il tempo vuoto, impostare per uno dei due tempi: istantaneo o intervallo, o entrambi. Le opzioni di formattazione del tempo sono le stesse dei formati di condivisione dei file di big data in ingresso.
- Clicca su Salva quando hai finito.
Usa gli stessi passi per visualizzare o modificare un modello.
Modifica dei parametri di condivisione file Big Data
L'editor di condivisione di file di grandi dati comprende le seguenti quattro sezioni:
- Campi
- Geometria
- Tempo
- File
Si raccomanda di utilizzare un file di suggerimenti prima di modificare i dati se la generazione del manifesto non ha determinato correttamente i nomi dei campi, la codifica, i delimitatori di campo o i caratteri di citazione di un file delimitato.
Campi
Nella sezione campi sono elencati tutti i campi in un dataset. Quando si seleziona un set di dati, si può vedere quanto segue per ogni campo:
- Il nome del campo
- Il tipo di campo
Puoi modificare il nome del campo e il tipo solo per i file delimitati. Se stai modificando molti nomi di campi, si raccomanda di usare un file di suggerimenti.
Geometria
La sezione geometria elenca il tipo di geometria, come è rappresentata e il riferimento spaziale. Nella seguente tabella vengono descritte le opzioni disponibili, con note per le modifiche che è possibile apportare in base al tipo di dataset di input:
Parametri di geometria
Parametro | Descrizione | File delimitati | Shapefile | File ORC | File parquet |
---|---|---|---|---|---|
Geometria | Il tipo di geometria. Le opzioni sono Punto, Polilinea, Poligono o Nessuna. Se non è presente alcuna geometria (Nessuna), il dataset è una tabella. | Modificabile | Non modificabile | Modificabile | Modificabile |
Riferimento spaziale (WKID/WKT) | Riferimento spaziale del dataset. Questa opzione è mostrata solo se la geometria non è nessuna. | Modificabile. Per impostazione predefinita, viene impostato su 4326, WGS 1984. | Non modificabile | Modificabile | Modificabile |
Tipo di formato della geometria | Modalità di formattazione della geometria per ogni feature. Le opzioni sono XYZ (campi che rappresentano valori x, y e facoltativamente valori z - XYZ è applicabile solo ai punti), WKT (well-known text), WKB (well-known binary), GeoJson, EsriJson e EsriShape. Questa opzione è mostrata solo se la geometria non è pari a nessuna. | Modificabile | Non disponibile; opzione non mostrata | Modificabile | Modificabile |
Campi di geometria | Si usa per specificare quali campi rappresentano le geometrie. In alcuni casi, il campo deve essere un tipo di campo specifico. I formati WKB e EsriShape richiedono un campo binario, mentre GeoJSON e EsriJSON richiedono un campo stringa. I campi XYZ devono essere numerici. Questa opzione è mostrata solo se la geometria non è pari a nessuna. | Modificabile | Non disponibile; opzione non mostrata | Modificabile | Modificabile |
Tempo
La sezione del tempo descrive il modo in cui viene rappresentato il tempo. Nella seguente tabella vengono descritte le opzioni disponibili, con note per modifiche che è possibile apportare in base al tipo di dataset di input. Le opzioni di tempo sono le stesse per tutti i tipi di dati, salvo dove esplicitamente menzionato.
Parametri di tempo
Parametro | Descrizione | Esempio |
---|---|---|
Tipo di tempo: | Tipo di tempo di input. Le opzioni sono Istante (un singolo momento nel tempo), Intervallo (un intervallo di tempo con ora di inizio e fine) e Nessuno. | Istante |
Campi di tempo, campi di tempo iniziale e campi di tempo finale | Se si seleziona Istante, verranno visualizzati i Campi di tempo. Se si seleziona Intervallo, verranno visualizzati i Campi di tempo iniziale e i Campi di tempo finale. Queste opzioni specificano i campi e la formattazione usati per definire il tempo nei vostri dati di input. Il tempo può usare uno o più campi per definire il tempo, nonché uno o più formati per un singolo campo. Per impostazione predefinita, il primo campo con il nome time è utilizzato come campo di tempo, con una stima del formato del tempo. Se è presente uno shapefile, viene utilizzato il primo campo di tipo data. Almeno una riga deve essere popolata per queste tabelle. Consultare Formati temporali per informazioni sulla formattazione. La tabella di formattazione del tempo è disponibile solo se Tipo di tempo non è Nessuno. | Esempio con un singolo campo utilizzato per rappresentare il tempo in due formati differenti:
Esempio con due campi usati per rappresentare il tempo:
|
Fuso orario | Fuso orario del tempo di input. Questa opzione è disponibile solo se Tipo di tempo non è Nessuno. L'impostazione predefinita è UTC. | UTC |
Formati ora
La seguente tabella mostra come rappresentare la formattazione del tempo. Tutti gli esempi mostrano come rappresentare il tempo 9:45:02.05 PM il 2 Gennaio 2016.
Formati di tempo in condivisioni file Big Data
Formato | Significato | Esempio |
---|---|---|
yy | L'anno, rappresentato da due cifre. | 16 |
yyyy | L'anno, rappresentato da quattro cifre. | 2016 |
MM | Il mese, rappresentato numericamente. | 01 o 1 |
MMM | Il mese, rappresentato utilizzando tre lettere. | Jan |
MMMM | Il mese, rappresentato utilizzando l'ortografia completa. | January |
dd | La data. | 02 o 2 |
HH | L'ora, utilizzando un giorno di 24 ore, intervallo di valori da 0 a 23. | 21 |
hh | L’ora, utilizzando un giorno di 12 ore; intervallo di valori da 1 a 12. | 9 |
mm | I minuti, intervallo di valori da 0 a 59. | 45 |
ss | I secondi, intervallo di valori da 0 a 59. | 02 |
SSS | I millisecondi, intervallo di valori da 0 a 999. | 50 |
a | Marcatore AM/PM. | PM |
epoch_millis | Tempo in millisecondi da Epoch. | 1509581781000 |
epoch_seconds | Tempo in secondi da Epoch. | 1509747601 |
Z | Offset del fuso orario espresso in ore. | -0100 o -01:00 |
ZZZ | Offset del fuso orario espresso in ID. | America/Los_Angeles |
'' | Usare le virgolette singole per aggiungere del testo che non rappresenta un valore delineato in questa tabella. | 'T' |
Nella seguente tabella vengono descritti esempi di formati diversi della stessa data: 2 gennaio 2016 alle 21:45:02.05:
Esempi di formato di tempo
Data di input | Formato |
---|---|
01/02/2016 9:45:02PM | MM/gg/aaaa hh:mm:ssa |
Jan02-16 21:45:02 | MMMgg-aa HH:mm:ss |
January 02 2016 9:45:02.050PM | MMMM gg aaaa hh:mm:ss.SSSa |
01/02/2017T9:45:14:05-0000 | MM/gg/aaaa'T'HH:mm:ssZ |
File
La sezione file delinea il formato dei dati. I dati possono essere in uno dei seguenti formati:
- Shapefile (.shp)
- File delimitato (ad esempio, .csv)
- File parquet
- File ORC
I parametri disponibili variano in base al dataset. Per shapefile, file ORC e Parquet, l'unico parametro è il tipo di file, che non è modificabile. Se il dataset di input è un file delimitato, sarà possibile modificare più parametri. Per modificare i valori per un file delimitato, usare un file dei suggerimenti e rigenerare il file Manifest. Questi parametri sono descritti nella seguente tabella:
Formati dataset
Parametro | Descrizione |
---|---|
Estensione file | Elenca l'estensione del tipo di file sul dataset di input. Formati comuni sono .csv e .txt. |
Delimitatore campo | Determina il delimitatore per ogni campo. Formati comuni sono , e ;. |
Terminazione record | Determina la terminazione per ciascuna riga di dati. Formati comuni sono \n e \t. |
Citazione del carattere | Determina il carattere utilizzato per le virgolette. |
Contiene intestazione riga | Un valore booleano che determina se la tabella di input include una riga d'intestazione. Se è inclusa un'intestazione riga, le intestazioni verranno utilizzate per i nomi di campo. L'informazione sul nome di campo prevede i campi geometria e tempo. |
Codifica | Tipo di codifica utilizzata sul file. Per impostazione predefinita è UTF-8. |
Parametri di modifica del modello di output della condivisione file Big Data
L'editor del modello di output di condivisione di file di grandi dati comprende le seguenti tre sezioni:
- Nome e tipo di file
- Formattazione della geometria
- Formattazione dell'orario
Nota:
Le condivisioni di file Big Data di input presentano una sezione campi. I modelli di output non presentano una sezione campi, dal momento che i campi risultanti sono determinati dal GeoAnalytics Tools che crea il risultato. ORC supporta solo nomi di campi composti da lettere dell’alfabeto latino di base e caratteri numerici. Tutti gli altri caratteri nel nome di un campo sono sostituiti da un underscore.
Formati geometria di output
La sezione geometria elenca come vuoi che sia formattata la geometria di uscita per ogni tipo di geometria (punto, linea, poligono). Esistono due parti che determinano la geometria di output:
- Il riferimento spaziale - Puoi lasciarlo vuoto, e usa i risultati dello strumento ( predefinito). Facoltativamente, fornire una stringa WKID o WKT, e tutti i risultati sono proiettati a quel riferimento spaziale. Questo valore è condiviso tra tutte le geometrie di output.
- Il tipo di formattazione della geometria e i campi: questo è descritto più in dettaglio qui sotto.
Formati geometria di output
Tipo Geometria | Campi di output | File delimitati | Shapefile | File ORC | File parquet |
---|---|---|---|---|---|
XYZ: un campo X, Y e opzionalmente Z. Questa opzione è disponibile solo per i punti. | Per impostazione predefinita, vengono creati tre campi nuovi denominati X, Y e Z. In via opzionale, è possibile cambiare tali nomi dei campi. | ||||
WKT | Per impostazione predefinita, viene creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
GeoJSON | Per impostazione predefinita, viene creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
EsriJSON | Per impostazione predefinita, viene creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
WKB | Per impostazione predefinita, viene creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
EsriShape | Per impostazione predefinita, viene creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. |
Formati di tempo di uscita
La sezione del tempo descrive il modo in cui viene rappresentato il tempo di output. La formattazione del tempo richiede le seguenti informazioni:
- Formattazione sia per istanti sia per intervalli.
- I nomi dei campi in cui è scritto il tempo.
- Il formato (Stringa o Data) di scrittura del tempo. I file delimitati possono essere formattati solo con stringa.
- Per gli intervalli, quali campi rappresentano l'ora di inizio e di fine.
La formattazione del tempo è la stessa di quella per i file Big Data di input. Vedere Formati temporali nelle condivisioni di file di big data.
Formato del set di dati in uscita
La sezione del formato dei dataset delinea il formato di output con cui vengono scritti i dati. I dati possono essere in uno dei seguenti formati:
- Shapefile (.shp)
- File delimitato (ad esempio, .csv)
- File parquet
- File ORC
I parametri disponibili variano in base al dataset. Per shapefile, file ORC e Parquet, l'unico parametro è il tipo di file, che non è modificabile. Se il dataset è un file delimitato, sarà possibile modificare più parametri in ArcGIS Server Manager. Questi sono descritti nella seguente tabella:
Formati dataset
Parametro | Descrizione |
---|---|
Estensione file | Le estensioni non vengono mai applicate su un dataset di output. |
Delimitatore campo | Determina il delimitatore per ogni campo. Formati comuni sono , e ;. |
Terminazione record | Non è possibile impostare la terminazione per ciascuna riga di dati. Per Windows, il terminatore è \r\n. Per Linux, è \n. |
Citazione del carattere | Determina il carattere utilizzato per le virgolette. |
Contiene intestazione riga | Un valore booleano che determina se la tabella di output include una riga di intestazione contenente i nomi dei campi. Per impostazione predefinita, è true. |
Codifica | È sempre in UTF-8. |