Le condivisioni di file di big data sono registrate attraverso la pagina dei contenuti del tuo portale. Quando si aggiunge una condivisione di file di big data nel portale, si crea anche un elemento del negozio di dati correlato. Quando si aggiunge una condivisione di file di dati grandi, si crea un elemento di condivisione di file di dati grandi, un elemento di archiviazione dati di tipo condivisione di file di dati grandi e un elemento di archiviazione dati di tipo cloud store. Un elemento del portale di condivisione dei file di big data include le seguenti schede:
- Panoramica: fornisce informazioni generali sulla tua condivisione di file di big data e sugli elementi dell'archivio dati correlati. Gli elementi dell'archivio dati correlati possono essere condivisi e cancellati con la vostra condivisione di file di grandi dati.
- Set di dati: elenca i set di dati e delinea lo schema dei dati di input. Le informazioni del dataset includono i campi e i formati che rappresentano la geometria e il tempo.
- Outputs: delinea i modelli di output opzionali, che ti permettono di scrivere i risultati su una condivisione di file di big data. I modelli di output sono opzionali e vengono creati dopo aver registrato una condivisione di file di big data. Vedere Creare, modificare e visualizzare i modelli di output per imparare a creare o modificare un modello di output.
- Impostazioni: descrive lo stato del contenuto, l'estensione e la protezione di cancellazione.
È possibile visualizzare e modificare i set di dati e lo schema e i modelli di output attraverso la voce di condivisione dei file di big data.
Nota:
Per condividere un elemento Condivisione file di Big Data, è necessario condividere l'elemento principale del data store. Il data store principale per una condivisione di file di big data di tipo Cloud è l'elemento Data Store (Cloud) con lo stesso nome. Per tutti gli altri tipi di condivisioni di file di big data (File Share, HDFS e HIVE) il data store principale è l'elemento Data Store (Condivisione file di Big Data) con lo stesso nome.Modifica delle quote di file di big data
Una volta creata una condivisione di file di big data attraverso il portale, è possibile utilizzare la voce di condivisione di file di big data per visualizzare i set di dati, modificare la formattazione dei set di dati o sincronizzare la condivisione di file di big data per aggiungere ulteriori set di dati.
Un file share di big data è composto da uno o più set di dati. Il numero di dataset dipende dal numero di cartelle contenute nella posizione condivisione file Big Data. Puoi visualizzare i set di dati che sono stati registrati con successo nella tua condivisione di file di big data.
Se ti aspettavi di trovare altri set di dati nella tua condivisione di file di big data o ne manca qualcuno, fai come segue:
- Verificare che la cartella di primo livello sia stata registrata. Per ulteriori informazioni, consultare Preparare i dati.
- Verificare che il formato dei dati di input sia consentito, ad esempio una raccolta di file delimitati, shapefile, parquet o ORC.
- Accertarsi che lo schema del dataset di input di interesse sia pertinente per una raccolta di file (tutti i file in un solo dataset devono avere gli stessi campi).
Puoi usare il set di dati per verificare il numero di set di dati all'interno di una condivisione di file di grandi dati o rivedere gli schemi dei set di dati per un set di dati registrato. Puoi modificare lo schema di un set di dati selezionato aggiornando la sua geometria, la definizione del tempo e i nomi dei campi usando i passi seguenti.
Modificare i dataset di input di condivisione di file Big Data
La modifica dell'elemento di condivisione dei file di big data ti permette di modificare il modo in cui i tuoi dati sono registrati e vengono utilizzati per l'analisi. Puoi anche usare l'opzione di modifica per vedere come i tuoi dati sono attualmente registrati. Per ulteriori informazioni su ciascuna opzione in questa finestra di dialogo, vedere Modifica dei parametri in condivisioni di file Big Data. Per modificare i parametri del dataset, attenersi alla procedura seguente:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Dataset.
- Fai clic sul pulsante Modifica accanto al set di dati che vuoi modificare.
- Modifica il set di dati usando le opzioni Campi, Geometria, Tempo e File.
- Al termine della modifica delle proprietà del dataset, fare clic su Salva.
Modificare un file Manifest di condivisione file Big Data o file dei suggerimenti
Nell'opzione Mostra avanzate della scheda Datasets della condivisione di file di big data, puoi visualizzare, scaricare e caricare il file manifest o hints. Se carichi un manifesto, esso sovrascrive qualsiasi modifica che hai fatto ai tuoi set di dati di condivisione di file di big data e sostituisce i set di dati e lo schema esistenti. Per saperne di più sul manifesto di condivisione dei file di big data, vedi Manifesto di condivisione dei file di big data. Per saperne di più sull'uso di un file di suggerimenti, vedi File di suggerimenti. Per modificare un file Manifest di condivisione file Big Data o file dei suggerimenti, attenersi alla seguente procedura:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Datasets.
- Clicca sul pulsante Mostra avanzate per attivarlo.
- Per scaricare il file del manifesto, clicca su Download nella sezione del manifesto.
- Per scaricare il file dei suggerimenti, clicca su Download nella sezione dei suggerimenti.
- Utilizzare un editor di testo per modificare e salvare le modifiche localmente nel file Manifest .json o file dei suggerimenti .dat scaricato.
Suggerimento:
Il formato file predefinito per il file dei suggerimenti è .dat. Dopo aver scaricato il file, è possibile cambiare la sua estensione in .txt e modificare il file. - Per caricare un file modificato, nella condivisione dei file di big data, vai alla scheda Dataset e attiva Mostra avanzate.
- Per caricare il manifesto, fare clic su Carica sotto manifesto e sfogliare il file .json aggiornato.
- Per caricare il file dei suggerimenti, clicca su Carica sotto i suggerimenti e cerca il file .txt aggiornato.
- Fare clic su Carica.
Se carichi un file di suggerimenti, sincronizza la condivisione del file di big data. Quando si sincronizza, solo i set di dati con suggerimenti o i nuovi set di dati vengono aggiornati, e le modifiche apportate a qualsiasi altro set di dati non presente nel file di suggerimenti rimangono invariate.
Sincronizza la tua condivisione di file di big data
Puoi sincronizzare la tua connessione big data se aggiungi nuovi set di dati alla tua fonte di dati o se hai caricato un file di suggerimenti. Il file di suggerimenti fornisce le specifiche che vengono utilizzate quando si rigenera la quota di file di big data.
Nota:
Quando una condivisione di file di big data è sincronizzata, aggiorna solo la condivisione di file di big data per i set di dati esistenti che hanno un file di suggerimenti o nuovi set di dati. Qualsiasi modifica apportata ai set di dati che si trovano nel file dei suggerimenti viene sovrascritta con le regole definite nel file dei suggerimenti.- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Datasets.
- Clicca sul pulsante Sync per attivarlo.
Creare, modificare e visualizzare i modelli di output
È possibile creare, visualizzare o modificare i modelli di output. Puoi anche modificare gli attributi e le impostazioni per i modelli di output, che delineano il modo in cui i risultati dell'output vengono scritti nella condivisione dei file di big data.
Per creare un modello di output, completate i seguenti passi:
- Apri la voce Condivisione file di Big Data nei contenuti del tuo portale.
- Clicca sulla scheda Uscite.
- Clicca sul pulsante Aggiungi modello di output.
- Crea un nome per il modello di output e seleziona il tipo di file su cui il modello di output scriverà.
- Imposta i formati della geometria per questo modello facendo clic sulla scheda Geometria. È possibile impostarli per uno, due o tutti i tipi di geometria. Le opzioni di formattazione sono le stesse delle quote dei file di big data in ingresso.
- Imposta i formati di tempo per questo modello facendo clic sulla scheda Tempo. Si può lasciare il tempo vuoto, impostare per uno dei due tempi: istantaneo o intervallo, o entrambi. Le opzioni di formattazione del tempo sono le stesse dei formati di condivisione dei file di big data in ingresso.
- Clicca su Salva quando hai finito.
Usa gli stessi passi per visualizzare o modificare un modello.
Modifica dei parametri di condivisione file Big Data
L'editor di condivisione di file di grandi dati comprende le seguenti quattro sezioni:
- Campi
- Geometria
- Ora
- File
Si raccomanda di utilizzare un file di suggerimenti prima di modificare i dati se la generazione del manifesto non ha determinato correttamente i nomi dei campi, la codifica, i delimitatori di campo o i caratteri di citazione di un file delimitato.
Campi
Nella sezione campi sono elencati tutti i campi in un dataset. Quando si seleziona un set di dati, si può vedere quanto segue per ogni campo:
- Il nome del campo
- Il tipo di campo
Puoi modificare il nome del campo e il tipo solo per i file delimitati. Se stai modificando molti nomi di campi, si raccomanda di usare un file di suggerimenti.
Geometria
La sezione geometria elenca il tipo di geometria, come è rappresentata e il riferimento spaziale. Nella seguente tabella vengono descritte le opzioni disponibili, con note per le modifiche che è possibile apportare in base al tipo di dataset di input:
Parametri di geometria
Parametro | Descrizione | File delimitati | Shapefile | File ORC | File parquet |
---|---|---|---|---|---|
Geometria | Il tipo di geometria. Le opzioni sono Punto, Polilinea, Poligono o Nessuna. Se non c'è geometria (Nessuna), il set di dati è una tabella. | Modificabile | Non modificabile | Modificabile | Modificabile |
Riferimento spaziale (WKID/WKT) | Riferimento spaziale del dataset. Questa opzione è mostrata solo se la geometria non è nessuna. | Modificabile. Per impostazione predefinita, viene impostato su 4326, WGS 1984. | Non modificabile | Modificabile | Modificabile |
Tipo di formato della geometria | Modalità di formattazione della geometria per ogni feature. Le opzioni sono XYZ (campi che rappresentano i valori X, Y e opzionalmente Z - XYZ è applicabile solo ai punti), WKT (testo ben noto), WKB (binario ben noto), GeoJson, EsriJson e EsriShape. Questa opzione è mostrata solo se la geometria non è pari a nessuna. | Modificabile | Non disponibile, l'opzione non viene visualizzata. | Modificabile | Modificabile |
Campi di geometria | Si usa per specificare quali campi rappresentano le geometrie. In alcuni casi, il campo deve essere un tipo di campo specifico. I formati WKB e EsriShape richiedono un campo binario, mentre GeoJSON e EsriJSON richiedono un campo stringa. I campi XYZ devono essere numerici. Questa opzione è mostrata solo se la geometria non è pari a nessuna. | Modificabile | Non disponibile, l'opzione non viene visualizzata. | Modificabile | Modificabile |
Ora
La sezione del tempo descrive il modo in cui viene rappresentato il tempo. Nella seguente tabella vengono descritte le opzioni disponibili, con note per le modifiche che è possibile apportare in base al tipo di dataset di input. Le opzioni di tempo sono le stesse per tutti i tipi di dati, salvo dove esplicitamente menzionato.
Parametri di tempo
Parametro | Descrizione | Esempio |
---|---|---|
Tipo di tempo: | Tipo di tempo di input. Le opzioni sono Istante (un singolo momento nel tempo), Intervallo (un intervallo di tempo con ora di inizio e fine) e Nessuno. | Istante |
Campi di tempo, campi di tempo iniziale e campo di tempo finale | Se selezioni un Istante, vedrai i campi Tempo. Se selezioni Intervallo, vedrai i campi Ora di inizio e Ora di fine. Queste opzioni specificano i campi e la formattazione usati per definire il tempo nei vostri dati di input. Il tempo può usare uno o più campi per definire il tempo, nonché uno o più formati per un singolo campo. Per impostazione predefinita, il primo campo con il nome time sarà usato come campo del tempo, con una stima del formato del tempo. Se c'è uno shapefile, verrà utilizzato il primo campo di tipo data. Almeno una riga deve essere popolata per queste tabelle. Vedi Formati temporali per saperne di più sulla formattazione. La tabella di formattazione del tempo è disponibile solo se Tipo di tempo non è Nessuno. | Esempio con un singolo campo utilizzato per rappresentare il tempo in due formati differenti:
Esempio con due campi usati per rappresentare il tempo:
|
Fuso orario | Fuso orario del tempo di input. Questa opzione è disponibile solo se Tipo di tempo non è Nessuno. L'impostazione predefinita è UTC. | UTC |
Formati ora
La seguente tabella mostra come rappresentare la formattazione del tempo. Tutti gli esempi mostrano come rappresentare il tempo 2 gennaio 2016, alle 9:45:02.05 PM.
Formati di tempo in condivisioni file Big Data
Formato | Significato | Esempio |
---|---|---|
yy | L'anno, rappresentato da due cifre. | 16 |
yyyy | L'anno, rappresentato da quattro cifre. | 2016 |
MM | Il mese, rappresentato numericamente. | 01 o 1 |
MMM | Il mese, rappresentato utilizzando tre lettere. | Jan |
MMMM | Il mese, rappresentato utilizzando l'ortografia completa. | January |
dd | Il giorno. | 02 o 2 |
HH | L'ora, utilizzando un giorno di 24 ore, intervallo di valori da 0 a 23. | 21 |
hh | L’ora, utilizzando un giorno di 12 ore; intervallo di valori da 1 a 12. | 9 |
mm | I minuti, intervallo di valori da 0 a 59. | 45 |
ss | I secondi, intervallo di valori da 0 a 59. | 02 |
SSS | I millisecondi, intervallo di valori da 0 a 999. | 50 |
a | Marcatore AM/PM. | PM |
epoch_millis | Tempo in millisecondi da Epoch. | 1509581781000 |
epoch_seconds | Tempo in secondi da Epoch. | 1509747601 |
Z | Offset del fuso orario espresso in ore. | -0100 o -01:00 |
ZZZ | Offset del fuso orario espresso in ID. | America/Los_Angeles |
'' | Usare le virgolette singole per aggiungere del testo che non rappresenta un valore delineato in questa tabella. | 'T' |
Nella seguente tabella vengono descritti esempi per formati diversi della stessa data: 02 gennaio 2016 alle 21:45:02.05:
Esempi di formato di tempo
Data di input | Formato |
---|---|
01/02/2016 9:45:02PM | MM/gg/aaaa hh:mm:ssa |
Jan02-16 21:45:02 | MMMgg-aa HH:mm:ss |
January 02 2016 9:45:02.050PM | MMMM gg aaaa hh:mm:ss.SSSa |
01/02/2017T9:45:14:05-0000 | MM/gg/aaaa'T'HH:mm:ssZ |
File
La sezione file delinea il formato dei dati. I dati possono essere in uno dei seguenti formati:
- Shapefile (.shp)
- File delimitato (ad esempio, .csv)
- File parquet
- File ORC
I parametri disponibili variano in base al dataset. Per shapefile, file ORC e parquet, l'unico parametro è il tipo di file, che non è modificabile. Se il dataset di input è un file delimitato, sarà possibile modificare più parametri. Per modificare i valori per un file delimitato, usare un file dei suggerimenti e rigenerare il file Manifest. Questi sono descritti nella seguente tabella:
Formati dataset
Parametro | Descrizione |
---|---|
Estensione file | Elenca l'estensione del tipo di file sul dataset di input. Formati comuni sono .csv e .txt. |
Delimitatore campo | Determina il delimitatore per ogni campo. Formati comuni sono , e ;. |
Terminazione record | Determina la terminazione per ciascuna riga di dati. Formati comuni sono \n e \t. |
Citazione del carattere | Determina il carattere utilizzato per le virgolette. |
Contiene intestazione riga | Un valore booleano che determina se la tabella di input include una riga d'intestazione. Se è inclusa un'intestazione riga, le intestazioni verranno utilizzate per i nomi di campo. L'informazione sul nome di campo prevede i campi geometria e tempo. |
Codifica | Tipo di codifica utilizzata sul file. Per impostazione predefinita, sarà UTF-8. |
Parametri di modifica del modello di output della condivisione file Big Data
L'editor del modello di output di condivisione di file di grandi dati comprende le seguenti tre sezioni:
- Nome e tipo di file
- Formattazione della geometria
- Formattazione dell'orario
Nota:
Le condivisioni di file Big Data di input presentano una sezione campi. I modelli di output non presentano una sezione campi, dal momento che i campi risultanti sono determinati dal GeoAnalytics Tools che crea il risultato. ORC supporta solo nomi di campi composti da lettere dell’alfabeto latino di base e caratteri numerici. Tutti gli altri caratteri nel nome di un campo sono sostituiti da un underscore.
Formati geometria di output
La sezione geometria elenca come vuoi che sia formattata la geometria di uscita per ogni tipo di geometria (punto, linea, poligono). Esistono due parti che determinano la geometria di output:
- Il riferimento spaziale - Puoi lasciarlo vuoto, e usa i risultati dello strumento ( predefinito). Facoltativamente, fornire una stringa WKID o WKT, e tutti i risultati sono proiettati a quel riferimento spaziale. Questo valore è condiviso tra tutte le geometrie di output.
- Il tipo di formattazione della geometria e i campi: questo è descritto più in dettaglio qui sotto.
Formati geometria di output
Tipo Geometria | Campi di output | File delimitati | Shapefile | File ORC | File parquet |
---|---|---|---|---|---|
XYZ: un campo X, Y e opzionalmente Z. Questa opzione è disponibile solo per i punti. | Per impostazione predefinita, saranno creati tre campi nuovi denominati X, Y e Z. In via opzionale, è possibile cambiare tali nomi dei campi. | ||||
WKT | Per impostazione predefinita, sarà creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
GeoJSON | Per impostazione predefinita, sarà creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
EsriJSON | Per impostazione predefinita, sarà creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
WKB | Per impostazione predefinita, sarà creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. | ||||
EsriShape | Per impostazione predefinita, sarà creato un campo nuovo denominato Geometry. In via opzionale, è possibile cambiare i nomi dei campi di output. |
Formati di tempo di uscita
La sezione del tempo descrive il modo in cui viene rappresentato il tempo di output. La formattazione del tempo richiede le seguenti informazioni:
- Formattazione sia per istanti sia per intervalli.
- I nomi dei campi in cui sarà scritto il tempo.
- Il formato (Stringa o Data) di scrittura del tempo. I file delimitati possono essere formattati solo con stringa.
- Per gli intervalli, quali campi rappresentano l'ora di inizio e di fine.
La formattazione del tempo è la stessa di quella per i file Big Data di input. Vedere Formati temporali nelle condivisioni di file di big data.
Formato del set di dati in uscita
La sezione del formato dei dataset delinea il formato di output con cui saranno scritti i dati. I dati possono essere in uno dei seguenti formati:
- Shapefile (.shp)
- File delimitato (ad esempio, .csv)
- File parquet
- File ORC
I parametri disponibili variano in base al dataset. Per shapefile, file ORC e parquet, l'unico parametro è il tipo di file, che non è modificabile. Se il set di dati è un file delimitato, ci saranno più parametri che possono essere modificati in ArcGIS Server Manager. Questi sono descritti nella seguente tabella:
Formati dataset
Parametro | Descrizione |
---|---|
Estensione file | Le estensioni non sono mai applicate a un set di dati in uscita. |
Delimitatore campo | Determina il delimitatore per ogni campo. Formati comuni sono , e ;. |
Terminazione record | Non è possibile impostare la terminazione per ciascuna riga di dati. Per Windows, il terminatore è \r\n. Per Linux, è \n. |
Citazione del carattere | Determina il carattere utilizzato per le virgolette. |
Contiene intestazione riga | Un valore booleano che determina se la tabella di output includerà una riga di intestazione contenente i nomi dei campi. Per impostazione predefinita, è true. |
Codifica | Sarà sempre UTF-8. |