Los usos compartidos de archivos de Big Data se registran como un data store mediante ArcGIS Server Manager, y requieren un manifiesto en el que se describa el esquema de los datos y los campos que representan la geometría y el tiempo en un dataset. El manifiesto se genera automáticamente al registrar el uso compartido de un archivo de Big Data. Puede que necesite realizar modificaciones si se produce algún cambio en los datos o si la generación del manifiesto no pudo determinar toda la información necesaria (por ejemplo, el manifiesto generado automáticamente no seleccionó el campo correcto para la geometría o el tiempo).
Puede ver y editar la información de los datasets y manifiestos a través de ArcGIS Server Manager. El visor del manifiesto se compone de los tres componentes siguientes:
- Selector de dataset
- Información sobre el dataset seleccionado
- Información sobre el campo en el dataset seleccionado
También existen opciones avanzadas en el editor de manifiestos de uso compartido de archivo de big data. Se tratan en la siguiente sección Opciones avanzadas. Se recomienda usar un archivo de sugerencias antes de editar los datos si la generación del manifiesto no ha determinado correctamente los nombres de campo, la codificación, los delimitadores de campo o los caracteres de comillas.
Selector de dataset
Un manifiesto está compuesto de uno o más datasets. La cantidad de datasets depende de la cantidad de carpetas que contenga la ubicación del archivo compartido de Big Data. Cuando abre el administrador de manifiestos, puede ver los datasets que se han registrado correctamente en el archivo compartido de Big Data. Cuando selecciona un dataset del menú desplegable, los parámetros del dataset se llenarán con la información del dataset.
Si esperaba encontrar más datasets en su manifiesto o bien falta alguno, realice lo siguiente:
- Verifique que ha registrado correctamente la carpeta de nivel superior. Para obtener más información, consulte Registrar un data store mediante ArcGIS Server Manager.
- Compruebe que el formato de los datos esté permitido como, por ejemplo, una captura de archivos o shapefiles delimitados.
- Asegúrese de que el esquema del dataset de entrada de interés sea coherente para una captura de archivos (todos los campos de una misma carpeta deben tener los mismos campos).
Dataset
El campo del dataset describe el formato del dataset seleccionado. Dependiendo de la fuente del dataset, que está representada por la extensión de archivo, existirán distintas opciones que puede cambiar. La extensión de archivo puede ser un shapefile (.shp) o un archivo delimitado (por ejemplo, .csv o .tsv). Si los archivos de entrada de un dataset son shapefiles, las siguientes opciones están disponibles:
Parámetro | Descripción |
---|---|
Extensión de archivo | Enumera la extensión del tipo de archivo en el dataset de entrada. Para un shapefile, esto siempre será shp y no se puede modificar. |
Geometría | Determina el tipo de geometría de un shapefile. Esto no se puede modificar para un dataset de shapefile. |
Referencia espacial (WKID/WKT) | Determina la referencia espacial de un shapefile. Esto no se puede modificar para un dataset de shapefile. |
Tiempo | El tipo de hora del dataset shapefile de entrada. Las opciones son las siguientes:
|
Zona horaria | Indica la zona horaria de los campos de hora. Si el tipo de hora es Instant o Interval, puede especificar la zona horaria. |
Si el dataset de entrada es un archivo delimitado, existirán varios parámetros que se pueden modificar en el manifiesto en Manager. Estos parámetros se describen en la siguiente tabla:
Parámetro | Descripción |
---|---|
Extensión de archivo | Enumera la extensión del tipo de archivo en el dataset de entrada. Los formatos comunes son .csv y .txt. Esta información se puede incluir en el archivo de sugerencias. |
Delimitador de campo | Determina el delimitador de cada campo. Los formatos comunes son , y ;. Esta información se puede incluir en el archivo de sugerencias. |
Finalizador de registro | Determina el finalizador de cada fila de datos. Los formatos comunes son \n y \t. Esta información se puede incluir en el archivo de sugerencias. |
Tiene fila de encabezado | Valor booleano que determina si la tabla de entrada incluía una fila de encabezado. Si se incluye una fila de encabezado, los encabezados se usarán para los nombres de campo. La información del nombre de campo está prediciendo campos de geometría y de hora. Los encabezados se pueden establecer usando el archivo de sugerencias. |
Geometría | Determina el tipo de geometría de un dataset de entrada. Las opciones son las siguientes:
El tipo de geometría se puede modificar y los campos y el formato que representan la geometría se establecen en la sección campos. |
Referencia espacial (WKID/WKT) | Determina la referencia espacial de un dataset. Esto se puede modificar en una cadena de caracteres WKID o WKT. |
Tiempo | El tipo de hora del dataset de entrada. Las opciones son las siguientes:
|
Zona horaria | Indica la zona horaria de los campos de hora. Si el tipo de hora es Instant o Interval, puede especificar la zona horaria. |
Campos
La ficha Campos muestra todos los campos de un dataset. Cuando seleccione un campo podrá ver lo siguiente:
- El nombre del campo.
- El tipo de campo.
- Si el campo contiene algún atributo temporal o relacionado con la geometría. Si un campo contiene estos atributos, puede definir el formato.
Parámetro | Descripción |
---|---|
Nombre | El nombre del campo. Esto se puede modificar para los archivos delimitados. Se recomienda que lo modifique con la ayuda de un archivo de sugerencias para los datasets delimitados sin nombres de encabezado. No puede modificar el nombre de campo de un shapefile. |
Tipo | El tipo del campo. Esto se puede modificar para los archivos delimitados. No puede modificar el tipo de campo de un shapefile. |
Atributos relacionados con la geometría | Valor booleano que indica si este campo contiene información de geometría. Solo es aplicable a los archivos delimitados que tienen una geometría especificada. Si está seleccionado, un parámetro adicional estará disponible para establecer el formato de geometría. |
Formato (geometría) | El formato del campo de geometría. |
Atributos relacionados con la hora | Valor booleano que indica si este campo contiene información temporal. Solo es aplicable a los archivos delimitados que tienen una hora especificada. Si está seleccionado, un parámetro adicional estará disponible para establecer el formato temporal. |
Formato (hora) | El formato del campo temporal. El formato temporal se describe a continuación. |
Rol | Los intervalos requieren que se establezca un rol a tiempo. El rol puede ser Start o End. Esta opción no se encuentra disponible para instants. |
Formatos de hora
En la tabla siguiente se describe cómo se representa la hora cuando se edita un archivo compartido de big data a través de ArcGIS Server Manager o directamente en un manifiesto. Los ejemplos muestran cómo se representa la hora 9:45:02.05 PM del 2 de enero de 2016.
Símbolo | Significado | Ejemplo |
---|---|---|
aa | El año, representado por dos dígitos. | 16 |
yyyy | El año, representado por cuatro dígitos. | 2016 |
Milímetro(s) | El mes, representado numéricamente. | 01 o 1 |
MMM | El mes, representado con tres letras. | Jan |
MMMM | El mes, representado con el nombre completo. | January |
dd | El día. | 02 o 2 |
HH | La hora usando un día de 24 horas, valores entre 0 y 23. | 21 |
hh | La hora usando un día de 12 horas, valores entre 1 y 12. | 9 |
mm | Los minutos, valores entre 0 y 59. | 45 |
ss | Los segundos, valores entre 0 y 59. | 02 |
SSS | Los milisegundos, valores entre 0 y 999. | 50 |
un/a | Marcador AM/PM. | PM |
En la siguiente tabla se describen ejemplos de distintos formatos de la misma fecha: 2 de enero de 2016 a las 9:45:02.05 PM:
Fecha de entrada | Formato de fecha |
---|---|
01/02/2016 9:45:02PM | MM/dd/aaaa hh:mm:ssa |
Ene02-16 21:45:02 | MMMdd-aa HH:mm:ss |
2 de enero 2016 9:45:02.050PM | MMMM dd aaaa hh:mm:ss.SSSa |
Avanzado
Las siguientes dos opciones avanzadas están disponibles en el editor de archivos compartidos de Big Data:
- Manifiesto: descarga y carga un manifiesto de archivos compartidos de Big Data.
- Sugerencia: descarga y carga un archivo de sugerencias para ayudar a generar un manifiesto de archivos compartidos de Big Data.
Las sugerencias le permiten ofrecer ayuda para la generación del manifiesto con parámetros de archivo delimitados, como puedan ser nombres de campo, la codificación, los delimitadores de campo y los caracteres de comillas. Es aconsejable subir un archivo de sugerencias antes de editar datasets individuales si:
- Tiene un CSV sin encabezados y desea aplicar nombres de campo a los datos.
- Los caracteres de comillas y delimitadores no se han reconocido cuando el manifiesto se creó por primera vez.
- La codificación del dataset no se ha reconocido.
Si carga un archivo de sugerencias, debe volver a generar el manifiesto. Solo se actualizarán los datasets con sugerencias proporcionadas o los nuevos datasets, y los cambios efectuados en otros datasets que no pertenecen al archivo de sugerencias se mantendrán intactos. Para obtener más información sobre los archivos de sugerencias, consulte Comprender el archivo de sugerencias. También puede descargar y cambiar el manifiesto en un editor de texto. Si carga un manifiesto, se sobrescribirán los cambios que ha realizado al manifiesto del archivo de datos compartido en el editor y el manifiesto actual se reemplazará. Para obtener más información sobre manifiestos de archivos compartidos de Big Data, consulte Comprender el manifiesto de archivos compartidos de Big Data.
Editar un archivo compartido de Big Data
Una vez que haya registrado un archivo compartido de big data, puede ver y editar los atributos y parámetros de los datasets registrados de ese elemento abriendo el editor de manifiestos de archivos compartidos de big data.
Por ejemplo, puede que desee verificar la cantidad de datasets que hay dentro de un archivo compartido registrado. Si al hacerlo no ve en el archivo compartido registrado la cantidad de datasets que esperaba, debería comprobar si la ubicación registrada contiene datasets válidos.
Puede que también desee revisar los esquemas de dataset de un archivo compartido de Big Data registrado. Puede modificar el esquema de un dataset seleccionado actualizando la geometría, la definición de tiempo y los nombres de campo en el recurso de manifiesto asociado.
En la pestaña de opciones avanzadas del editor de manifiestos de archivos compartidos de Big Data, puede cargar un archivo de sugerencias para proporcionar información sobre un dataset, por ejemplo, la presencia o ausencia de una fila de encabezado, codificación, delimitador de campo o finalizador de registro. Al volver a generar el manifiesto después de cargar un archivo de sugerencias se utilizará la información proporcionada para generar el manifiesto.
Opcionalmente, puede descargar el manifiesto, editarlo y cargar el archivo de manifiesto editado.
Editar datasets de archivos compartidos de Big Data
En el editor de manifiestos de archivos compartidos de Big Data, puede ver un archivo compartido de Big Data seleccionado y los datasets que se han registrado correctamente en él. Cuando selecciona un dataset en el menú desplegable del editor, se rellenan los parámetros correspondientes. Para obtener más información sobre cada una de las opciones de este cuadro de diálogo, consulte acerca del manifiesto de archivos compartidos de Big Data. Para editar los parámetros del dataset, haga lo siguiente:
- En el cuadro de diálogo Data Stores registrados, localice el archivo compartido de Big Data que desea editar.
- Haga clic en el Lápiz de editar para ver los detalles y las opciones para los datasets correspondientes.
- Haga clic en la pestaña Datasets para ver los datasets registrados y sus parámetros correspondientes.
- Seleccione un dataset en el menú desplegable para ver la información representada en su manifiesto. Puede pasar el cursor por encima del icono de información situado junto a las propiedades Geometría y Tiempo para ver ajustes detallados sobre el dataset seleccionado. Realice las actualizaciones que necesite en las propiedades del dataset.
En la sección siguiente se incluyen casos de ejemplo para editar ajustes detallados de un dataset de archivos compartidos de Big Data registrado.
- Cuando haya terminado de editar las propiedades del dataset, haga clic en Guardar.
Flujos de trabajo de ejemplo para editar datasets de archivos compartidos de Big Data
Los flujos de trabajo de ejemplo siguientes se pueden llevar a cabo en el editor de manifiestos de archivos compartidos de Big Data.
- Actualice el tipo de geometría y el conjunto de campos de un dataset de .csv.
- En el cuadro de diálogo Data Stores registrados, localice el archivo compartido de Big Data que desea editar.
- Haga clic en el Lápiz de editar para ver los detalles y las opciones para los datasets correspondientes.
- En la pestaña Datasets, seleccione un dataset en el menú desplegable.
- Pase el cursor por encima del icono de información de Geometría para ver una descripción detallada de los atributos.
- Para quitar los campos de Geometría existentes seleccione cada uno de los campos en la sección Campos y desactive la casilla Este campo contiene: atributos relacionados de geometría. Haga clic en Guardar.
- Haga clic en el botón desplegable del tipo de Geometría y seleccione el tipo que desee.
- Especifique la Referencia espacial para la geometría y el Id. conocido (WKID) o el texto conocido (WKT). Para ver una lista de las entradas de WKID y WKT admitidas, consulte el tema Referencia espacial en la documentación de la API REST de ArcGIS.
- En la sección Campos, seleccione el campo que desee, active la casilla Este campo contiene: atributos relacionados de geometría y especifique el formato (indique si el campo representa un valor X o Y de una definición de geometría de PUNTO o personalizada).
- Repita el paso anterior para otros campos según sea necesario.
- Haga clic en Guardar.
- Actualice la referencia de tiempo para un dataset de archivos shapefile.
- En el cuadro de diálogo Data Stores registrados, localice el archivo compartido de Big Data que desea editar.
- Haga clic en el Lápiz de editar para ver los detalles y las opciones para los datasets correspondientes.
- En la pestaña Datasets, seleccione un dataset en el menú desplegable.
- Pase el cursor por encima del icono de información de Tiempo para ver una descripción detallada de los atributos.
- Para quitar los campos de Tiempo existentes seleccione cada uno de los campos en la sección Campos y desactive la casilla Este campo contiene: atributos relacionados de tiempo. Haga clic en Guardar.
- Haga clic en el botón desplegable de Tiempo y seleccione el tipo que desee (Instante o Intervalo).
- Especifique la Zona horaria para el dataset. El valor predeterminado es UTC. El valor de zona horaria debe especificarse tal cual aparece en la columna TZ que se muestra aquí.
- En la sección Campos, seleccione el campo de tiempo que desee, active la casilla Este campo contiene: atributos relacionados de tiempo y especifique el formato de tiempo y el rol, si procede.
- Repita el paso anterior para otros campos según sea necesario.
- Haga clic en Guardar.
- Cambie el nombre o tipo de campo de un dataset de .csv.
- En el cuadro de diálogo Data Stores registrados, localice el archivo compartido de Big Data que desea editar.
- Haga clic en el Lápiz de editar para ver los detalles y las opciones para los datasets correspondientes.
- En la pestaña Datasets, seleccione un dataset en el menú desplegable.
- En la sección Campos, utilice el menú desplegable para seleccionar el campo que desee.
- Una vez seleccionado el campo que desee, introduzca el nuevo nombre de campo en el cuadro de diálogo Nombre o utilice el menú desplegable para seleccionar otro Tipo.
- Haga clic en Guardar.
Sugerencia:
Para ver flujos de trabajo avanzados como, por ejemplo, especificar otro delimitador de campos, un finalizador de registros o modificar varios nombres de campos, cargue un nuevo archivo de sugerencias con las reglas que desee y vuelva a generar el manifiesto.
Editar un archivo de manifiesto de archivos compartidos de Big Data o un archivo de sugerencias
En la pestaña Opciones avanzadas del editor de archivos compartidos de Big Data, puede editar el archivo de manifiesto o el archivo de sugerencias asociado eligiendo la pestaña correspondiente. Si carga un manifiesto, se sobrescribirán los cambios que ha realizado al manifiesto del archivo de datos compartido en el editor y el manifiesto actual se reemplazará. Para obtener más información, consulte Comprender un manifiesto de archivos compartidos de Big Data. Para editar un archivo de manifiesto de archivos compartidos de Big Data o un archivo de sugerencias, haga lo siguiente:
- En el cuadro de diálogo Data Stores registrados, localice el archivo compartido de Big Data que desea modificar.
- Haga clic en el Lápiz de editar para ver las opciones para modificar el recurso del manifiesto.
- Haga clic en la pestaña Opciones avanzadas.
- En la pestaña Opciones avanzadas, elija la pestaña Manifiesto o Sugerencias, dependiendo de lo que vaya a modificar.
- Para descargar el archivo de manifiesto, haga clic en Manifiesto > Descargar.
- Para descargar el archivo de sugerencias, haga clic en Sugerencias > Descargar.
- Utilice un editor de texto para modificar y guardar los cambios localmente en el.json archivo de manifiesto o .dat archivo de sugerencias descargado.
Sugerencia:
El formato de archivo predeterminado para el archivo de sugerencias es .dat. Una vez que haya descargado el archivo, puede cambiarle la extensión a .txt y editar el archivo. - Para cargar un archivo editado, haga clic en el Lápiz de editar correspondiente al archivo compartido de Big Data que desee modificar.
- Para editar el manifiesto, haga clic en Opciones avanzadas > Manifiesto > Cargar y examine el archivo .json actualizado.
- Para editar el archivo de sugerencias, haga clic en Opciones avanzadas > Sugerencias > Cargar y examine el archivo .txt actualizado.
- Haga clic en Cargar.
Si carga un archivo de sugerencias, asegúrese de volver a generar el manifiesto.
Volver a generar el manifiesto para un archivo compartido de Big Data
Después de crear un archivo compartido de Big Data y de haber generado un manifiesto, se muestra un botón para volver a generar el manifiesto para cada entrada en el cuadro de diálogo Data Stores registrados.
Puede volver a generar un manifiesto si ha agregado datos nuevos o si ha cargado un archivo de sugerencias utilizando el recurso de edición. El archivo de sugerencias proporciona especificaciones que se utilizan cuando se vuelve a generar el manifiesto.